Ruined Foocus 1 – generování obrázků zdarma
Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.
Odkazy ke stažení:
Ruined Fooocus
Juggernaut XL
Animagine XL
Považujete se za experta na generování obrázků, nebo se chystáte vytvořit svou úplně první fotku pomocí generativní umělé inteligence? Nebo něco mezi tím? To je vlastně jedno, protože pracovat se Stable Diffusion může úplně každý. Tohle video vás provede jedním z uživatelských prostředí, které můžete nainstalovat na svůj počítač a zdarma, bez omezení a bez cenzury používat jak je vám libo. Návod má několik částí a začne od toho nejjednoduššího, co zvládne každý a bude se postupně dostávat k pokročilejším nastavením.
Jedinou podmínkou je, že váš počítač to zvládne hardwarově. Co to znamená?
Tady je tabulka, která vám napoví. Na Windows či Linuxu je ideální mít grafickou kartu Nvidia s minimálně 8 GB grafické paměti, také se to označuje jako VRAM. A množství systémové paměti by nemělo být menší než 8 GB. To je minimum, na kterém vás to asi nebude moc bavit, ale můžete to zkusit.
S grafikou od AMD jsou požadavky podobné, s upozorněním, že generování obrázků bude několikanásobně pomalejší. Bez moderní grafické karty můžete zkusit generovat s využitím jen vašeho procesoru, tam bude generování 17krát pomalejší.
Tahle tabulka je orientační, a je z prostředí Fooocus, ze kterého byl Ruined Fooocus odvozen, takže nemusí být přesná. Pokud nevíte, tak to prostě zkuste.
Fooocusů už existuje více druhů, jsou to forky původního Fooocusu. Já vám ukážu Ruined Fooocus, protože mi přijde nejzábavnější. Pokud už znáte jiná prostředí, jako Automatic 1111 nebo ComfyUI, tak tohle vám může přijít trochu úsměvné, ale… tohle prostředí je vytvořeno jako hybrid mezi Midjourney a Stable Diffusion, nebo jako první setkání se Stable Diffusion, pokud přecházíte z Midjourney, nebo prostě pro úplné začátečníky a ty, kteří se nechtějí nic složitého učit.
K instalaci na Windows si stáhněte zazipovaný soubor a rozbalte 7ZIPem. Není to klasická instalace, je to opravdu jen rozbalení archivu. Není nutné instalovat na obvyklý disk C:/, ale kdekoli se vám to hodí. Samotný program není datově příliš velký, ale budete chtít stahovat nějaké další checkpoint modely, takže já vám doporučím takových 30 GB volného místa na disku, kam budete instalovat. Vytvořené obrázky se vám taky budou automaticky ukládat do adresáře – složky s programem, myslete na to při výběru disku.
Složka, kam jste Ruined Fooocus rozbalili, obsahuje dvě další složky a soubor run.bat, tím se celá věc spouští. Samotný program vidíte běžet v příkazové řádce, a po nastartování si otevře jeden tab vašeho webového prohlížeče. Pro zavření programu je potřeba zavřít příkazový řádek, zavřením pouze okna nebo tabu prohlížeče se nic moc nestane. Tedy přijdete o poslední nastavení, ale program jede dál, obrázky se vytvářejí a ukládají na váš disk. Pokud si tedy okno prohlížeče zavřete omylem, stačí znovu otevřít nové, vložit do něj lokální adresu, kterou vidíte v příkazovém řádku http://127.0.0.1:7860/ a pokračovat v práci.
Při prvním spuštění se bude stahovat jednak 6.5 GB checkpoint SDXL, který se používá jako výchozí a pak další a další soubory.
Ve chvíli, kdy se vám samo otevře okno prohlížeče, je vše připraveno a můžete začít.
Výchozí prostředí je velmi jednoduché i pro ty, kteří něco takového vidí poprvé.
Do boxu s nápovědou „Type prompt here“ napište svůj první prompt a zmáčkněte tlačítko Generate.
První obrázek bude zase trvat déle, vydržte.
A tady to je. Jak si obrázek zvětšit nebo uložit? Můžete ho otevřít v novém tabu nebo okně vašeho prohlížeče, ukládat ho nemusíte, už je uložen. Najdete ho ve složce vašeho Ruined Fooocusu, v podsložce RuinedFooocus a další podsložce outputs.
Disk:\MůjRuinedFooocus\RuinedFooocus\outputs\
Tady se vám začnou vytvářet složky s datem generování, a v nich najdete vše, co se ten den vytvoří. Jméno souboru je timestamp, časová značka, od roku po sekundu vytvoření obrázku.
Zatrhnutím Hurt me plenty, Ubližuj mi pořádně, otevřete další nastavení.
Ano, tady začíná ta část, kde je potřeba používat hlavu, a některé z vás taková činnost může bolet.
První, co vás asi bude zajímat je nastavení poměru stran. Tady je to asi jasné, úplně dole je Custom…, nastavení vlastní velikosti.
Pod tím najdete nějaké přednastavené styly, můžete jich vybrat několik. Tlačítkem Send Style to prompt zobrazíte tu část, přidanou ve stylech i v textu promptu. Ale není to nutné dělat, jen pokud vás to zajímá.
Pod tím je slider nastavující počet obrázků. Já nastavím čtyři a rovnou budu zase generovat. Je také zatržený automatický negativní prompt, nemusíte nic vymýšlet, pokud nechcete.
A tady jsou čtyři hotové fotky mladé ženy se zrzavými vlasy a zelenýma očima, už uložené na mém disku.
Ty obrázky nejsou nic extra, ale… Na rozdíl od Midjourney, Adobe Firefly nebo DallE, Stable Diffusion má téměř neomezené možnosti změnit model, checkpoint.
Co to je, model? To je samotná podstata každého generátoru obrázků, je to soubor dat, ovlivňující výsledek, který dostanete. Model v tomto smyslu je třeba Midjourney verze 6, nebo verze Niji. U většiny komerčních programů, které obrázky generují, nemáte možnost model nijak ovlivnit, někdo ho vytvořil a vy ho používáte. V Adobe Firefly je něco, co vytrénovali v Adobe a tak to je, buď se vám to líbí, nebo ne.
Stable Diffusion vám dávám možnost volby. Použitím jiné “verze,” jiného checkpoint modelu, dostanete se stejným promptem úplně jiný výsledek. Některé modely jsou zaměřeny na realistické fotografie, jiné na anime nebo ilustrované obrázky. Ve světě Stable Diffusion takové modely trénují sami uživatelé, vy můžete taky a dávají je k dispozici často zdarma. Při prvním spuštění jste stahovali velký 6.5 GB soubor, který se jmenuje „sd_xl_base_1.0_0.9vae“ a má koncovku „safetensor.“ To je právě model, a proto je ten soubor tak velký. Se Stable Diffusion máte vždycky možnost si stáhnout libovolný existující model, který bude s daným nástrojem fungovat.
Ruined Fooocus pracuje s modely Stable Diffusion XL – SDXL. Jeden z webů, kde najdete tyto modely zdarma je civit.ai, já mám odtud model Juggernaut XL.
Můžete si odsud stáhnout jakýkoli jiný safetensor nebo checkpoint model, který je označený jako SDXL, tady v záhlaví. Pozor při hledání takových modelů, protože mnohé jsou trénovány tak, aby tvořily i obsah zcela necenzurovaný, ne každé XL v názvu znamená to co hledáte. Nebo možná znamená přesně to co hledáte.
Model uložte do RuinedFooocus/models/checkpoints/
Upravte nastavení podle toho, co se doporučuje u modelu, tady třeba počet kroků 35, guidance scale, CFG, jak moc se bude obrázek držet promptu 7…
A tyhle obrázky jsou výrazně lepší.
Pokud chcete tvořit třeba anime postavičky, jeden z nejlepších současných modelů je Animagine XL. Když se podíváte do popisu modelu, máte tady mnoho doporučení, jak přesně psát prompt, a jaká je licence pro použití generovaných obrázků.
Výsledky vypadají jinak, než s Juggernautem… ale když si přečtete, a hlavně dodržíte doporučení autorů, tak se dostanete úplně jinam… Jsou situace, kdy se ty instrukce opravdu vyplatí číst… Protože pak nemusíte brečet někde na sociálních sítích, že vám z toho nebo onoho nelezou obrázky, které tak hrozně nutně potřebujete. Se Stable Diffusion dostanete víceméně cokoli, co chcete, bez cenzury. Pokud to nedostáváte, pak buď používáte nevhodný model, nevhodné nastavení, nebo nepíšete prompt tak, jak je potřeba.
Tady ještě jedna drobná vychytávka. Když nastavíte počet generovaných obrázků na nulu, tak se bude generovat tak dlouho, dokud to manuálně nezastavíte. Hledáte-li svatý grál nebo ideální ženu, můžete to spustit a jít na kafe nebo si zdřímnout… Jen si předtím zkontrolujte, kolik máte volného místa na disku.
Další zajímavá funkce pro začátečníky i pokročilé dobrodruhy je One Button Prompt – prompt na jedno stisknutí. Můžete zmáčknout Instant OBP, instantní prompt jedním butonkem a okamžitě se vám začne generovat zcela náhodný prompt plný magických slov, kterým mnohdy nebudete ani rozumět. Já se některá z nich pokusím alespoň přečíst. Tady náhodně dostávám prompt:
fotka designovaná Anatolijem Metlanem, s váhou 0.8, scénické umění, malba, šíleně detailní, elektroluminiscentní segway, ultrarealistické, smutné, barokní umění, osvětlené měsícem, clona 5, psychedelické barvy. Prompt jako když pejsek s kočičkou vaří.
Zmáčknutím tlačítka Random Prompt se prompt napíše do boxu, ale nezačne se vykonávat. Když se vám nelíbí, zmáčkněte znovu pro nový.
Náhodný prompt taky můžete různě ladit, třeba si vybrat, že budete generovat jen zvířata, že budou ve stylu expresionismu a že to bude malba. Co se doopravdy vygeneruje… to je překvapení.
Samozřejmě i při náhodném promptu se berou v potaz nastavení z prvního tabu Settings.
Tady mám orla ve stylu Tamary, kterou neznám, malba, to je tak nějak v mých nastaveních, ošklivý orel bělohlavý, široký záběr, psytrance umění, expresivní tahy štětcem, svět konceptuálního umění.
No, je to orel.
V ještě o něco pokročilejších možnostech můžete třeba přepsat nějaký objekt, nebo oblečení, nebo přidat něco na začátek nebo konec promptu. Já přidávám na začátek promptu:
Zimní krajina se spoustou sněhu. Každý následující prompt takto začne a pak se doplní náhodnými slovy.
Další se vylosoval do zimní krajinky tukan, neinspirovaný, na jednobarevném pozadí, v kouři, s mnoho detaily, focený na Kodak Portra, to je typ filmu, který pejsek s kočičkou přihodili tentokrát.
A do třetice… Kočička, angorská, a zbytek toho promptu v řeči lidí příliš nedává smysl, ale v řeči strojů z toho vyleze bílá kočka na sněhu.
Mně osobně z toho opět vyplývá ponaučení, že příliš mnoho magie a cizích termitů v promptu skýtá velké rizoto, že to skončí fiatem. Nebo angorskou kočkou.
Přidávám na začátek promptu „rám z fialových kytek.“
Losuju si agresivní vydru v pyramidě v Peru, vydra má být smutná… vydra vypadá velmi mokrá. Nemějme to vydře za zlé.
Ještě jeden pokus, tentokrát zase orel…
A přesunu se k funkci, Evolve. To znamená Vývoj, a mělo by to nějakým způsobem měnit a vyvíjet vaše obrázky… Podle mě je to takový experiment, který se snad sám někam vyvine…
Zatím to funguje tak, že na záložce Power Up zmáčknete pod Evolve devítku, nebo nějaké jiné číslo. Vytvoří se devět různých promptů a ty vygenerují devět různých obrázků. Vy si pak zmáčknutím některého tlačítka s číslem vyberete, co se vám nejvíc líbí a na základě toho se z daného obrázku a vašich nastavení opět vytvoří nějaké variace na dané téma. Doporučuje se použít jeden stejný Seed pro celý proces, což tady teď nedělám, ale i s jedním Seedem z toho lezou natolik šílené věci, že já osobně netuším, k čemu je to dobré.
Tohle je první část návodu jak používat Ruined Fooocus pro úplné začátečníky, druhá část hned následuje a najdete v ní další rozšířená nastavení a ukázky funkcí – Inpainting, Upscale, Img2img, čtení metadat z obrázku, použití Lora nebo jiného Upscaleru, vlastních variací promptu ze souboru a další užitečné drobnosti.