Flux – jednoduše, lokálně, zdarma, bez učení
Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.
Flux hýbe uměleinteligentním světem, je ho plný Twitter, je ho plný YouTube, subreddit jménem StableDiffusion se klidně může přejmenovat na Flux…
Poslední novinkou je, že Grok 2, nová verze chatbota Elona Muska, integrovaná přímo do Twitteru, ode dneška generuje obrázky díky Fluxu. Přestože docela nedávno se spekulovalo o spolupráci s Midjourney. Ovšem pokud nebydlíte v Americe, Austrálii, na Novém Zélandu nebo v několika dalších obskurních zemích, nemusí vás to trápit, protože si to stejně nevyzkoušíte.
Flux je prostě všude a vy ho chcete taky. Ideálně u sebe na svém počítači, který lehce funí stářím a opotí se při každém složitějším úkolu. A samozřejmě na jeden dva kliky, bez učení se něčeho nového, na to není čas! A zadarmo.
Teda aspoň doufám, že přesně tohle chcete, protože přesně tohle najdete v tomto videu. Generování obrázků klikáním na čudlík i na počítači který má pouhé 4 GB VRAM.
A krom generování obrázků z promptu se taky dostaneme k img2img, tedy generování obrázku z obrázku, inpaintingu, a pár dalším trikům.
A hurá, vrháme se na Flux. První část bude o nástroji, který zatím funguje jen pro grafické karty nVidia, klidně i s pouhými 4 GB VRAM.
Pokud nVidia grafiku nemáte, nepřeskakujte tuhle část videa. Všechno se mění dvakrát denně, tohle omezení může být během pár dnů pryč. Navíc se připravíte o zásadní část návodu, kde uvidíte, co vše se už teď s Fluxem dá dělat.
Každý z těchto obrázků byl vygenerován někde mezi 10 a 14 sekundami na RTX 3060 s 12 GB VRAM. Jak ostatně vidíte dole pod hlášením o promptu. Tohle je open-source, tady vám neunikne jediné písmenko z toho, co dělám.
Kde si tenhle nástroj jednoduše, bez namáhání mozku stáhnout a používat. Jako vždycky, pinokio.computer. Jestli už snad Forge máte, nejdřív ho updatujte. Pro ty, kteří se do toho pouští poprvé, a nemají ani pinokio. Odskočte si do návodu na instalaci pinokio.computer, je to starší verze, ale instalace je stále stejná. Instalujte pinokio a Forge a vraťte se sem zpátky, až budete posláni zpátky.
Pro ty, kteří už pinokio mají, najděte si Forge a nainstalujte. Úspěšný update či instalace by měla končit tím, že tady vlevo vidíte modely, které si můžete stáhnout.
Flux1.dev je model, který je větší, obrázky z něj mohou být trochu kvalitnější, ale! Je určen pouze pro nekomerční účely, generování v něm zabere víc času, a máte-li méně VRAM, bude se jeden obrázek generovat třeba 4 minuty.
Já vám budu vše ukazovat s modelem Flux1-schnell-nf4. To nf4 znamená, že je to trochu jiný „formát“ modelu, je super rychlý, pojede svižně i na slabších grafikách a hlavně licence Fluxu.schnell říká, že jeho použití je povoleno i ke komerčním aktivitám.
Stahování bude trvat dlouho, model má přes 11.5 GB a je potřeba vydržet.
Po stažení se rovnou spustí Forge a… tohle je ono. Kdo zná A1111 nebo StableDiffusion WebUI, tak je jako doma. Všichni ostatní se se mnou rozkoukají, je to jednodušší, než to vypadá.
Chcete-li generovat v okně pinokia, klidně to zůstaňte, ale je zde i možnost „popout,“ otevření okna ve vašem prohlížeči.
Celé prostředí by se mělo otevřít v default hodnotách, které nemusíte nijak měnit.
Budeme měnit jen několik základních parametrů.
V prvním řádku nahoře vidíte výběr checkpointu, tedy modelu, to je to nejzásadnější. Já tu mám oba Fluxy, v y asi jen jeden a ten už bude vybrán.
Jsme na záložce Txt2img, budeme generovat obrázek z textového promptu.
Negativní prompt u Fluxu s nastavenou hodnotou CFG na 1 vůbec nefunguje, klidně na něj zapomeňte. A CFG nechte na 1.
Pro Flux.schnell nastavte počet kroků při generování na 4. Já tu mám 20, to je nastavení pro Flux1-dev-fp8.
Pak vás ještě bude zajímat velikost obrázku, já tu mám 1024px na šířku a 576px na výšky, to je formát 16:9.
Pokud víte, co při generování obrázků znamená Seed, tak hodnota -1 značí náhodnou volbu při každém novém generování. Jakýkoli jiný konkrétní Seed zadáte zde.
Vše ostatní nechte jak je a generujeme. Tím velkým oranžovým tlačítkem Generate.
Jakmile je obrázek hotový, vidíte pod ním celý jeho prompt, všechna použitá nastavení, včetně třeba Seedu. To vše je také uloženo v obrázku, pokud ho později otevřete ve stejném nebo podobném nástroji, z obrázku to zpětně přečtete.
Obrázek má v horním pravém rohu miniaturní tlačítko Download, ale vůbec se nemusíte namáhat. Obrázek už je teď uložen ve vaší složce na disku, tam kde máte nainstalováno pinokio. U mě je to třeba C:\pinokio\api\stable-diffusion-webui-forge.git\app\outputs
Dále se vše ukládá podle typu generování, a potom podle data.
A teď už umíte generovat obrázky lokálně, zdarma, soukromě, z Fluxu. Můžete je použít, jak se vám líbí. Jste o veliký krok napřed před většinou obyvatel téhle planety.
A jestli vás to příliš nevyčerpalo, můžeme se dostat k mnoha dalším funkcím a nastavením, které tohle prostředí má.
Nejdřív něco k velikosti Fluxem generovaných obrázků. Applaka na Redditu píše, že Black Forest Labs píše, že Flux vlastně podporuje obrázky až do velikosti 2 MP. A dodává k tomu tabulku velikostí obrázků, a já hned zkouším čtverec o velikosti 1448x1448px s promptem, který už znáte. Všem Slovikům se omlouvám za nepovedený pitel.
Budu generovat čtverec s FLUX pizzou. Trvá to déle, ale dostávám očekávaný výsledek.
Zkusím 21:9, největší možný obrázek 2176 x 960px… a nezkusím, Forge neumí víc než 2048 pixelů. I tak žádám o zakulacený středozemní ostrov s historickým městem a jednou věží, na dohled od hornatého pobřeží pokrytého lesy. Trvá to déle, ale dostávám velmi uvěřitelný ostrov, takový někde určitě existuje.
No a co tu máme dál? Představte si, že jste byli na dovolené v nějaké daleké exotické zemi, kde jste nikdy předtím nebyli, a chcete si z vašich fotek nebo videí udělat nějaké to umění a pověsit si ho na zeď.
Přesuňte se do tabu Img2img, a hoďte svůj obrázek na prázdného okna, které se pro větší přehlednost také jmenuje Img2img.
Nahoře vidíte okno promptu, nic nového. Hned můžete začít generovat.
Na čem nejvíc záleží je hodnota Denoising Strength. Čím je větší, tím větší rozdíl bude mezi vložený obrázkem a výsledkem. Hodnota 0 vyrobí kopii vloženého obrázku. Hodnota 1 vytvoří úplně nový obrázek zcela nepodobný vašemu obrázku. Nastavení této hodnoty je třeba vyladit podle toho, čeho chcete dosáhnout.
Další z tabů nabízí Inpaint. Hoďte sem obrázek, nastavte velikost štětce, a zamalujte vše, co chcete změnit. A možná to bude lepší zkoušet s už generovaným obrázkem. Do promptu píšete jen to, co se má přidat do vybrané části. Není to ideální, ale jako příklad je to jasné.
Tab PNG info. Hodím sem obrázek z Midjourney… a vidím veškeré informace, které jsou v obrázku uložené. Co když budu chtít něco podobného vytvořit tady ve Forge?
Prompt z Midjourney mi moc nepomůže, tohle je klasický styl Midjourney, navíc s mojí personalizací.
Přetáhnu obrázek do Img2img a použiju tady ten čudlík, Interrogate Clip. Ještě by ten čudlík mohl být asi tak dvakrát menší, s výrazně menší šedou pidikonkou na šedém čudlíku na šedém pozadí… aby to bylo pohodlnější.
Při prvním pokusu se budou stahovat další soubory, připravte se na to.
A dostávám popis obrázku, který můžu použít jako prompt. Je zajímavé, že se v promptu objevují dvě jména žijících umělců, přestože v originálním Midjourney promptu nic takového nebylo.
Gonzalese neznám, ale co vím tak Dan Mumford je velmi nerad, že se tohle děje a je velkým „nepřítelem“ umělé inteligence.
Prompt můžu použít, ale určitě ho budu ještě trochu ladit. Chybí tam barevnost a pohled zepředu.
Tohle vůbec není špatné, na druhý pokus.
Po několika pokusech dostávám tohohle snílka… dost dobrý.
Další malá tlačítka pod obrázkem posílají vygenerovaný obrázek do jiného tabu. Posílám si výsledek do tabu Extras. Tady najdu třeba Upscaler s několika už přednastavenými upscalery, vidíte, že už tu mám předchozí výsledek upscalovaného obrázku z Midjourney, Upscalování 4x trvalo celých 19 sekund.
Tenhle obrázek trval 9 sekund.
Tohle zdaleka nejsou jediné možnosti, jak pracovat s Forge, zatím vám toho hodně tajím, ale pro začátek to stačí. Jestli si netroufáte na ComfyUI, bojujete s ním a nebo vás něco tak složitého vůbec nezajímá, tak tohle je ideální.
Co když nemáte grafiku od nVidia?
I pro vás je tu řešení. Vytvořil ho před pár dny přímo autor pinokia, a jmenuje se Flux WebUI. Najdete ho v pinokio a nainstalujete obvyklým způsobem.
Celé prostředí je velmi jednoduché, jediné, co má asi smysl zmínit je výběr modelu. Funguje buď s menším Flux1-schnell, počet kroků je nastaven na 4. Obrázky jsou volně k použití k jakýmkoli účelům.
Druhý model je Flux.1-merged, vytvořený z modelu dev, počet kroků při generování má být nastaven na 8. Tímto modelem vygenerované obrázky by měly být vizuálně o něco kvalitnější, ale je dovoleno je použít pouze k nekomerčním aktivitám.
Jedinou nevýhodou tohoto nástroje je fakt, že budete potřebovat větší množství VRAM, 24 GB je asi rozumné minimum. Na mých 12GB VRAM se jeden obrázek generoval asi 3 až 4 minuty.
S větším množstvím VRAM se obrázky údajně generují stejně rychle jako v ComfyUI, což může být pouhých několik sekund.
Máte-li takovou grafiku, můžete vesele generovat v super jednoduchém prostředí. Já si ale myslím, že většina z vás Forge ocení a že těch pár minut objevování a učení se něčeho nového nepovažujete za ztracený čas.
S Fluxem se toho už dnes dá dělat daleko víc, každý den přibývají nové nástroje a modely, takže se o Fluxu budeme na tomhle kanále zase brzo bavit.