AI

Tady AI

Flux – nejlepší generátor obrázků zdarma

Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.

Svět se změnil. Jo, už zase. A my máme to štěstí, že u toho můžeme být a vidět to na vlastní oči.
1. srpna se narodila konkurence k Midjourney i Stable Diffusion modelům. Jmenuje se Flux, a můj odhad je, že změní náš způsob generování obrázků, tak jak jsme ho dosud znali. Alespoň na nějakou dobu.
Nejsem sice odborník na prognózy, ale za ten den a půl, kdy je Flux na světě, vzbudil docela pozdvižení. Alespoň v komunitě lidí, kteří se generativní AI zabývají.
A já to celé sleduju a v tomhle videu vám vysvětlím, co se stalo a proč je to významné. Video bude možná delší, ale vůbec se ho nebojte sledovat celé, i pokud jste úplní začátečníci. I když máte pocit, že jste „jen“ běžní uživatelé a nerozumíte generování obrázků do hloubky.
Tohle video vám napoví, jak funguje open-source komunita, kdy se na vývoji podílejí vlastně všichni, kteří takovou horkou novinku používají.
Ale nebojte se, začneme polehoučku a dostanete několik tipů, jak si vyzkoušet Flux bez instalace, bez placení, bez větších znalostí jakéhokoli programu, online a úplně nezávazně.
Pro pokročilejší ukážu, jak použít Flux v ComfyUI, i v případě že máte počítač s pouhými 8GB VRAM. Pokud nemáte ComfyUI, navedu vás, jak si ho nainstalovat v pinokio.computer, ke kterému už na mém kanále návod je.
I kdybyste měli použít ComfyUI úplně poprvé, zvládnete si vyzkoušet Flux na vlastním počítači, protože vše už pro vás někdo za ten den a půl připravil a já vám to teď naservíruju až na váš stůl u vás doma v obýváku.
Flux je text-to-image model, který překonal jak Stable Diffusion 3, tak i Dall-E 3 a Midjourney 6, a to jak ve vizuální kvalitě, tak v přesnosti dodržení promptu, možnosti používat různé poměry stran a různé styly výstupních obrázků.
Jestli stále tápete, co to vlastně ten „model“ je, tak to je velký soubor dat, výsledek tréninku strojů, které dokážou převést váš textový prompt do obrázku. Model je například nové Midjourney 6.1, které vám z jednoho promptu vytvoří obrázek o něco hezčí, než předchozí model Midjourney 6.0.

Proč je Flux tak převratný? Flux vytvořila společnost Black Forest Labs, Laboratoře Černého Lesa, Založeno lidmi, kteří původně založili a poté opustili StabilityAI, autory Stable Diffusion. Stable Diffusion byla původně myšlena jako open-source komunitní generativní umělá inteligence, vyvíjená pro lidi a lidmi. Jen se to letos trochu zvrtlo a poslední model Stable Diffusion 3 byl původně vydán s drakonickými podmínkami použití: Pokud byste používali model SD3, nebo jakýkoli model vytvořený na jeho základě, museli byste platit každý měsíc 20 USD. Ale, jakmile byste přestali platit, všechno, co jste kdy vytvořili, byste byli povinni smazat. Tedy, i vaši klienti by byli povinni smazat vše, co jste pro ně vytvořili. Obrázky použité ve vašem Youtube videu? Smazat. Vytvořili jste někomu logo nebo letáček? Smazat.
Takhle si nikdo komunitní a open-source vývoj nepředstavoval – uživatelé budou sami vytvářet modely založené na Stable Diffusion a společnost za to bude inkasovat peníze i od samotných tvůrců, a pokud nebudou platit, tak musí všechno smazat.
StabilityAI si za to vysloužila hodně kritiky, podmínky byly později změněny, ale obrázek o tom, kam Stable Diffusion míří, si už všichni udělali.

Flux byl vytvořen těmi, kteří chtějí, aby ten nejlepší existující model byl open-source. Flux vyšel ve třech verzích, já se budu nejvíc věnovat nejrychlejší verzi, FLUX.1 [schnell], která vyšla pod Apache licencí, tedy můžete ji použít zdarma i komerčně. Mimochodem, název schnell vám jistě napověděl, že Black Forest má sídlo v Německu.

Tak se rovnou vrhneme na generování obrázku, ne?
Flux se dá vyzkoušet na mnoha online platformách zdarma, já vám jich ukážu několik.
Doporučení od Forest Lab je fal.ai, tuhle platformu neznám, zkouším klavíristu z pohledu shora, je to prompt už použitý v Midjourney, protože, samozřejmě, že budu srovnávat!
Píše se tu něco o placení, nevím, obrázek to vytvořilo, smysluplnější než Midjourney, ale ne tak stylové. Poté mi přišel email, že nemám kredit a mám zaplatit. Tak asi pápá.

Replicate byl mezi prvními, kde se hned po vydání dal Flux vyzkoušet zdarma. Jen se sem musíte přihlásit s Github účtem a máte omezené množství nějakého kreditu, který se resetuje tuším měsíčně. Zkouším pár obrázků, opět, srovnávám s Midjourney. Psát česky to neumí, obrázky jsou velmi fotorealistické, pokud nepožádáte o něco jiného. Ale vypadá to skvěle. Připomeňme si, že tohle je první verze modelu, která vůbec vyšla. Tohle je první pokus o obrázek, nevybírám jen ty nejlepší výsledky, tohle dostanete na první pokus.

Mezitím se objevují další platformy, kde si můžete Flux vyzkoušet. Já vám doporučím Glif. Díky uživateli Skittleology si můžete vyzkoušet generování obrázků v několika různých poměrech stran.
Glif je zcela zdarma, zatím, a jediné omezení je, že máte pouhých 200 pokusů denně.
Vzhledem k tomu, že Midjourney má 200 pokusů měsíčně za 10 USD, asi si nebudeme stěžovat, že?
Zadávám pizza prompt pochopitelně v překlepštině, protože anglicky já moc neumím… Navíc je to celé nesmysl… ale ještě mám 199 dalších pokusů… A některé z nich jsou vážně hodně dobré. Obecně, to psaní textů dopadá lépe než v Midjourney, a to i v angličtině. S češtinou to má problém, ale až potkáte nějaký model, který s češtinou problém nemá, dejte mi vědět. Vážně, dejte mi vědět, který model umí česky bezchybně.
Ty prompty nejsou úplně perfektně provedené, ta písmenka v pizze měla být odlišná, nápis na zdi se nepovedl nikdy přesně… Ale ve srovnání s Midjourney je text přesnější. Midjourney je lepší ve stylovosti, jak vidíte, zkouším v novém Midjourney 6.1 i předchozí verzi 6.0, zkouším to s personalizací i bez ní… Midjourney má lepší styl, ale nedá se říct, že by Flux byl vyloženě horší. A znovu, srovnávám šestou verzi Midjourney po více než roce provozu s Fluxem.1, který vyšel před 24 hodinami. A podle názvu nástrojů to vypadá, že tohle je Flux [pro], tedy nejvyšší verze Fluxu, který je dostupný jen přes API.
Další možnost jak si vyzkoušet generování obrázků s Fluxem online a bez omezení je na serveru Deforum na Discordu. V oznámeních vidíte, že i tvůrci tohoto nástroje, což je nástroj na vytváření zajímavých prolínacích videí z obrázků, jsou z Fluxu nadšeni, Deforum se ho bude snažit integrovat, a prozatím si na jejich serveru můžete generovat obrázky. Buď v kanále image-bot, což je veřejně viditelné, nebo si můžete bota přidat na svůj server a generovat si soukromě.
Obě tyto možnosti jsou v tuto chvíli asi nejlepší způsob, jak si vyzkoušet Flux. Obrázky si můžete stáhnout a používat na cokoli, protože i takto použitý Flux je open-source.

Co když chcete generovat v soukromí a klidu svého počítače? A nebojíte se si něco nainstalovat?
Ideální je použít ComfyUI. Pokud vůbec nevíte, co to je, já vám ve zkratce popíšu postup, jak se od nuly dostanete k vygenerovanému obrázku.
Nejdřív vás budu varovat. Potřebujete k tomu výkonnou grafickou kartu. Původní verze ohlášená Black Forest Lab byla, že je nutné mít 32GB nebo alespoň 24 GB grafické paměti.
Nicméně, to je stará informace, generování obrázku funguje i na 12GB VRAM, to mám osobně vyzkoušeno a podle uživatelů na Twitteru funguje i na 8GB VRAM, jen tedy jeden obrázek trvá minutu. Mně na mých 12GB VRAM trval jeden obrázek méně než 20 sekund.
Což je rychlejší než většina online platforem, zatím.
Další varování bude vaše místo na disku. Chcete-li si instalovat ComfyUI poprvé, bude to přes pinokio.computer, ten bude potřebovat několik GB vašeho disku, samotný Flux pak asi 40 GB. Ano, 40 GB, protože samotný Flux [schnell] má více než 23 GB.
Jestli ještě nemáte pinokio.computer, teď nastane správný čas přeskočit do mého videa jak si nainstalovat pinokio. Už existuje nové pinokio verze 2, vypadá to trošku jinak než verze 1.3, ale zvládnete to i se starým videem. Přeskočte teď a vraťte se sem.
Já osobně nemám ComfyUI v pinokio, ale coctail peanut, autor pinokia, byl jako vždy rychlý a možnost instalace Fluxu do pinokia přidal.
Taky vám neukážu instalaci Fluxu v pinokiu, ale na Twitteru je pěkný obrázkový návod.
Máte-li pinokio nainstalované, nemusíte upgradovat na verzi 2. Nemáte-li ComfyUI, nainstalujte ComfyUI, do kterého se rovnou instaluje Flux, vyberte Flux [schnell]
Máte-li ComfyUI v pinokio, updatujte ho a měla by se vám objevit možnost instalace Fluxu.

Máte-li ComfyUI nainstalované nějak jinak, třeba jako portable, nebo klasickou standalone verzi, budete si muset stáhnout soubory z Hugging Face. Nejdřív ale updatujte celé ComfyUI, restartujte a pak si stáhněte soubory a zmáčkněte Refresh. Odkazy na ně najdete v mém workflow v komentářích úplně nalevo, a odkazy jsou také dole v popisku videa. Předpokládám, že jako uživatelé ComfyUI víte, co to znamená si stáhnout model. Kam ho máte uložit je také v komentáři ve workflow. Pozor, samotný model se neukládá do /checkpoints složky , ale do složky /unet. Nepotřebujete stahovat oba soubory t5xxl, stačí vám jen jeden. V případě, že máte méně VRAM než 24 GB, stáhněte ten menší, tedy t5xxl-fp8.

Na Twitteru se objevilo workflow pro 12GB VRAM, autorem je Inner-Reflections, člověk, který vytváří různá workflow a píše návody na animace videí v ComfyUI. Mně to přišlo jako hrozný zmatek, takže v průběhu 40 minutového čekání, než se stáhne Flux, mi přišlo užitečné vzít smetáček a lopatku a trochu uklidit. Přerovnat, přebarvit, seskupit vše, co musíte sami nastavit do levé skupiny Input a opatřit komentářem.

Tohle mnou upravené workflow je na CivitAI ke stažení, a na tomhle workflow budu ukazovat všechny generované obrázky v ComfyUI. Odkaz je dole v popisu.

Pokud vidíte ComfyUI poprvé a vyděsili jste se k smrti, co to proboha je… tak se vydýchejte, já vás vezmu za ruku… nebo spíš za ucho a za oko, a ukážu vám, jak z toho vyždímáte obrázek, aniž byste si usmažili půlku mozku.
Pro ty dosud ComfyUI nepolíbené jedno vysvětlení.
Workflow je ukryto v obrázku. Tedy, obrázek je workflow. Slovo workflow označuje tu změť boxíků propojených nudlemi mezi sebou, ten chaos, co vás děsí. Protože to je předpis na to, jak něco vytvořit.
Workflow v ComfyUI otevřete nejlépe přetažením souboru na plochu ComfyUI, můžete to být JSON soubor, nebo obrázek, v mém případě je to PNG. Ano, ten obrázek, kde je na zdi napsáno „FLUX IS FANTASTIC“ je workflow, hoďte ho tady někam do ComfyUI a otevře se vám celé workflow přesně tak, jak fungovalo u mě.
Nemusíte s ničím hýbat, ale možná budete potřebovat změnit některé hodnoty, a to i v případě, že vám pinokio nainstalovalo celé ComfyUI i s Fluxem.

V levé části vidíte modrý rámeček Input, v něm jsou nodes, uzly, a v nich jsou hodnoty, které budete muset měnit.
V prvním fialovém uzlu, DualCLIPLoader je první hodnota soubor, který začíná t5xxl. Tyhle soubory jsou dva, ten co pokračuje t5xxl-fp8 je ten menší, rychlejší, asi chcete použít nejdřív ten. Klikněte na jeho jméno a máte-li stažený ten druhý soubor, t5xxl-fp16, můžete zkusit i tento, ale generování obrázku bude trvat déle.
V zeleném rámečku je prompt, ten zadat musíte. Na glifu byly i prompty v jiných jazycích, než angličtina, ale netuším, jeslti Flux umí češtinu. Asi spíš ne. Mluvte na něj anglicky.
Ostatní fialové uzly by měly mít nastaveny soubory, které vidíte tady ve videu.

Další hodnota, kterou možná chcete změnit, je Seed. Default je Randomize, ale pokud se vám něco líbí a chcete generovat se stejným seedem, nastavte Fixed.

A poslední je velikost obrázku, vidíte, že výchozí je 1024×576 px , což je poměr 16:9. Flux umí také 4:3, obojí na výšku i na šířku a 1:1, ideální je maximální velikost strany 1024 px.
Ostatní hodnoty můžete nechat jak jsou.
Klávesami Ctrl+Enter nebo kliknutím na Queue Prompt spustíte celou mašinérii do chodu, vidíte zelené lišty nahoře v okně.
A gratulace těm, pro které je to jejich první obrázek v ComfyUI. Vážně to nekouše!
A teď už víte, že můžete zůstat i nadále nepolíbení nějakým vytvářením workflow, protože všude okolo jsou dobráci, co vám nachystají a nasdílí obrázek, a vy si můžete jen měnit prompt a poměr stran.

Já nepochybuju o tom, že zatímco dávám dohromady tohle video, se objevilo mnoho dalších vylepšení. Už se mi podařilo zahlédnout u někoho obrázky inpaintingu s Fluxem a někde proběhlo nějaké workflow pro image-to-image pro Flux. Controlnet a animace budou určitě následovat. Použít obrázky z Fluxu s už existujícími upscalery nebo nástroji na generativní video vám taky nic nebrání.
A sami autoři Fluxu nás už teď lákají na jejich plánovaný příští krok, bombastický text-to-video model, tedy video vytvořené z vašeho textového promptu. Open-source, tedy zdarma a k jakémukoli použití. Generované na vašem běžném domácím počítači v soukromí vašeho domova.
Už jste se přihlásili k odběru, protože nechcete, aby vám to uteklo, že jo?

https://fal.ai/models/fal-ai/flux
https://glif.app/@Skittleology
https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell