AI

Tady AI

LeonardoAI – kompletní průvodce pro začátečníky 1.

Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.

LeonardoAI je jeden z nástrojů, které využívají Stable Diffusion a stojí za to je podrobně představit. LeonardoAI je online, funguje ve webovém prohlížeči, k jeho využití nepotřebujete nic instalovat ani nemusíte mít výkonnou grafickou kartu. Všechny výpočetní operace probíhají na straně serveru.
Leonardo můžete využívat zdarma s omezením na zhruba 50-100 obrázků denně, pak je potřeba počkat do dalšího dne nebo si zaplatit některé z měsíčních předplatných.
Já používám verzi zdarma, a vše co uvidíte v mých videích je vytvořeno s touto bezplatnou verzí.
Na leonardo.ai bylo ještě před pár dny nutné se přihlásit a počkat na pozvánku, teď už ale vše funguje tak, že se přihlásíte se svým emailem, Google nebo Microsoft účtem a můžete používat LeonardoAI okamžitě.
Po přihlášení vidíte hlavní obrazovku. Nahoře vlevo je vašich 150 tokenů, po najetí na otazník vidíte, za jak dlouho se vám resetuje denní dávka tokenů, a můžete zde Upgradovat na některé placené předplatné. Cena je srovnatelná s Midjourney, za 12 dolarů měsíčně bez DPH dostanete 8500 tokenů. Mně 150 tokenů vystačí zhruba na 80 obrázků, takže to je odhadem na generování 4500 obrázků. Ale berte to velice orientačně, různé operace stojí různé množství tokenů.
Dál na levé straně vidíte Home, to je tam kde právě jste. Community Feed je galerie obrázků ostatních uživatelů, Personal Feed, to je vaše vlastní galerie, Training and Datasets, tady si můžete vytvářet a trénovat své vlastní modely. Finetuned Models, to jsou modely, které vytvořili ostatní uživatelé a vy je můžete používat.
Pokračujeme pořád na levé straně, User Tools. První je AI Image Generation, to budeme používat v tomhle videu, generování obrázků.
AI Canvas, to je Outpainting a Inpainting nástroj, malou ukázku jste viděli v minulém videu.
Texture Generation, nový nástroj na vytváření UV textur na 3D objektech. Je to alpha verze, která podle mě nefunguje asi přesně tak, jak bylo zamýšleno, aspoň ne pro mě, ale podíváme se na to taky.

V hlavní části obrazovky v horní řadě vidíte modely, které můžete použít ke generování obrázků. Vybírám Dreamshaper v6 a rovnou se otevírá sekce s generováním nového obrázku.
Pokud používáte tenhle druh generativní umělé inteligence poprvé a vůbec nechápete, kde jste se právě vynořili, ničeho se nebojte, já tady zastavím a projdeme si všechny prvky na obrazovce.
Začneme zase vlevo v panelu pod logem LeonardoAI
První řádek už znáte, váš stav tokenů.
Pod tím je počet obrázků, které se budou generovat z jednoho promptu po stisknutí tlačítka Generate. Při změně modelu se toto resetuje, takže si to kontrolujte. Nicméně se to resetuje směrem dolů a obvykle se vybere jeden nebo dva obrázky. Většinou máte na výběr jeden až čtyři. Čím víc obrázků generujete najednou, tím víc tokenů se na to spotřebuje. Ale z mé zkušenosti je „lacinější“ generovat jednou 4 obrázky než čtyřikrát jeden.
Další prvek pod tím je Alchemy, Prompt Magic a Public Images. Alchemy je vylepšení přímo od tvůrců LeonardoAI a je zatím jen pro platící uživatele, stejně jako možnost vypnout vaše obrázky jako Public. Vše, co generujete ve verzi zdarma je viditelné pro ostatní uživatele Leonarda. Zbývá tedy Prompt Magic, ale ten zatím necháme být.
Pod tím jsou rozměry obrázků. To je důležitá část. Vybíráte jestli je obrázek na výšku nebo na šířku a jeho velikost. Není potřeba generovat velké obrázky, zvlášť jestli si nejste jisti, co z vašeho promptu vyleze. Leonardo má promyšlený systém několika různých zvětšování obrázků, takže klidně generujte menší a zvětšujte jen ty výsledky, které se vám líbí. Velikost obrázku se opět resetuje při změně modelu. Malý žlutý trojúhelník vedle Image Dimensions signalizuje, že model byl trénován na jinou maximální velikost při generování. Klidně to můžete ignorovat. Nebo můžete přesně tuto velikost nastavit manuálně pod těmi nabízenými.
Guidance scale, někdy také CFG, classifier free guidance, je zjednodušeně řečeno faktor, který určuje, jak moc se generovaný obrázek bude držet vašeho promptu. Čím vyšší číslo, tím víc bude výsledek blíž vašemu promptu, čím nižší číslo, tím větší kreativita. Tohle znáte z Midjourney jako –s nebo –stylize. Obecně se doporučuje nechávat Scale Guidance mezi 7 až 10, nemáte-li nějaký specifický důvod to měnit.
Další položka nalevo je ControlNet, to nechám na později, do příštího videa, protože ControlNet je mocná čarodějka.
Tiling je asi jasné, generuje opakující se vzory pro tisk nebo 3D objekty. Dostaneme se k tomu taky někdy příště.
Image to Image, generování obrázku z jiného obrázku s pomocí textového promptu je kapitola sama pro sebe, a taky na to dojde.

Hlavní obrazovka, tady už vidíte generující se obrázky a snad vás tady nic nepřekvapí.
První je prompt, v mém případě „Portrét lakotské náčelnice s čelenkou z peří, tradiční oblečení, americká prérie, slunečný den, záběr zblízka, filmová fotografie, hodně detailů“
Pod tím je negativní prompt, tady jsou naházená nějaká libovolná slova z nějakého minulého promptu, ale obecně tam nechci žádné nápisy a texty a žádné deformace lidského těla, auta, a zůstaly tam nějaké věci, které by tam být neměly, protože jsou v pozitivním promptu. Ale jak uvidíte, není to žádná tragédie.

Pod tím máte vybraný model, Dreamshaper v6, zapnutý Leonardo style, který lze vypnout, ale s většinou modelů dává lepší výsledky a zapnutý negativní prompt, který lze opět vypnout.

Úplně vpravo je tlačítko Generate – Generovat a pod ním vidíte počet tokenů, které vám zmáčknutí tlačítka odečte z vašeho denního přídělu, a taky kolik tokenů vám zbývá.

Pod tím se zobrazuje zcela nutná reklama vyzývající vás k upgradu na placenou verzi, jak někdo zmínil v komentářích, vše, co je zadarmo, je „zaplacené“ vaším koukáním se na reklamy, výzvy k upgradu nebo něco podobného. LeonardoAI si dělá vlastní promo velmi decentně a za to má u mě další plusové body.
Pod tím najdete generující se obrázky, tohle je zastavená obrazovka v průběhu generování. Zobrazuje se tu prompt, negativní prompt, model, nastavení stylu, počet obrázků a jejich velikost a můžete si tady zobrazit další informace.
A dole pod tím je seznam vašich předchozích výtvorů s datem a všemi podrobnostmi promptu.

Vygenerované obrázky jsou dobré, dostávám přesně to, co je v pozitivním promptu a ignorovalo to některé moje nesmysly v negativním promptu. Dreamshaper je model který umí jak fotorealistické obrázky, tak anime a všechno mezi tím. V promptu nebylo specifikováno, že se chci reálnou fotografii, takže výsledek je opět odpovídající mému požadavku. Hodnotit faktickou správnost, jako detaily oblečení nebo čelenky nebudu, protože to bychom taky mohli skončit debatou, jestli se žena může stát lakotským náčelníkem. A tam se opravdu pouštět nehodlám.
Po najetí na obrázek se zobrazí možnosti různých způsobů upscalování a dalších funkcích. Toto je podle mě ukázka dobře udělaného UI, uživatelského prostředí. Po najetí na každou ikonu vidím jaký typ upscalování se chystám dělat, kolik mě to bude stát tokenů, kolik mám tokenů a za jak dlouho se budou resetovat, tedy doplní se do 150 tokenů.
Já záměrně ve videích používám slovo Upscalovat, ne zvětšovat. V oblasti obrázků generovaných umělou inteligencí, (což je teda taky velmi nepřesné označení, ale smiřte se s tím… nebo ne.) V oblasti obrázků generovaných umělou inteligencí se nejedná o zvětšování obrázku jako třeba ve Photoshopu nebo jiných klasických bitmapových grafických editorech. Jedná se o nové generování obrázku do většího rozměru v pixelech, a jsou přidány, změněny, vylepšeny detaily obrázku. A právě v Leonardu tohle pochopíte během následující minuty.
Po najetí na obrázek mám možnost Creative Upscale. Nebo spíš nemám, jsem neplatič.
Creative Upscale je funkce pro platící uživatele, vyberte jinou možnost
Alternativní upscale – vyberte, pokud Creative Upscale vede ke ztrátě detailů. Těžko říct, když ho nemůžu použít.
HD Smooth Upscale – funguje dobře se zaostřenými objekty, ale může vyhladit detaily. Bude mě stát 5 tokenů, mám 146 tokenů, které se doplní do 150 za 109 minut.
Další možnost je Remove background, vymazat pozadí. To budu dělat až s upscalovaným obrázkem, protože… to dá rozum.
HD Crisp Upscale, to je tak nějak opak Smooth, vyhlazujícího Upscalu. Tady očekávám ve výsledku více ostrých detailů. Stojí stejných 5 tokenů.
Edit in Canvas znamená, že obrázek pošlu do editace a můžu provádět Outpainting a Inpainting, to nechám na pozděj a zase, s upscalovaným obrázkem.
Použít pro Image to Image, tedy generování obrázku z jiného obrázku. Taky se tam dostaneme.
Volím HD Smooth Upscale. Ikonka tohoto Upscalu se barví do fialova, při najetí na obrázek rovnou vidím, že je k dispozici verze takto upscalovaná.
Po kliknutí se obrázek otevře a vidím, které upscalované verze mám k dispozici.
Já udělám všechny tři možné Upscaly a ještě k tomu Unzoom, to je sice teprve Beta verze, ale funguje dost dobře. Unzoom znamená, že se provede Outpainting obrázku na všech stranách rovnoměrně, jako byste při pořizování fotografie změnili zoom. Na poprvé dostávám zduplikovanou postavu, což je nežádoucí vlastnost Stable Diffusion modelů a dá se vyladit v promptu a negativním promptu.
A rozkliknu obrázek a podívám se na všechny verze. Na Smooth Upscalu provedu vymazání pozadí a stáhnu všechny obrázky k sobě do počítače.
Tohle jsou všechny verze, jak vidíte, provedlo se zvětšení originálního obrázku do nějaké přednastavené velikosti a generování nových detailů.
Vymazání pozadí je taky v pořádku. Unzoom není ideální.
Své vlastní obrázky taky můžete spravovat z hlavní stránky z menu, Personal Feed. Každá položka obsahuje všechny detaily, můžete si zkopírovat prompt do schránky, poslat obrázek do Image to Image generování. Remix otevře celý prompt, negativní prompt a všechna ostatní nastavení do generování obrázku, můžete využít celý prompt znovu.
Lze si zde stáhnout všechny verze obrázku, nebo třeba zkopírovat Seed.
Seed, česky semínko, je číslo mezi jedničkou a zhruba 4 miliardami. Díky tomuto číslu dostáváte při každém použití úplně stejného promptu i ostatních parametrů rozdílné obrázky. Z počátečního náhodného šumu se stává v průběhu výpočetních kroků jedinečný obrázek. Pokud při každém generování používáte náhodné číslo pro Seed, což je default možnost pro většinu nástrojů založených na Stable Diffusion, dostanete pokaždé jedinečný obrázek nebo sadu obrázků. Jestliže chcete i v dalších promptech zachovat stejný vizuál obrázku, je potřeba použít stejný Seed.
Já kopíruju Seed z předchozího promptu, a rozklikávám rozšířené možnosti. Default je Seed pro každý prompt náhodné číslo, já vložím a použiju stejný Seed.
Nebo můžu použít Remix a zkopíruje se všechno kromě Seed, to je potřeba zadat manuálně.
Spustím generování obrázku, a dostávám stejné nebo podobné výsledky. Co je na tom zajímavého? První obrázek byl generován 23. června, ten druhý 29. června, o šest dní později.
Seed takto nebude fungovat navěky, pokud to zkusíte za měsíc nebo za rok, tak se přinejmenším změní verze modelu nebo nějaká nastavení v LeonardoAI, nebo kdekoli jinde. Typické použití Seed je vytváření konzistentních postav nebo prostředí. Chcete-li tvořit komiks, knížku, film nebo nějaký příběh, kde byste rádi měli obrázky stejné postavy v různých situacích, budete používat Seed asi často.
Ještě lepší výsledky dostanete v kombinaci stejného Seed s použitím ControlNetu. Ale o tom až příště.
Ještě na ukázku zkouším stejný prompt a Seed, ale rozdílné modely. Toto samozřejmě nezaručí stejný výsledek, ale může to být užitečné, pokud hledáte, který model použít pro nějaký konkrétní projekt. Stejný Seed a stejný prompt a všechna nastavení vrátí velmi podobně vypadající obrázky. Rozdíly jsou ovlivněné právě modelem, tedy tréninkovými daty a dalšími parametry daného modelu.
A tady je přehled toho, co se mi podařilo vygenerovat na 150 tokenů. Je to 80 obrázků, některé jen z promptu, některé z výchozího obrázku, asi 10 Upscalů, a pár pokusů o Outpainting. Zbývají mi dva tokeny a těch chybějících 148 se mi podařilo zlikvidovat za asi 25 minut.

LeonardoAI je komplexní nástroj a sotva jsme se dostali k naprosto základním funkcím. Takže očekávejte pokračování, asi tak dvě nebo spíš tři další videa v podobném rozsahu, která se budou věnovat všem funkcím v Leonardu a také tomu, jak se tvoří prompt pro Stable Diffusion. Součástí každého videa budou nejen ukázky, ale i vysvětlení, jak fungují některé věci pod kapotou generativních nástrojů.
Ať už jste se poprvé rozhodli použít LeonardoAI nebo už používáte jiné aplikace založené na Stable Diffusion, já doufám, že se v každém videu naučíte něco nového.