PlaygroundAI – Krok za krokem
V tomto videu vám představím nástroj, který generuje obrázky z textového promptu a má webové prostředí. Jeho základní verze je zcela zdarma, můžete vygenerovat až 1000 obrázků denně, aplikovat velké množství přednastavených stylů, a také využít webové prostředí k mazání částí obrázků, doplnění vymazaných nebo označených částí jinými objekty, opět z textového promptu.
Zároveň se jednoduše naučíte pracovat se všemi podobnými nástroji, založenými na Stable Diffusion, které mají webové prostředí. Protože tenhle zdaleka není jediný.
Podle mě je ale nejpřívětivější k uživatelům, má nejmenší limity ve verzi zdarma a jednoduché webové prostředí.
Má to nějaký háček? Něco, co vám neříkám? Vůbec ne.
PlaygroundAI.com takto funguje už několik měsíců a nevypadá to, že by se to mělo měnit. Tak to prosím nebuďte vy, kdo to rozbije.
Tady rovnou vidíte galerii toho, co vytvořili ostatní uživatelé.
Začněte tlačítkem Get Started.
Přihlášení je možné jen s Google účtem, ale vy to můžete mít jinak.
A to je všechno. Vypadá to na první pohled složitě? Je to jednodušší, než si myslíte.
Já začnu vpravo nahoře.
Model je ta nejdůležitější část. PlaygroundAI je založeno na Stable Diffusion, ale má možnost propojit se s DALL-E 2 a nově také vytvořilo vlastní model, Playground v1.
S DALL-E se můžete propojit pouze ve verzi placené, za 10 USD měsíčně. Lze si ji zaplatit jak samostatně, tak s verzí Pro, která je za 15 USD měsíčně. Ale nás zajímá to, co je zadarmo, že?
Free for everyone, zdarma pro všechny je velmi lehce limitováno.
Můžete vytvořit „pouze“ 1000 obrázků denně. Když je vyčerpáte, nelze si nic přikoupit, musíte počkat. Ale za to i tyto obrázky můžete používat komerčně, tedy pro jakoukoli výdělečnou činnost. Po 50 obrázcích je limitována kvalita a rozměry obrázků. Lze vykonávat pouze jeden prompt současně. Lze vytvářet obrázky soukromě, ale toto je potřeba pokaždé kontrolovat, nelze to nastavit trvale. Prakticky, po každém vypnutí počítače, zavření webového prohlížeče nebo delší nepřítomnosti v PlaygroundAI si to zkontrolujte a nastavte.
A to jsou všechna omezení. To zní dobře, ne?
Já se vrátím ke Stable Diffusion. Velmi zjednodušeně řečeno, SD je deep learning model, umožňující generování obrázků. Kód SD je otevřený, tedy lze na něm trénovat své vlastní modely, stáhnout si SD pro vlastní potřebu na svůj lokální počítač… Ale k tomu všemu se dostanu v budoucnu, protože tomu se dá věnovat hodiny a hodiny.
Tohle není ani návod na prompt engineering, tedy mistrovství ve vytváření promptů pro generátory obrázků, které jsou založené na SD. Já vám nebudu přesně vysvětlovat co a proč dělám s promptem, to by byly další hodiny a hodiny. Jen budu upozorňovat na některé detaily a popisovat práci s tímto prostředím.
Vybírám model SD 1.5, protože v něm můžu použít různé styly. Můžu používat přednastavené rozměry obrázků. Omezeně, ale dostatečně, nastavovat kvalitu obrázků, a úplně dole nastavím množství obrázků generované z jednoho promptu a soukromé generování. Nic z toho, co vytvořím, nebude viděno ostatními uživateli.
Na rozdíl od úvodního přehledu stylů teď zvolím trochu komplexnější prompt, podobný tomu, který jste už mohli vidět v mém testu Adobe Firefly. Vlevo nahoře vkládám znění promptu, úplně nahoře měním styl na Cinematic, tedy filmová fotka. Vlevo dole vidíte negativní prompt, co v obrázku být nemá. Tento negativní prompt je doporučení přímo od tvůrců PlaygroundAI pro realistické portréty lidí.
A první obrázky jsou tu. Tohle je standardní výstup ze Stable Diffusion, pokud chcete vidět celého člověka, a má tam být ještě nějaké prostředí okolo. Portréty, kde je vidět jen půlka těla, a tvář víc v detailu, jsou výrazně lepší.
Každý obrázek si můžete zvětšit na obrazovce, k tomu je View Full Screen. Dá se zkusit opravit tvář, Face restoration, ale nečekejte žádnou hitparádu. Když už se vám něco líbí, je tu Upscale 4x, rozměr obrázku v pixelech se zvětší čtyřnásobně a je vám nabídnuto stažení.
Use image to image znamená, že se obrázek stane předlohou pro další variace, objeví se dole vlevo v příslušné sekci, kde také můžete upravovat Image Strength, to je váha obrázku. Čím větší váha, tím blíže bude následující generovaný obrázek blíže k tomu původnímu, a naopak.
Já ještě drobně změním prompt… A tady vidíte, že při některých změnách se vám resetuje nastavení vpravo dole, což je počet obrázků v jedné generované dávce, a občas se také vypne Private Session, což nijak nepoznáte, dokud se tam nepodíváte.
Tak ještě jednou, čtyři obrázky.
Já si ušetřím dívání se na ty chudáky zdeformované teenagery a změním formát na výšku. A jak vidíte, méně prvků v obrázku znamená větší soustředění na postavu a dává lepší detaily tváře, ruce mají plus mínus čtyři až pět prstů, téměř se blížíme k nudné realitě.
Co ještě můžete dělat? Edit vás přepne do editace fotky z textového promptu.
Zadávám do Edit Instruction: Změň barvu mikiny na červenou.
Skoro perfektní, mám červenou mikinu, kalhoty, dům v pozadí a červený nádech asi přes polovinu obrázku.
Zadávám: Změň barvu džínů na zelenou. PlaygroundAI není žádný troškař, zelená je všude. Nicméně rozeznává to ty části člověka, které jsou oblečené, tvář a ruce zůstávají v pořádku. Tohle dělají i některé grafické editory, které se honosí titulem „poháněno umělou inteligencí“ a prodávají se za peníze jako plnotučné grafické editory určené k seriózní práci.
Zpátky na hlavní obrazovku. Změním styl zase na filmový… a generuje to části hocha, tajemně se schovávajícího za okrajem obrázku, asi se stydí?
Další úpravy promptu… a teď se dostávám k tomu, co od toho promptu tak nějak očekávám…
Možná si všímáte, že pokud aplikujete nějaký styl, a pak najedete na výsledný obrázek, nakonec nebo na začátek promptu jsou přidaná další slova, která ten styl vynucují.
Tohle stojí za uložení, opravuju tvář, upscaluju, tedy zvětšuju rozměr čtyřikrát a ukládám.
Vytvářím variace. Automaticky to přepíná počet generovaných obrázků na jeden, já přepínám na čtyři a generuju ještě jednou.
Tohle je přívětivá tvář. Ale ta silnice ve spodní části někam zmizela. Použiju další funkci, a to je Inpaint. Malování dovnitř obrázku.
Dole pod obrázkem je velikost štětce, kterým zakryju ty části obrázku, které chci změnit. Když se mi to nelíbí, můžu se vrátit o jeden krok zpět, to bylo v mém případě všechno, takže znova. Když budu dělat krátké tahy, tak můžu vrátit jen ten jeden tah.
Nelekejte se toho, že zmáčknete Done, hotovo, ale nic nevidíte, ta maska stále existuje. Zvolte opět Generovat.
Ta zamalovaná část se změnila. Ne tedy k mému potěšení, ale princip je jasný. Ukládám.
Teď se můžeme dostat k části, která se jmenuje Canvas a podíváme se na Outpainting, tedy dodělávání obrázku okolo, tam kde je oříznutý, nebo kde chci změnit formát.
Nepodíváme. Z nějakého důvodu se můj našlápnutý a ke všemu připravený desktop tváří jako mobil.
Po krátké pauze se mi to podařilo vyřešit použitím jiného prohlížeče. Pokud i váš Firefox bude zlobit, odložte ho a zkuste jiný webový prohlížeč. Svět není ideální.
Z nějakého důvodu žiju v iluzi, že do Canvasu, správně asi Canvu, ale to mi nebudete rozumět…
Z nějakého důvodu žiju v iluzi, že do Canvasu můžu klikem poslat obrázek rovnou vygenerovaný z promptu a ten tu upravovat. Byla to jen iluze, nic takového není možné.
Můžu sem uploadovat obrázek z počítače nebo co používáte za zařízení, to oceňuju, lze tu upravovat cokoli, vytvořené kdekoli jinde, vyfocené mobilem, doslova, cokoli.
Lze sem také umístit obrázek, který jste vygenerovali v PlaygroundAI, je potřeba zadat jeho adresu. Já uploaduju z počítače a zkouším dotvořit chybějící část obrázku.
Tohle nejsou mladá záda, tohle asi nikdo nechtěl vidět, kde jsou ti politicky korektní moderátoři obsahu?
Mažu to štětcem, ale lze zrušit i celý krok klávesovou zkratkou Ctrl+Z.
Zkusím generovat bez popisu. Taky nic moc.
Zkusím jinou část obrázku, a chci rozmazanou rušnou ulici v pozadí.
Tohle není ani rušná, ani rozmazaná… no, možná je to ulice.
Tak to moc nejde… Najdu si originální prompt. Ve svojí vlastní galerii, kliknu na obrázek a je tam celý prompt, i s těmi přidanými výrazy, s negativním promptem, pod obrázkem je odkaz na obrázek, který stačilo zkopírovat, vidím tady všechny detaily a to včetně Seed, to je číselné vyjádření variace, které se přidává do promptu. Každý jedinečný slovní prompt má svých vlastních nejméně 232 variací, bez toho bychom se asi během pár měsíců dostali k tomu, že všichni budeme generovat ty samé obrázky a hádat se o ně. Velmi zjednodušeně řečeno, kdo tomu rozumí, nebude mě chytat za slovo, a udělá si své vlastní cvičení, jak to vysvětlit jednou větou o 32 slovech.
Takže, obcházím omezenou umělou inteligenci a zadávám do Canvasu stejný prompt, stejný negativní prompt a stejný Seed.
A zase fuj.
Jen tak pro kontrolu. Mažu vložený obrázek. Tvůrci PlaygroundAI vždy tuhle funkci prezentovali vygenerováním obrázku na prázdný Canvas, jen z textového promptu.
A generuje to tmavý obrázek, já to trochu podezřívám, že tato funkce používá model Playgroundv1, ne Stable Diffusion 1.5, vizuálně to je blíž a nevidím tu nikde možnost změnit model. Model výrazně ovlivňuje výsledek, k tomu se dostaneme za chvilku.
Změním styl. Několikrát. Kontroluju, že používám stejný sampler jako předtím, i Seed. A samozřejmě styl.
A tohle je asi nejlepší, co z toho dostanu.
Zkusím tedy doplnit tenhle obrázek o chybějící ořezané části.
Posouvám rámeček tak, aby více než polovina byla v originálním obrázku.
Tak aspoň ten vzorek je stejný…
Posouvám rámeček tak, aby jeho většina byla v originálním obrázku.
A teď to dělá, co očekávám. mažu nesmysly okolo a zkouším to ještě jednou.
A to je celkem třetí tvář na obrázku. Co tam ti hoši dělají… já vážně nevím.
Zkouším ještě pomalými, plíživými přískoky doplnit celou hlavu hlavního hrdiny…
A ne, dostávám nesmysl.
Tahle funkce je dost zklamání. Outpainting není nemožný, jiné nástroje ho umí lépe. Dalo by se uvažovat o tom, že zrovna není dobrý den, původně mě to sem nechtělo pustit v běžně používaném prohlížeči, možná se dějí nějaké erupce v serverových galaxiích… Ale tohle není můj první pokus s Outpainting funkcí v PlaygroundAI a nikdo to nedopadlo výrazně lépe.
Ukážeme si ještě něco jiného, co funguje.
Vrátím se zpátky na Board, prostředí s promptem, jako na začátku.
Dole vlevo v sekci Image to Image je nejen tlačítko plus k přidání obrázku, ale taky malá tužka, která si říká štětec. Kliknutím na ikonu otevřete prázdnou bílou stránku. Dole jsou barvy a velikost štětce, a jedéééém. Myší, výsledek bude jako od pětiletého dítěte, ale zase tohle zvládne ÚPLNĚ každý, ne?
Travička, skalky, strom… nějaké listí… udělám z toho podzimní strom. Jo, nebe, nebe mělo přijít první… To nevadí, bude na něm hodně bílých obláčků.
Krása.
A rovnou nastavím nějaký styl, Vysněný přístav.
Kde je můj strom??? Co se stalo? Ukradli mi můj propracovaný strom!
Aha, štětec není podporován s tímto stylem.
Štětec není podporován s žádným stylem. No já se s tím smířím, ale taky jste to mohli říct předem…
Tak budete trpět pohledem na mou mistrovsky provedenou malbu ještě jednou. Já to zase zrychlím, Aspoň tam teda bude to nebe první, chybami se člověk učí.
Vrcholná fáze impresionismu, strom.
A teď trocha magie. Jednoduchý prompt, žádný styl. Foto stromu na zahradě.
To začíná mít úroveň. A listy. A trávu.
Vybírám jeden ze stromů, dělám variace. Dostávám víc listí.
Nastavím konečně ten styl, co mi zničil moje první umělecké dílo… To začíná vypadat skoro jako strom.
Jen tak pro legraci, jak vypadá origami strom.
Ne, to nechci. Je to zajímavé, ale to nechci.
Styl s více jemnými detaily dává… více detailů. Je příjemné dostávat výsledky, které očekávám.
Líbí se mi to neurčité tajemno na rozhraní horizontu a nebe. Je to město veliké, jehož sláva hvězd ještě nevygenerovaných se dotýká? Je to zarostlý břeh řeky, která teče za domem? Je to začátek lesa, ve kterém se skrývají dosud nepoznaná stvoření? Tolik příběhů čeká na odhalení.
Škoda, že se pod ten obrázek už někdo podepsal. Vlevo dole.
Přidám do promptu něco o městě velikém v dáli a v nedohlednu a přidám písmenka a texty do negativního promptu.
Stromy jsou luxusní, tráva je detailní, město je moderní, možná až příliš, ale aspoň to přidává víc kontrastu.
Vyzkouším Inpainting. Štětcem začmárám, co v obrázku nechci…
Začmárám razítko… A mám travnatou zahradu.
Všechno se zresetovalo, ale… Tohle je uspokojivý výsledek.
Z dětinské čmáranice k příběhu o osamělém stromu kdesi za městem…
A ještě poslední, co byste měli vidět. Změna modelu. Model je ten veliký balík dat, který byl vytvořen trénováním, a který je zodpovědný za to, jak moc jsou obrázky… všechno. Realistické, malované, fantastické, blízko tomu, co píšete, nebo úplně rozbité a nepoužitelné.
PlaygroundAI nedávno vypustil vlastní model, který má velký dynamický rozsah, tedy jsou tam velké rozdíly mezi nejsvětlejšími a nejtmavšími částmi obrázku. Model automaticky vytváří tmavé pozadí, pokud to tak nechcete, specifikujte to v negativním promptu. Model je vhodný k tvoření realistických portrétových obrázků, protože to všichni chtějí a dělají, k tvorbě postaviček, sošek a taky pro line art, to jsou omalovánky nebo kresby z linek.
Je zde k dispozici menší množství stylů, ale já zkusím nejdřív něco bez stylu.
Prompt je: naleštěná stříbrně tekutá socha sovy s propracovanými detaily.
To není špatné.
Budu dělat různé pokusy s tímhle promptem v různých stylech, variaci na jeden obrázek, něco zvětším a na konci ukážu detaily. Zastavte si video, kde potřebujete.
Já to nějak shrnu, a naslibuju vám i něco na příště.
Začínáte-li s generováním obrázků, chcete to jen zkusit, nechce se vám nic platit, nemůžete si dovolit něco platit, vůbec nechápete, jak tvořit prompty a chcete se v tom nějak začít plácat a vlastně nevíte jak? PlaygroundAI je ideální prostředí. S tisícem obrázků denně se nemusíte nijak omezovat. Všechny obrázky můžete použít ke komerčním aktivitám. Omezení pro používání verze zdarma jsou tak malá, že vás to ani nemusí zajímat. Vše se dá zvětšit a stáhnout, máte vlastní online galerii, kterou nemusí nikdo vidět. Můžete se vracet k promptům a zkoumat je znovu a znovu. Některé funkce nefungují, nebo možná nefungují mně právě teď, ale to základní, generování obrázků, dělá to co má.
Ovládání PlaygroundAI je podobné dalším online nástrojům, které využívají Stable Diffusion i další různé modely, a ve kterých se budete v budoucnu lépe orientovat. Ovládání Stable Diffusion na lokálním počítači, pokud ho máte a výpočetně vám stačí, je podobné. Tvoření promptů je stejné. Co se tady naučíte využijete ještě mnohokrát.
I když je tohle video dlouhé, dostali jsme se jen k základům, a rozhodně jsme se nedostali ani k tomu, jak na prompty.
Já ale nedělám a nechci dělat videa, která vás nalákají na bombastický titulek, ale neukážou vám alespoň přehled toho hlavního o daném nástroji. A už vůbec ode mě nečekejte návody slibující vám zázraky a miliony a končící tím, že se autor ani nenamáhá založit vlastní účet a ukazuje vám cizí výtvory, kterým příliš nerozumí. Jestli toužíte po takové zábavě, běžte prosím jinam.
Na tomhle kanále najdete v nejbližších několika dílech další užitečná webová prostředí pro generování obrázků, která jsou v základní verzi zdarma. Nemusíte si nic instalovat do vlastního zařízení, můžete tvořit realistické nebo jakékoli jiné obrázky, a můžete je používat k čemu chcete.
Ke Stable Diffusion na vlastním počítači, k rozšíření o nástroje na tvorbu videí, vektorů, animací, vlastního chatbota a dalších úžasných udělátek, k tomu se dostanu taky.
Jestli vás zajímá něco dalšího o umělé inteligenci, třeba srozumitelná vysvětlení v češtině, jak tyhle věci fungují uvnitř, proč vám chatboti lžou a halucinují, jak se stroje učí a trénují nebo něco dalšího, rozumného a legálního, dejte vědět v komentářích. Mě to zajímá, co vás zajímá.