Midjourney má Inpainting
Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.
Midjourney má konečně Inpainting. Přímo v Discordu, což zní skoro jako zázrak, a vážně to funguje.
Ukážu vám jak Inpainting použít, několik triků, které by vás možná nenapadly a v závěru vyzkouším jednu funkci v Midjourney, která je téměř neznámá.
Nejdřív si zkontroluju nastavení. Používám verzi 5.2, nejnovější možnou. Rozhodně chci mít zapnutý Remix Mode, bez toho nejde psát prompt pro část, kterou budu chtít překreslit.
Já pracuju s High Variation Mode, ukážu vám i rozdíl s Low Variation Mode.
Mám zapnutý Turbo Mode, ten rychleji generuje, a taky rychleji požírá minuty a peníze. Vy klidně zůstaňte ve Fast Modu, na výsledek to nemá žádný vliv.
Píšu prompt: Barevná malba šťastného roztomilého psa sedícího v městském parku, město v rozostřeném pozadí, světlo dopadající zezadu. Přidávám styl 400, chaos 100, poměr stran 16:9 a nechci to škaredé ani s žádným textem nebo logem.
Dostávám tři fotky a jednu omalovánku a nijak mě to neuráží. Nasvětlení zezadu je záměr, protože se s tím generativním nástrojům bude pracovat hůř než s nějakým mdlým přirozeným světlem zepředu. Ale v tomhle ohledu Midjourney nezklamalo.
Vybírám si dvojku, jediného psa který asi nesedí, ale těžko říct… Dělám Upscale… a už tady vidíte, že mám k dispozici tlačítko Vary (Region), to je ono, Inpainting.
Ale ještě vás budu chvíli napínat, chci mít psa s nějakýma nohama, dělám Outpainting, panning směrem dolů, s promptem nijak nemanipuluju.
Na to, že celou dobu žádám o malbu, dostávám stále překvapivě fotorealistické výsledky. Popravdě, tenhle obrázek má neskutečně dokonalé detaily. Je správně rozmazané pozadí i popředí, hodně malá hloubka ostrosti, tam, kde je zaostřeno, vidím detailně každý chlup, kapky bahna na čenichu i na srsti na krku, žilky na listu rostliny nalevo a jednotlivé listy trávy na zemi, a v popředí listy a stéblo pampelišky propouštějící sluneční světlo v místě, kde není stín psa.
Umíte všichni takhle nastavit manuálně foťák, nastavit hloubku ostrosti, zaostřit na správné místo a zvolit správnou clonu do protisvětla, abyste nepodexponovali tělo psa a neměli z něho tmavý stín bez detailů, že jo? Jen se ptám…
Protože použití šipek směrem kamkoli resetuje další možnosti, použiju trik ze Zoomem z minulého videa. Vyberu Custom Zoom, nastavím na 1, to znamená neprovedu žádný zoom. Dostanu čtyři stejné obrázky, vyberu libovolně třeba ten první, provedu Upscale a jsem zpátky tam, kde potřebuju být.
Tlačítko Vary (Region) otevírá Editor. Nemáte-li dole v tomto okně prompt, tak jste nedávali pozor nebo přeskočili úvod, ve kterém říkám, že máte mít zapnutý Remix Mode v /settings.
Nalevo od promptu jsou dvě miniaturní ikonky, ale jsme v Discordu, stále rozdýchávám tento zázrak… Ikonky jsou obdélník pro obdélníkový výběr a laso pro… výběr lasem. Jestli jste nikdy nepracovali v žádném grafickém editoru, tak vás tady jednak vítám, a jednak vám gratuluju k vaší odvaze začít editovat zrovna v Discordu a s Midjourney.
Pokud laso i obdélníkový výběr znáte, tak přibrzděte, funguje to trošku neintuitivně.
Upravím prompt, chci psa s brýlemi. A obdélníkem zaberu místo, kde chci brýle. Zdá se mi to malé, takže ještě jednou… a hele, ono to první nezmizí, ale můžu přidat další výběr. Pokud chci výběr zrušit, je potřeba použít tu ikonku vlevo nahoře, tu jedinou, co tam je.
A Submit Job, vlevo v promptu něčím jako Enter.
Protože zůstal v promptu styl i chaos, mám čtyři hodně odlišné obrázky. Dvojka je divně futuristická, ale ty ostatní jsou realistické. Trojka dokonce mění psí oči na větší a zvětšuje i odlesky v očích na větší. Jednička i čtyřka mají velmi uvěřitelné odlesky v brýlích.
Zkusím v /settings přepnout na Low Variation Mode.
Dostávám dvoje barevné brýle s barevnými odrazy, jednu futuristickou podivnost a jedny brýle zvětšující roztomilé psí oči.
Další pokus, otevírám Inpainting, vidíte, že výběr je stále stejný, to je praktické. Mažu styl i chaos z promptu.
A dostávám hodně podobné výsledky, chaos je vypnutý, tedy na nule, výsledky mají být hodně podobné. Chaos má větší vliv na výsledek, než Low Variation Mode, podle mě.
A teď laso. Vyberu psa i s dostatečně velkým okolím, protože chci jiného psa, zase v protisvětle. Je lepší vybrat větší část, a nechat dostatečný prostor k vygenerování nového okolí. A chci dalmatina. Není to žádná sláva, ale to se dalo čekat. Až na trojku jsou všechny obrázky akceptovatelné.
Já se vrátím k původnímu obrázku a ukážu vám jeden trik. Inpainting údajně používá jiný “systém” než samotné generování z promptu. Toto uvedl přímo David, pan nejvyšší z Midjourney. Nevím, jak si to přeložit, podle mě to používá i jiný model, jiný checkpoint. Údajně když zaberete celý obrázek a necháte ho vygenerovat znovu, dostanete kvalitativně lepší výsledek.
Problém je v tom, že to není moc jak porovnat. Když zkusím stejný prompt, dostanu úplně jiný výsledek, tady je to opravdu barevná malba, jak je v promptu.
Zkusím to bez stylizace a chaosu. Dostávám méně rozdílné výsledky, stále je to barevná malba. Změním to na digitální fotku. Teď je to realističtější, ale i bez stylizace a chaosu dostávám psy, kteří se smějí a jsou šťastní až příliš.
Pošlu si původní obrázek do zprávy, protože chci použít seed. Což je věc, která v Inpaintingu nefunguje, jak vidíte. Zjevně tedy Inpainting používá jiný model, což je do jisté míry logické. Pokud chcete konzistentní postavy nebo prostředí, je potřeba si je vygenerovat v Inpaintingu a dělat jejich variace až tady, s pomocí promptu a výběru jejich části. Nebo Inpainting nepoužívat vůbec.
Tady vidíte popis Vary (Region) v oznámení v Midjourney. Funguje nejlépe pokud vyberete 20 až 50 procent obrázku. Není to zázračný nástroj, někdy můžete uspět spíš s použití Vary (Subtle).
Inpainting nejlépe funguje v kontextu původního obrázku. Bude jednoduší přidat postavě klobouk, nebo psovi brýle, než vygenerovat delfína uprostřed lesa.
K promptu… ze zkušenosti: je jedno, jestli použijete celý původní prompt jen s dodatkem toho, co měníte, nebo jestli prompt kompletně smažete a popíšete jen tu věc, kterou chcete ve výběru změnit. Pokud používáte rozumně krátký prompt. V případě hodně komplexních promptů to může být jinak, ale v případě hodně komplexních promptů to asi stejně očekáváte.
A teď když znám pravidla, tak je otestuju, najdu jejich slabiny a poruším je… jak jinak.
Tady mám obrázky z minula, které se mi líbily. Můžu rovnou udělat Upscale, nebo si poslat celý Job do zprávy a zkopírovat Job ID. To mimo jiné najdete i ve vlastní webové galerii, nemusíte skrolovat celým Discordem měsíce zpátky.
V Discordu, třeba na vlastním serveru, použijete /show, vložíte Job ID a máte aktuální celý grid, z toho vyberete Upscale… a tady to je.
Tohle měl být člověk se psem, Midjourney se to nějak popletlo, tak to opravím. Zkrotím šelmu lasem a do promptu napíšu jen “lidská hlava s kšiltovkou.”
Chudák Midjourney tomu moc nerozumí… Ještě jednou, klobouček by byl, prosím? To je lepší.
Zabírám zhruba polovinu obrázku a chci něco úplně jiného. Chci aby tenhle muž seděl před táborákem na mýtině uprostřed magického lesa s kouzelnými stromy. Postava je z boku osvětlená měkkým oranžovým světlem z města, to by mělo být dokonalé.
A výsledek je jedno město v plamenech, kouřové signály pod borovicí, kupa hlíny sršící nesmysly a… jeden ohýnek pod notně opadanými stromy.
Budu pracovat s tím co mám. Nechávám oheň a zabírám takové tři čtvrtiny celého obrázku, protože chci opravdu hluboký les a žádné město.
A mám rozkvetlé třešně a sršící západ slunce, méně rozkvetlé třešně za lávovým polem a zdeformovaný západ slunce, kouzelné stromy za devatero horami a sedmero lávovými polemi a jeden strom za zemí nikoho. A dramatický západ slunce.
Na to, že by to nemělo fungovat, to docela jde, co myslíte?
Můžu použít Inpainting na starší obrázky z verze 4? Zkopíruju Job ID ze staršího Upscalu… a zjevně můžu pokračovat.
Stejný prompt, bez uvedení verze… generuje velmi výrazně rozdílný výsledek, očekávaně.
Mixování různých verzí bude vypadat stejně, tady zkouším rybu s lidskou tváří ve vodě… a dostávám úplně jiný barevný prostor, s nelidskou tváří.
Upřímně, verze 4 se mi líbila víc a tady je jasně vidět, proč ji tolik lidí používalo. A používat se dá pořád, v nastaveních je stále vidět všechny starší verze.
A jako bonus skrytá, ne příliš zmiňovaná funkce Midjourney: Remaster. Všechny obrázky ze starších verzí můžete Remasterovat, tedy vygenerovat znovu v nové verzi. V čem je to lepší než použít znovu stejný prompt? Použití stejného promptu místo remasteringu vygeneruje úplně nové obrázky. I když použijete stejný seed. Remaster najdete u obrázků z verze 5 a nižší, tedy cokoli vygenerované ve verzi 5.1 nebude mít tuto funkci k dispozici.
Tady je obrázek z verze 5.1, i když Upscaluji, není tam tlačítko Remaster, ale za to už můžu použít Outpainting a Inpainting, vidíte tři řady tlačítek.
Na ukázku rozdílu použiju znovu stejný prompt, mám aktivní verzi 5.2, a dostávám jinou sadu obrázků. I když to udělám ještě jednou, a přidám originální seed, dostanu sice podobný styl, ale jinou ulici a jiného člověka.
Rozdíl při Remaster může být výrazně menší, pokud použijete obrázek z verze 5. Tady je Dis, nejslavnější kočka českého školství z verze 5, a remasterovaná ve verzi 5.2. Rozdíly jsou malé, kvalita detailů mi přijde víceméně stejná.
Tady pokus o Remaster obrázku z verze 4. Nejdřív mi přišlo, že to nepůjde, ale po dalším Upscalu se objevilo tlačítko Remaster. Nové obrázky jsou výrazně odlišné, co zůstává je kompozice, víceméně barevnost a tak nějak celková myšlenka obrázku. Ve dvojce mám i plující ryby okolo, podobně jako v originálu.
A pro srovnání použiju ten stejný prompt v stejné verzi 5.2 se stejnými nastaveními. A dostávám úplně jinou scénu a jiný příběh.
Ještě srovnám s předchozím Inpaintingem toho samého obrázku.
A trochu mimo mísu, stejný prompt v Niji verzi 5.2, styl scenic.
A ještě jeden pokus o Remaster. Tohle se mi hodně líbilo pro ten styl, záměrně si vybírám obrázek z hodně stylizovaně ilustrovanými prvky.
Dostávám o něco realističtější scénu s trochu jinou barevností.
A druhý obrázek ze stejného gridu. Výsledky jsou pořád excelentní. Ještě rok dva zpátky byste tohle dlouho malovali rukou nebo rukou na tabletu, v lepším případě. Teď to “malujete” s nohama na stole, hrnkem kafe v ruce a klávesnicí na klíně a máte hotovo asi za pět minut i s ohrnováním nosu, že ty vlnky nejsou tak pěkně kudrlinkovatý jako ve verzi 4.
A nakonec nenechávám zvířátka, ale jedno klepnutí přes prsty.
Tady zkouším Remasterovat starší obrázek, prompt byl ve stylu “upadla mi cihla na klávesnici a už se mi fakt nechce nic vymýšlet a nakonec přidám nejroztomilejší.”
Při pokusu o Remaster se Midjourney rozhodlo, že toto jediné slovo v promptu, které neexistuje v žádném jazyce, je porušením pravidel. Kupodivu, v březnu 2023 to proti pravidlům nebylo. A že si mám zkontrolovat “spodek kanálu” pro víc informací. Předpokládám, že v Midjourney nemysleli, že se mám jít vrtat na dno La Manche? Tohle je moje soukromá zpráva mezi mnou a Midjourney botem, tady žádné dno hledat nebudeme.
Mačkám ihned Appeal, nenechám si nadávat od robotů do sprosťáků. A požadavek, který je údajně poslán sofistikovanější umělé inteligenci, než jsou uměle inteligentní moderátoři Midjourney, je vyřízen kladně. Roboti mě nechají žít a psát náhodné shluky kláves i v budoucnu!
Tenhle nový výsledek za to teda nestál…
Příště to bude lepší, zkusíme teď chvíli něco bez cenzury a zadarmo. Jestli chcete.