Midjourney novinky – Zoom, Pan, Weird, Turbo, Shorten
Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.
Co se děje v Midjourney, v posledních týdnech? Objevily se nové funkce, a já vás nebudu zdržovat a rovnou vám je ukážu na nějakém praktickém příkladu.
Nejdřív si zkontroluju /settings, pracuju s nejnovější současnou verzí, nebo modelem, 5.2, mám zapnutý Remix mode, ten je potřeba pro změny v promtpu při zoomování a panningu, to je pohybování kamerou, nebo spíš obrázkem, do stran. Zoom i Pan v Midjourney je ekvivalent Outpaintingu v nástrojích používajících Stable Diffusion.
High Variation Mode znamená, že variace při dalším generování obrázku budou kreativnější, což je to co chci. A zůstanu ve Fast Mode, k Turbo módu se dostanu pozděj.
Praktický příklad je postupné vytvoření scény pomocí nových příkazů. Začnu s promptem:
Záběr přes rameno futurstického baťůžkáře ze střechy vysoké stavby, pohled do rušného města, styl je komiks, se silnými tahy kresby, neonová světla, noční záběr. Přidávám poměr stran 16:9, stylize s hodnotou 500, protože nechci nic ani podobného realitě a chaos 50, chci si vybrat z různorodých obrázků.
Dostávám čtyři velmi uspokojivé návrhy. Nejvíc se mi hodí třetí obrázek, mačkám Upscale.
A tady mám nabídku nových příkazů. Vary je variace, na tu přijde řada později.
Druhý řádek je Zoom, můžu odzoomovat dvakrát, jedenapůlkrát, můžu zvolit Custom Zoom, ale jen v hodnotách mezi 1 a 2. Make Square znamená outpainting do formátu čtverce, podle delší strany.
Ve třetím řádku jsou šipky, to je Pan příkaz. Zmáčknutím šipky se provede outpainting obrázku do zvolené strany.
Já začnu zoomem 1,5krát. Při provádění vidíte postupné generování obrázku a kam se zoom posunuje.
Ty nohy se ne všude úplně povedly… Vybírám si první obrázek, a aby se s ním dalo pracovat, udělám Upscale.
Vybírám si Pan směrem dolů, a otevírá se mi možnost změnit prompt. Já z něj vymažu jen parametry stylize a chaos, protože teď už nechci měnit prvky v obrázku nijak zásadně, chci jen doplnit jeho část ve stejném stylu.
Nemůžu říct, že se mi to vyloženě líbí, je to takové… no, před půl rokem by to bylo dostatečné, před rokem by to bylo dechberoucí.
Tady trochu odbočím, protože do tohoto okamžiku se ke konci vrátím a budu používat Pan jen jedním směrem a zkusím vytvořit panorama.
Ale teď budu pokračovat se scénou. Upscale třetího obrázku a jak vidíte, jakmile se rozhodnete dělat Pan jedním směrem, tak můžete pokračovat jenom v tomto nebo opačném směru. Teď můžu rozšiřovat obrázek směrem nahoru nebo dolů, ale ne doleva nebo doprava. To je vlastnost, ne chyba.
Já už ale dál dolů pokračovat nechci, takže volím Custom Zoom, můžu změnit poměr stran a můžu zoomovat volně mezi hodnotou jedna, což je žádný zoom a hodnotou dva.
Výsledky nic moc, druhý obrázek má rámeček, možná je to pohled z okna?
Můžu udělat ještě jednou Custom Zoom? Težko říct, Midjourney má nějakou chorobu a za každým příkazem mi tvrdí, že nic dělat nebude… Tohle trvá docela dlouho, to snad bude i pravda… a ne, něco se provedlo, ale těžko říct co… Nějaký náhodný Zoom Out do čtverce? Tak budu pracovat s tím, co funguje, Upscale a mám zase všechny možnosti. Já chci pokračovat se změnou promptu, přidáním psa sedícího vedle postavy a změnou zpátky do formátu 16:9.
Vidím, že se bude přidávat nezanedbatelné množství nových okrajů… a těším se…
A těšení se bylo předčasné. První pes nesedí… Druhý pes je správně podle promptu. Třetí pes odjel samostatně na dovolenou, ani nenechal vzkaz a čtvrtý pes je v pozoru, protože se na něj řítí tmavé nesmyslné rámečky ze všech stran.
Provádím Upscale jediného správného výsledku… a Midjourney se vyrážejí další a další pupínky. Pro ty méně všímavé je fér dodat, že 5:24 AM je půl sedmé ráno českého času, nicméně je neděle a i když je celá Amerika vzhůru a má sobotní večer, jeden by předpokládal, že ho bude trávit shoppingem, opékáním buřtů nebo nadměrnou konzumací alkoholu. A ne ždímáním grafických karet na serverech Midjourney.
Použiju Vary (Strong). Chci varianty stávajícího obrázku, takže vrátím do promptu původní stojící postavu a nechám i sedícího psa. Mělo by se stát to, že obrázek se výrazně změní, ponechá si styl a budou mi nabídnuty čtyři hodně různorodé varianty. Můžete zkusit i Vary (Subtle), tedy variaci méně výraznou, ale podle mě Strong nabízí zajímavější výsledky.
Já se vrátím kousek zpátky a z úplně prvního Upscalu budu přidávat postupně pouze směrem doprava a vytvořím panoramatický snímek. Nechávám celý původní prompt a očekávám, že to přidá další postavu? Ano, přidá…
To vůbec není špatné. Vybírám třetí obrázek a dělám Upscale.
Můžu pokračovat pouze směrem doprava a doleva. Mažu z promptu popis postavy a nechávám jen pohled na město ze střechy.
Některé z těch nových kousků jsou vcelku fuj, ale vybírám poslední, upscaluju a do promptu přidávám, že chci konec města. Snad se vyhnu těm megalomanským palácům na kopci.
A dostávám dalšího člena do party a jako bonus třetí západ slunce. Západů slunce není nikdy dost, když bude mít každý svůj vlastní, aspoň se o ně nebudou hádat…
Tak znova. Vymažu záběr přes rameno, protože tomu zjevně Midjourney rozumí tak, že tam musí být rameno a to rameno někomu patří, takže ten někdo musí být přítomen a vygenerován. Široký záběr a dodávám, že chci konec města.
A dostávám další rušné kusy města a další západy slunce. To už bude spíš katastrofa planetárního rozsahu…
Můžu mít prosím nějaké údolí a hory?
Ne. Ale můžu mít dálnici o dvaceti osmi pruzích, žhavou eiffelovku nebo bulvár vedoucí k paláci. Se západem slunce.
Znovu, krajinu a hory. Ne, ne, ne a ne.
A co třeba krajinu s vinoucí se řekou a horami? A tady už si rozumíme… Kupodivu nejstravitelnější je ta varianta se čtvrtým členem do party a rozkvetlou třešní. A dalším západem slunce.
Vzdávám panorama, teoreticky má Midjourney možnost vytvářet obrázky do formátu 10:1, pokud na to máte trpělivost, směle do toho.
Já přeskočím k dalšímu novému parametru. –weird dělá přesně to, co říká. Vytváří divné, zvláštní až bizarní obrázky. Zatím je ve stádiu experimentu, může mít hodnoty 0-3000. Pokud chcete divné, ale pořád pěkné obrázky, doporučuje se používat spolu se –stylize, s oběma hodnotami stejnými. –stylize končí u 1000, takže cokoli –weird s hodnotou nad 1000 bude opravdu zvláštní.
Dáme koně cválající na pláži, na tom není nic divného.
A postupně přidávám hodnoty –stylize i –weird, nejdřív 100.
Pak 400.
A pak 1000. Ty obrázky jsou netradiční, ale nijak prapodivné.
A teď –weird 2000 a bez –stylize. A tady už se dostávám do světa natažených zeber a koňů dalmatinských. Parametr je to zajímavý, ale mně přijde že v současném stavu generativních obrázků ho zatím moc nepotřebujeme, podivnosti se generují při každé příležitosti náhodně…
Co je Turbo mode? Generování obrázků extra super rychle. Zatímco běžně generování gridu se čtyřmi obrázky trvá asi minutu, plus další až minutu strávíte čekáním, než se vůbec začne a než si Midjourney ošetří svoje vyrážky a jiné problémy, Turbo Mode trvá… několik sekund. Tedy od startu generování. Ty problémy okolo to neřeší, ale toho se snad taky dočkáme.
Vidíte srovnání v reálném čase při běžném, Fast módu, a při zapnutí Turbo módu.
Při každém přepnutí mezi Fast a Turbo jste upozorněni, že tohle polyká vaše peníze a generovací minuty také v módu Turbo.
Generování by mělo probíhat čtyřikrát rychleji, protože se děje na rychlejších grafických kartách a stojí dvojnásobek toho, co generování ve Fast módu. Pokud máte příliš mnoho minut na konci měsíce a chcete je utratit co nejrychlej, už víte jak.
Pokud si teď pokládáte otázku, jestli mi došla inspirace na prompty, nebo sdílím datum narození s nějakým dinosaurem, nebo mám velmi podivný hudební vkus tak odpověď je: Ano.
A poslední novinka.
Někteří umělci se domnívají, že když vytvoří prompt o třech odstavcích, proloží ho dlouhými slovy, kterým nikdo nerozumí, pěti různými interpunkčními znaménky a zapálí nad ním vonnou tyčinku, tak se přihodí nějaká nadpozemská magie a z promptu vyskočí gonády-rvoucí, v této galaxii dosud nevídané umění.
My ostatní používáme zdravý rozum a srozumitelné věty nebo výrazy oddělené čárkami.
Pokud si nejste jistí, do které kategorie patříte, Midjourney nabízí nový příkaz /shorten, zkrátit prompt.
Začnu ne úplně rozumným promptem, opět z kategorie populárních melodií.
Výsledek je očekávaný – když nevím co, postavím tam modelku s dramatickým výrazem. A jsou tam v promptu vyjmenované barvy a nebe.
Příkaz /shorten se pokusí mi poradit, která slova jsou zásadní, ty zvýrazní tučně, a ta zbytečná přeškrtne.
Kupříkladu v tomto promptu jsou důležité všechny barvy. Co je zbytečné jsem „já,“ s tím těžko polemizovat… Dále je zbytečné anglické „could,“ pak zase já a pak je důležité… „could.“
Jestli se teď chytáte za hlavu a přemýšlíte o návratu k vonným tyčinkám, nezoufejte a napište do promptu něco smysluplnějšího, ono to funguje docela dobře na běžné věty a výrazy.
Dostávám pět možností od lehce zkráceného promptu po brutální průřez poezie do tří slov…
Nicméně pokud se nudíte a potřebujete nějaké umění, které byste sami nevymysleli, jste tady dobře.
Z těch novinek, které nejsou nikde vidět a jen se o nich mluví… Midjourney výrazně vylepšilo práci s webovou galerií a jistě to souvisí i s tím, že se vývojáři do budoucna snaží vytvořit plný webový přístup k Midjourney. Protože Discord je jistě pro masy budoucích platících zákazníků velmi těžce stravitelné sousto.
Už se nemluví jen o budoucí verzi 6, ale i o verzi 7… Já si z toho dělám vlastní závěr, že je za tím snaha Midjourney zůstat na špičce a nevyklízet pole větším hráčům… Zároveň ale vidím, že open-source komunita se žene kupředu neuvěřitelným tempem a držet s ní krok a přitom nabízet stabilní výkon a výsledky platícím uživatelům není vůbec jednoduché. Pokud to tak nevidíte, tak je to jednak v pořádku a jednak vám asi unikají některé zásadní současné generativní open-source nástroje. A k těm se dostanu zase příště.