Midjourney 6 umí psát
Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.
Midjourney verze číslo 6 byla vypuštěna do světa před dvěma dny. Zatím je to jen alpha, ale učitě stojí za vyzkoušení už teď.
Co je nového a co je jinak?
Podíváme se do oznámení na Discordu.
Šestka by měla přesněji provádět váš prompt a být schopná lépe zvládat delší prompty.
Bude potřeba se znovu “naučit” psát prompty. Měly by být jasné, jednoznačné, žádná zbytečná slova k vylepšení kvality, jako “award winning, 4K, photorealistic.”
Následují dva řádky anglického marketingového blábolení, které neříká vůbec nic.
Malá, ale existující schopnost generovat texty do obrázku. Pokud je napíšete do uvozovek a dodržíte doporučené nastavení stylu.
Vylepšené upscalování. To už je v Midjourney nějakou dobu, ale podle mě to nestálo ani za zmínku, protože upscalovat cokoli, tedy i obrázky z Midjourney, lze jinde, zdarma a lépe.
Přeskočím do závěru oznámení, kde se říká, že tohle celé je alpha test, tedy za pár týdnů může být vše jinak, a mělo by být jinak, a lepší. Všichni jsme testovacími zvířátky a s chutí si hrajeme, abychom vylepšovali Midjourney budoucnosti.
Šestka je pomalejší a “dražší” než předchozí verze 5.2., nicméně rychlost už byla zvýšena pár hodin po prvotním oznámení. Mně osobně přijde rychlost generování srovnatelná, jediná pomalá záležitost je Upscale, ale ten je pomalý v každém nástroji prostě z principu toho, jak Upscale funguje.
Zpátky k jednotlivým funkcím. Některé parametry a příkazy ještě nefungují, ale to se časem změní. Prozatím chybí Pan, Zoom a Vary (Region), tedy inpainting a outpainting, chybí nová funkce /tune, která je relativně složitější a /describe funguje, ale používá model z verze 5.2, tedy úplně jiný model.
V závěru oznámení se Midjourney chlubí tím, že na modelu 6 pracovali 9 měsíců a byl vytvořen úplně od začátku, tedy měl by být výrazně jiný, než předchozí verze.
Ale dost keců a vrhám se na obrázky.
Verzi 6 si zapnete v Settings, a pak se bude používat pořád jako default. Nebo si necháte jako default verzi 5.2, a pak budete psát do každého promptu zvlášť verzi. Tu druhou možnost použiju v tomhle videu, abyste to jasně viděli.
Silná stránka šestky by měly být detaily v záběrech zblízka, jako třeba kůže nebo vlasy.
Tady mám asi měsíc starý prompt, který se mi líbil: Hluboký nádech, v modré a oranžové, dramatické osvětlení, filmový záběr.
Zkopíruju si prompt jen jako text, aby Midjourney vůbec netušilo nějakou souvislost mezi tímhle a novým promptem. Přidávám verzi 6 do promptu.
Dostávám vizuálně hodně podobné výsledky. Při prozkoumání detailů vidím, že i když ve staré verzi byly detaily kůže a kouře hodně dobré, v šestce jsou víc přirozené. Ve staré verzi se při zvětšení zdá, že kůže má velmi pravidelný digitální rastr, zatímco v šestce tohle nevidím.
Tady mám z verze 5.2 obrázky pseudoPrahy v sedmdesátých letech dvacátého století. Zkopíruju si z webové galerie prompt, vložím na Discordu… a automaticky se v něm vložila na konci verze 5.2. To samozřejmě měním na 6… a nechám jeden prompt se –stylize 400 a hned za to vložím druhý, kde –stylize vymažu, takže bude v defaultu, 100, a místo toho použiju –style raw, takže by to mělo být fotograficky realističtější.
Prompt je: Fotografie rušného hlavního města v komunistické zemi jako Československo v sedmdesátých letech, kdy všechno stálo za prd.
První verze se –stylize je barevnější, je tam víc úhlů pohledu a různé denní doby. Druhý prompt je realističtější – fotky jsou černobílé, ta jedna barevná má opravdu barevnost bližší k vyšisovaným padesát let starým fotkám.
Další pokus. Před měsícem se mi nedařilo vytvořit produktovou fotku, kde někdo maže nožem máslo na chleba. Na česky vypadající chleba vůbec, na toastový, hranatý chleba… taky skoro vůbec. Výsledky byly skvělé jako parodie na umělou inteligenci, ale k reálné fotce jim chybělo docela dost.
Vyzkouším stejný prompt, protože podle mě splňuje to, co nová verze vyžaduje.
Žádná sláva, ale je to lepší. Nůž vypadá jako nůž, nikdo mě nepřišel zabásnout a zkonfiskovat počítač za použití slova “nůž,” toasty vypadají líp než předtím. Nicméně mazání tří krajíců jedním tahem je takové… uměle neefektivní. Nepopsat tvar toastu byla zjevně školácká chyba. Informace o tom, že když máte tři krajíce chleba, tak patrně pocházejí ze stejného bochníku nebo stejného balení, a tudíž mají velmi pravděpodobně stejný tvar, nebo alespoň stejný počet rožků, je asi známa pouze lidem, ne však strojům.
Napravím svou chybu způsobenou lidským faktorem, a použiju jiný starší prompt.
Vymažu realistické, a nechávám: foto ruky, která maže máslo na ČTVERCOVÝ krajíc chleba, ve stylu reklamní fotky, filmového záběru se studiovým osvětlením a vyváženými barvami, a přidávám verzi 6.
A mám čtveratý chleba… většinou… a máslo opravdu maže ruka, ne nůž… Opět ta hloupá, lidská chyba! Stroj mě musel opravit, máslo se přece maže nožem o délce 3 centimetrů, který magicky končí někde v dlani a nikam nepokračuje.
Ještě jedna dobrota. Prompt je: Čerstvý mňamózní toast na dřevěném prkénku. Ač dnes není Štědrý den, Midjourney mi dopřává skupinku… nebo stádečko? chutně vypadajících toustíků, támhle s máslem, tadyhle s kusem sýra… Máte hlad?
Stejný prompt, ale maximální hodnota –s 1000.
Očekávám, že dostanu toast namazaný sýrem, obložený šunkou, rajčaty a plátky vajíčka.
Dostávám toasty více připálené, ale nějaká ta zeleninka se taky najde… a ovoce, protože rajče je ovoce, to všichni víme, že jo?
A do třetice všeho dobrého, přidám maximální –chaos 100.
No ale kde jsou moje obložené chlebíčky na stříbrném podnose? Kdo se prosil o suchý krajíc s malinama, buchtu s jehličím a toast s jedním tenkým plátkem sýra uvnitř?
Ale ty detaily jsou taky pochutnáníčko, ne? Cukr na malinách, cukr na stole… Já teda nevím, jestli ten bílý prášek všude okolo chlebů je cukr, sůl, hladká mouka nebo kokain, ale budu předstírat, že je to cukr…
A k tomu snítka jehličí na perfektně vypečeném… něčem… Jo tohle asi bude francouzský toast, protože cukr… A tady kape máslo uprostřed… hotovej food porn.
A nakonec zvířátka.
Mořská želva na pláži při západu slunce. Západy slunce Midjourney umí skvěle, ne?
No… možná ne… ale o to nejde. Upscale jedné varianty a zkusím, jestli jde nějak nahradit inpainting. Vidíte, že možnosti jsou teď omezené, téměř nic tu není.
Zkouším Vary (Subtle), měním nejdůležitější slovo promptu, želvu, za racka. Očekávám víceméně stejný obrázek.
Není to úplně ono. První je asi nejblíž, druhý obrázek – racek má dvě půl nohy, poslední racek má tři nohy, což je škoda, ten se mi taky líbí.
Bude potřeba počkat na Inpainting.
Vyzkouším, co umí Upscale ve verzi 6. Tyto verze jsou odlišné od verze 5.2, která má upscale 2x a 4x.
Tady je k dispozici Upscale Subtle, to bude zvětšení, které přidá detaily tak, aby bylo co nejvěrnější původnímu obrázku, a Upscale Creative, který bude s přidáváním nových detailů kreativnější.
Oba Upscaly jsou zatím jen dvojnásobné, ale předpokládám, že to se bude v budoucnu měnit.
A i v malém náhledu je vidět rozdíly.
Já je oba stáhnu a zvětším. Na originále si všímám krunýře, je na něm písek. Všímám si zpěněných vln na pláži a písku před želvou.
Upscale Subtle zvětšil věrněji, ale písek na krunýři vypadá spíš jako nějaký mech. Tvar vln zůstal zachován, a písek vypadá stejně, dokonce je tam i odlesk zapadajícího slunce na rozostřených zrnkách písku uprostřed.
Upscale Creative byl kreativnější. Písku na krunýři je méně, ale vypadá přirozeněji. Vlny mají jiný tvar a zmizelo z nich oranžové světlo slunce, stejně tak písek, úplně tu chybí odlesky sluníčka.
Mně se líbí víc Upscale Subtle, ale tohle bude vždycky záležet na každém obrázku, který zvětšujete. Též je to dobrý způsob, jak z vás Midjourney vytáhne víc peněz, pokud bude experimentovat s každou fotkou.
A to vlastně ještě není konec, ještě budeme psát písmenka!
Tady je rudý komunistický plakátek, zase je asi měsíc starý, takže z verze 5.2, dělám čerstvý Upscale. I když to znamenalo stisknout tlačítko s písmenem U2, tak na konci promptu už není Upscale, ale Image #2. To je proto, abyste nebyli zmatení z těch různých Upscalů a ne-Upscalů napříč celým Midjourney… Snad to časem nějak přejmenují.
Můžete si porovnat, kolik nástrojů má verze 5.2.
Ale já si to teď remixuju do verze 6 a pokusím se přidat úderný nápis „V jednotě je síla“
S češtinou to teda docela zápasí. Budovatelské tváře jsou skvělé, jasně vyjadřují to zapálení pro budování socialistické vlasti a soudružské zaujetí vzájemnou hospodářskou výpomocí!
Možná zkusím něco méně rozžhaveného do ruda…
Krásná česká krajinka s poházenými domečky, les v pozadí, všechno v zimě a zasněžené, modré nebe, sluníčko a nápis „Merry Christmas“ modrými sněhovými písmeny.
Písmenka tam jsou, dvakrát bílá, jednou přilepená na chaloupku… Krajinka vypadá pěkně.
Ještě jednou, ale s nápisem „Veselé vánoce.“
No teda… jeden pokus v černé, dva v modré, všechno natřené na stěnu domu. Nic není správně. Krajina je podle mě lepší…?
A do třetice, podle manuálu, přidávám –style raw.
A žádné veselé vánoce se nekonají. Krajina je ještě o něco lepší, velmi subjektivně. Ale ani písmenko.
Na alpha verzi je to hodně dobré. Budeme si muset počkat na plnou verzi, protože těch nedostatků je docela hodně… Na druhou stranu mi v posledním asi měsíci přišlo, že Midjourney ujel vlak a všichni ostatní, včetně třeba Dall-e v Bingu, ho předbíhají. Ale vlak neujel. On ten vývoj nějakou dobu trvá a my jsme si za poslední rok zvykli, že generativní AI nabízí zázraky ihned a nemožné už předvčerejškem.
Otázka je, jaká bude finální verze 6 a další verze 6.něco, a jestli v té době ještě bude stát za to platit si za Midjourney, když konkurenční nástroje budou možná nabízet víceméně to samé za lepší cenu nebo zadarmo.
Uvidíme. Uvidíte i vy, zase na tomhle kanále.