AI

Tady AI

Novinky v Midjourney verze 5

Midjourney verze pět je jednou z novinek minulého týdne. Pro mnohé to není až takové překvapení. Všichni platící uživatelé měli už v předešlých dnech možnost pomoci Midjourney s dalším vývojem. V páru podobných, nebo úplně rozdílných obrázků, zvolit ten, který se uživateli líbí víc a kliknutím ho označit. Rozhodování mělo být míněno vážně, a ti nejaktivnější klikači stále každý den vyhrávají jednu hodinu použití Midjourney navíc.
Často je z páru těžko vybrat ten lepší, někdy jsou oba stejně dobré, někdy stejně nepovedené. Nicméně příklon k větší fotorealističnosti se dal vypozorovat už před spuštěním verze 5.

V tomhle videu nebudu pro generování výsledků a popis mnohých funkcí používat češtinu. Midjourney sice nějaké další jazyky umí, ale čeština to zjevně není. Jako s většinou nových a převratných nástrojů, buď anglicky umíte, nebo se v angličtině dokážete orientovat alespoň na základní úrovni. Jiná možnost tady a teď není.
Pokud o Midjourney slyšíte poprvé, a v následujících minutách budete hledět v úžasu, co to umí a poté s hrůzou, jak složitě to na první pohled vypadá, uklidněte se. Návod na první kroky s Midjourney, Discord serverem, registrace a zaplacení měsíčního poplatku a základní práce s promptem včetně používání parametrů bude následovat v příštím videu.

V tuto chvíli je nová verze 5 přístupná pouze platícím uživatelům, na trial verzi se k ní nedostanete. Výpočetní výkon je přednostně vyhrazen těm, co platí, což je fér.
Platícím uživatelům je také nově nabízen tištěný(!) časopis Midjourney, z výběrem těch nej… něco obrázků. Vycházet bude měsíčně. Jedno číslo je zdarma, každé další za 4 USD.
Úplně nevím, co si o tom myslet. Pamatuje si na tištěný časopis Internet? Vy asi ne, ale já ano. V devadesátých letech minulého století vycházel český časopis Internet. Byl v něm výběr “toho nejlepšího z internetu,” včetně smajlíků psaných z dvojteček, pomlček a závorek, obvykle bylo přidané CéDéčko, to je taková ta stříbrná placka, co se strká do mechaniky počítače. Počítač, to je taková ta velká bedna, co ji někteří z nás stále používají, protože umí o něco víc než váš mobil…
V době desktopových počítačů, CRT monitorů a vytáčeného připojení k internetu za cenu “typickou pro specifický český trh” měl takový časopis smysl. Časopis Internet zaniknul někdy okolo roku 2003, asi že se ty věci z internetu daly snadněji najít na … internetu?

Jaký smysl má v roce 2023 tištěný časopis, složený z obrázků, generovaných online uživateli internetového generátoru digitálních obrázků, to přesně netuším. Tedy krom smyslu vygenerovat další reálné dolary na bankovní účet Midjourney.

Co je tedy nového a převratného?
Není to práce s textem, Midjourney V5 je stále stejně neschopná vkládat rozumné texty nebo písmena do obrázků. Ale údajně má být schopná nevyžádané písmenkové projevy vkládat do obrázků méně až vůbec.

Za to byla výrazně zlepšena kvalita obrázků obecně, fotorealismus je nejviditelnějším pokrokem nové verze. Též se zlepšila práce s rukama, texturou kůže a zuby. Už tedy žádné tříprsté obludy s širokým úsměvem, hrdě ukazujícím všech 89 zubů.

Verze 5 nově podporuje jednodušší jazyk promptu. Verze 4 nutila uživatele k používání černé a jinak barevné magie – ladění promptů pomocí slov, která jste předtím nikdy neslyšeli, ale zaručeně všem ostatním prý fungují. Vkládání množství nesouvisejících slov, oddělených čárkami, zdůrazňování kvality pomocí vyjmenování všech herních enginů a fotografických procesů, které znáte, a další temné a zázračné triky.

Nově máte použít běžnou větu, popisující objekty a to, co se kolem nich děje. Kvalita by se měla přihodit sama od sebe, vypisování slov jako „8K“ nebo „highly detailed“ nepomůže. Zmínka o „Unreal Engine“ vám z obrázku místo fotky udělá screenshot z herního prostředí, což výsledné kvalitě asi nepomůže.

Vyšší kvalita generovaného obrázku se pozná hned v náhledu. Už grid se čtyřmi variantami je upscalovaný, pokud požádáte o Upscale, obrázek už se nezvětší. To znamená, že Upscale se provede okamžitě bez čekání. Pokud si platíte nejnižší variantu za 10 USD měsíčně, kde se i každý Upscale počítá do vaší měsíční útraty, můžete ušetřit a obrázky si rozřezat v grafickém editoru.
Komentujícím, kteří budou upozorňovat, že nejnižší platba je 8 USD měsíčně, si dovolím připomenout, že to pouze v případě, že jste zaplatili na celý rok dopředu. A vzhledem k tomu, jak rychle se technologie vyvíjejí a ty největší firmy ohlašují bombastické trháky prakticky každý den… nezbývá než vám pogratulovat ke skvělé investici na celý rok 🙂

Do verze 5 se vrátila možnost dělat „seamless texture“ neboli „tiling.“ Tato možnost už byla ve verzi 3, ale ze čtyřky zmizela. Můžete vytvářet bezešvé vzorky a libovolně je skládat vedle sebe jako kachličky v koupelně. Vyrábíte-li 3D nebo herní objekty, přesně víte, co s takovými texturami dělat.
Tady zkouším namixovat kočky a psy. Výsledek teda nic moc, ale je to seamless, konec jednoho a začátek druhého obrázku navazuje perfektně.

Aspect ratio, tedy poměr stran obrázků, je ve verzi 5 jakýkoli. Verze 4 byla omezená na maximální poměr 1:2 nebo 2:1. Ve verzi pět můžete udělat klidně jednopixelovou čáru. Sice nevím, proč byste to dělali, ale udělat to můžete.
Zkouším zaplnit dlouhý pruh domečkama, na výšku i na šířku. Josefa Ladu to asi nezná, ale jistý druh zjednodušení až ilustrace by se tam najít dal.

Zlepšit se také měla práce s mixování obrázků a textu, nebo dvou obrázků. V Midjourney můžete vygenerovat obrázek buď z textového promptu, z jednoho obrázku a textového promptu, nebo ze dvou obrázků. Nově také můžete použít Image Weight, váhu obrázku, parametr, který říká, jak moc velkou váhu je třeba dát na obrázek, nebo jak velkou váhu dát na který ze dvou obrázků. Hodnota Image Weight je mezi 0.5 a 2, čím větší váha, tím bližší bude struktura výsledného generovaného obrázku.

V rámci variant je také možno dělat Remix. Máte-li v Nastavení zvolen Remix, pak při vyžádání variant můžete kompletně změnit text, výsledek pak udělá mix mezi původním obrázkem a novým promptem. Toto už fungovalo v minulé verzi, ale teď by mělo fungovat lépe.
Já tady zkouším nahradit domečky sovama, a zároveň změnit poměr stran obrázku. Strany jsou, jak mají být, sovy jsou prapodivné, patrně generované do velikosti předchozí nudle. Dalo by se s tím asi něco udělat, ale ten výsledek za to stejně nestojí. Z mého pohledu se děje totéž co v předchozích verzích. Požádáte-li o variantu, výsledek je často horší než originál a varianta z varianty je mnohdy docela tragická.

S novou verzí Midjourney přichází i více moderátorů na Discord a zároveň více bezpečí a delší seznam banovaných slov. Regulace pornografického materiálu na veřejně přístupném serveru se dá chápat. Nicméně nyní nejenže si nevygenerujete kojící matku nebo umělecký akt, údajně se nově nedají použít ani slova jako „chest.“ Krom hrudníku to taky znamená truhlu, a ve spojení „chest of drawers“ je to běžně používané slovo pro komodu, tedy kus nábytku, perfektně přístupný všem věkovým kategoriím.
Názorné ukázky tohoto jevu si dovoluji negenerovat a neuploadovat na Youtube.

Můj první dojem z Midjourney V5 je ne úplně radostný. Vylepšení jsou vítaná, ale nijak zásadní. Budu-li chtít generovat obrázky k nerozeznání od fotek, udělám to zdarma na lokálně instalované Stable Diffusion, ale lze to udělat i leckde jinde online, také zdarma, s nějakými omezeními. Midjourney velká část uživatelů používá proto, že má svůj vlastní styl a generuje velmi typicky rozeznatelné obrázky. Verze 4 je nyní stále použitelná, stejně jako všechny předchozí verze, ale krok směrem k verzi 5 možná naznačuje, že to tak nemusí být navždy.

Midjourney V4 je jedním z nejoblíbenějších generátorů obrázků a nejspíš bude nezapomenutelným milníkem v historii uměle inteligentní revoluce, a přijít o něj příliš rychle by podle mě bylo škoda.