Midjourney: Jak udělat z kočky tygra
Úkol zněl jasně. Vyfotit tygra. Nebo aspoň kočku a udělat z ní tygra.
Když jste pan učitel s dobře známým twitterovým účtem, vždycky se najde někdo ochotný, kdo vám pomůže. Třeba já.
Já sice nemám tygra vhodného k focení, ale mám dobře ochočené Midjourney, a nebojím se ho použít.
Bylo nás ochotných víc a vyžádali jsme si nějakou fotku Dis v tygří poloze. Mě už předtím zaujala ještě jedna starší fotka, těm roztomilým očím se nedá odolat…
Otvírám Discord, klikám se na vlastní server, kam mimo mě může ještě Midjourney Bot, takže nás nikdo nebude rušit, a uploaduju roztomilé oči.
Budu používat prompt, který začne odkazem na obrázek a ten obrázek budu mixovat s textovým zadáním, za popisem scény budou následovat různé parametry.
Určitě tam bude –v 5, což je poslední verze Midjourney, číslo pět, která umí od reality nerozeznatelné fotky.
Dál tam bude –iw, to je image weight, váha obrázku. Má hodnotu od 0.5 do 2, a čím větší je váha obrázku, tím podobnější fotce bude výsledek. Čím menší váha obrázku, tím víc se bere ohled na textové zadání.
Další parametry jsou poměr stran, –ar 16:9, a záporný parametr –no, za kterým následuje, co v obrázku nechci, tedy text, písmena a zbytečné rámečky.
První prompt: Filmová fotografie tygra, se svěžím zeleným pozadím, které je rozostřené a s paprsky slunce prosvítajícími zezadu přes listy.
Ten první výsledek je nic moc, část je umělecky zakryta asi kusem listu?
Nevím, zkouším to znovu, přidávám, že nechci nic v popředí ani tmavé stíny, měním váhu obrázku.
A dostávám tmavé stíny a zase něco v popředí.
Měním trochu textový prompt, popisuju tygra v lesích Sumatry a přidávám nějaká slova na vylepšení barev, osvětlení, a typu záběru. Opět opakuju, že nechci žádné stíny ani rámečky.
A dostávám zdeformovanou kočku před dveřma zakrytýma květináčem a všechny obrázky mají zbytečný rámeček.
Přemýšlím, jestli začít pochybovat o inteligenci umělé inteligence, nebo o té svojí.
Možná není úplně nejlepší nápad z fotky na výšku, které dávám relativně velkou váhu v promptu, dělat obrázek na šířku? Že by ten stroj generoval přesně to, o co žádám?
Hm…
Měním výrazněji prompt, přidávám jméno fotografa, který dělá moc pěkné fotky, dávám různé váhy na různé části promptu a měním poměr stran výsledného obrázku na 4:5, tedy na výšku.
A hele. Tygr.
Tygr ztracen v lese, moc tam toho tygra není. Velká část tygra je za bukem nebo ve spadaném listí. Spíš je to tygr, co si hraje na schovávanou ve Stromovce.
Ale i to je pokrok.
Ještě jeden pokus, zkouším udělat obrázek ve stylu Carlose Saldanhi, to je ten pán, co může za animáky jako Doba ledová, a přepínám do verze Midjourney 4, která má o dost víc fantazie a představivosti.
A dostávám roztomilého tygříka v botanické zahradě.
Druhá fotka. Prompt je: Tygr chytá kořist jednou tlapou, záběr zblízka, dramatické světlo. Bez nastavení poměru stran obrázku, takže to bude čtverec.
Dostávám sadu obrázků na téma “znuděná kočka sotva plete nohama.”
Tak ještě jednou, trochu míň kočičí reality, a o něco víc fantazie.
A tohle nevypadá špatně. To stojí za uložení jednotlivých obrázků a prohlídku detailů…
Měním prompt na: Je slunečný den a tygr odpočívá uprostřed živě zelené džungle a protahuje jednu tlapu dopředu.
To vypadá dobře. Mám kočku, co je tak trochu tygr, a v pozadí je neurčitá, ale zelená džungle. Tlapky jsou místy trochu divočejší, ale všechny mají nakonec správný počet prstů a drápků.
Jen je škoda, že si kočka tygrovaná přinesla do džungle piknikovou deku…
Přidávám do promptu jméno fotografa, jehož jméno sice neumím vyslovit, ale vím, že dělá krásné černobílé fotky afrických zvířat. Proto prompt začíná slovy Barevná fotografie. Ostatní zůstává, jen trochu méně váhy na původní obrázek.
A tyhle obrázky se mi líbí. Spokojená kočička se vyhřívá na slunci uprostřed divoké zeleně.
Snad byl úkol splněn…