AI

Tady AI

Midjourney – Style references

Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.

Odkazy ke stažení:
Tahák ke Style references

Midjourney updatovalo alfa verzi 6, a přidává zajímavou funkci: Style references.
Jde o použití referenčního obrázku jako vizuálního stylu.
Nejde o míchání obrázků dohromady, ale o vygenerování nového z vašeho textového promptu a z referenčních obrázků se bere jejich vizuální styl, ne jejich obsah. A podle toho, co uživatelé od včerejška, kdy se tato funkce objevila, tvoří, to vypadá hodně zajímavě.
A já se hned pustím do zkoušení.
Měním nastavení, takže budu stále používat verzi 6, bez dalšího psaní do promptu, automaticky.

Nejdřív vytvořím jeden obrázek bez nové funkce. Prompt je:
Krásná ledová socha majestátního lva v místnosti s dalšími ledovámi sochami které září, jsou rozostřené v pozadí, světlo zezadu a studiové nasvětlení. Poměr stran 16:9 a –style raw
K promptu se automaticky přidává verze 6

Uploaduju obrázek do Midjourney, kopíruju prompt a přidávám k němu –sref, vkládám adresu obrázku… a dostávám lva ve výrazně jiném stylu.
Výchozí hodnota Style references je 100 a hodnoty jsou mezi 0 a 1000.
Vyzkouším ten samý prompt s hodnotami 500 a 1000.
Moc v tom nevidím rozdíl, ale je pravda, že míchám oheň a led, takže výsledek je trochu extrémní.

Obrázků ovlivňujících styl můžete vložit víc do jednoho promptu. Uploaduju ledovou texturu, kopíruju předchozí prompt s jedním obrázkem a přidávám nakonec i druhý obrázek, nechávám výchozí nastavení.
A výsledek je jasně rozdílný, vidím jak kudrlinky zmrzlé předlohy, tak rozpukaný povrch lávy.
Vyzkouším prompt s váhou –sw 500
Je to jiné, ale nic extra.

A teď vyzkouším rozdílnou váhu obou obrázků. První odkaz je láva, dávám váhu ::5, druhý odkaz je led, dávám váhu ::1 a maximální síla stylizace –sw 1000
Docela zajímavý výsledek. Váhy obrázků jsou podle některých uživatelů rozbité, ale v tomhle příkladu těžko říct…

Zkusím něco jiného. Tato funkce funguje i v Niji verze 6, takže zkusím nějaké anime ve stylu něčeho jiného.
Jako první kontroluju nastavení, používám verzi 6 a přidám –style raw
Prompt je: Děti si hrají venku na ulici, poměr stran 16:9
Dostávám různé styly, přesně jak je zadáno v promptu.
Uploaduju obrázek, který je chráněn autorskými právy, ale používám ho v souladu s pravidly fair usage, takže se ničeho špatného nedopouštím. Pochopitelně pokud byste takový obrázek použili k něčemu třeba výdělečnému, velmi pravděpodobně porušujete zákon, a u žijících autorů tím ve většině případu autora dost štvete, takže to snad radši nedělejte.
Ve výsledku vidíte, že tady je ten styl jasně znatelný i ve výchozí síle stylu. Zkusím to i s maximální sílou stylu –sw 1000.
Obrázek není jako od Lady, ale je tam jasně znatelný nějaký styl.
Uploaduju jiný obrázek, tentokrát Van Gogh a jeho zelená pole a používám ho ve výchozí síle stylu.
Ta trojka je trochu mimo mísu…
Zkombinuju oba obrázky a budu chtít anime…
Tohle vypadá hodně dobře… opět zkouším se sílou stylizace 500, což je někde v půlce a 1000, což je maximum.
Tohle je stylizace 500, líbí se mi mraky a vrcholky hor… figurky jsou buď nedokonalé, nebo prapodivně animované.
A tohle je stylizace 1000, kromě mraků jsou propracované i stromy a domečky, a postavy mají konkrétní tváře.
Nicméně kdybyste se mě zeptali, která stylizace je silnější a která slabší, tak na první pohled nevím…
Zkusím ještě, jestli něco dělá změna váhy, van Gogh ::1, Lada ::4
Je to víc ladovské, vcelku jasně.
Já myslím, že už chápete, jak to funguje, a ještě jednou zopakuju, čím se to liší od už dlouho existujících funkcí /blend a vkládání obrázku přímo do textu promptu – tyto funkce generují mix obrázků nebo mix obrázku a promptu, tedy berou si z obrázku jeho obsah, třeba portrét, zvíře, nebo budovu.
Style references používá vložený obrázek pouze jako předlohu stylu, který chcete ve výsledném obrázku, nebere se z něj obsah obrázku, ten popíšete v promptu. To jste viděli třeba s van Goghovým zeleným polem, v něm si žádné děti na ulici nehrály. Děti byly v textu promptu, z předlohy byl použit vizuální styl.
A protože tohle je docela komplexní funkce, tak k ní vytvářím tahák, pro vás, zdarma, ke stažení.
Odkaz je pod videem a taky na webu v textu.

Style references je alfa verze této funkce, v průběhu týdnů se nějakým způsobem změní, takže zkoušejte teď a počítejte s tím, že nemusíte být schopní reprodukovat to samé třeba za měsíc.
Pokud je váš prompt v realistickém stylu jako fotografie, a jako referenční obrázek používáte ilustraci nebo výrazně jiný styl, je ideální to popsat i v promptu, protože to nemusí fungovat jen na základě obrázku.
Style references nemá vliv na čistě obrázkový prompt, pokud byste použili jako prompt jen obrázek a nějaký další jako Style references, tak to bude ignorováno. Styl references ovlivňuje jen textovou část promptu.
A poslední bod, na který se všichni těšíme: tohle celé je cesta nejen ke konzistentnímu stylu generovaných obrázků, ale také ke konzistentním postavám, které tím pádem budete schopni používat jako vaše filmové herce, postavičky do komiksu, knížky nebo hry.