Adobe Firefly, první dojmy (1.)
Tři dny mi tahle pozvánka ležela ve schránce, než se mi podařilo si najít čas a vyzkoušet Adobe Firefly. Tolik se toho děje okolo umělé inteligence v posledních týdnech…
Zatímco vy se budete dívat na to, jak by mělo Adobe Firefly fungovat, až bude hotové, já vám řeknu pár zajímavostí o Adobe. Pro případ, že se dívá i někdo, kdo vůbec netuší kdo nebo co Adobe je.
Svého času jednička v oblasti Desktop Publishing, DTP, počítačové sazby, Adobe může za existenci slovesa „photoshopovat“ v češtině i v původní angličtině. Kromě grafických editorů jako je Photoshop nebo Lightroom,můžete znát vektorový Illustrator, InDesign, určený právě pro to klasické DTP, editor PDF souborů Acrobat, ale také video editor Premiere Pro, After Effects jako nástroj pro animace a vizuální efekty nebo Dreamweaver pro psaní a vývoj webů.
Adobe vzniklo v roce 1982 jako garážová firma Johna Warnocka v kalifornském Los Altos, v oblasti zálivu San Francisco Bay. Jméno získala podle názvu potoka, protékajícího nedaleko. A ten byl pojmenován španělským slovem adobe, to znamená nepálenou, na slunci vysušenou cihlu z bláta a slámy. Údajně to naráží an kreativní povahu firemních produktů. V Sillicon Valley vám projde kdeco, hlavně, když to je v telefonním seznamu před ostatními. Nechci vůbec nikoho jmenovat, ani Apple, Atari nebo Amazon…
Firma Adobe byla tak moc světoznámá a jistá si svou pozicí na trhu, že v roce 2017 přestala definitivně prodávat své produkty formou „zaplatím jednou a používám to do roztrhání vlastního těla nebo operačního systému“ a začala nabízet vše formou subscription, členství, předplatného… Tedy uživatel každý měsíc zaplatí, nebo nemůže nástroj používat.
Názory na tuto formu nabízení softwaru se různí, data, poskytnutá Adobe jsou, nepřekvapivě, pozitivní a uživatelé si tuto formu prý chválí a jsou jich miliony a miliony…
Teď, když všichni máme alespoň základní obrázek o počínání Adobe, vraťme se k Firefly.
Svět umělé inteligence přetéká novinkami každý den, sociální sítě jsou zaplaveny rozkošnými zvířátky, nadpozemsky nádhernými humanoidními bytostmi i uvěřitelnými fotografiemi neexistujících míst, lidí a událostí. Firmy se předbíhají v tom, kdo poskytne to nej, teď hned, všem, za nej… míň. A naláká do budoucna nej… víc uživatelů na nejkvalitnější služby. Někomu se daří lépe, někomu ne. Hra o to, zda se někdo stane monopolním dodavatelem Úplně Všeho, ™ © ® Registrovaná obchodní značka, pro váš online život, teprve začíná.
FOMO, strach z toho, že by velká firma mohla promeškat tu správnou dobu a ostrouhat, je zjevně veliká. Google už vydal Barda, svého chatbota a budoucího pomocníka ve vašich Google nástrojích a… no, podívejte se sami v mém videu.
Jak vypadá Adobe Firefly zevnitř, na začátku dubna 2023?
Po prvním přihlášení tady mám něco ke čtení. Píšou že:
Pokud se zjeví něco neočekáváného a mám obavy, mám to nahlásit tlačítkem Report.
Jako v ostatních produktech Adobe, já, jako autor, nesu veškerou zodpovědnost za to, co vytvořím.
Dál…
Chovejte se ohleduplně a bezpečně. Nepoužívejte Firefly k vytváření, uploadování nebo sdílení urážlivého nebo nezákonného obsahu, což zahrnuje, ale není omezeno na:
– pornografický materiál a nahota
– nenávistný a velmi urážlivý obsah, který útočí na rasu, národ, náboženství, vážné onemocnění, postižení, gender, věk nebo sexuální orientaci
– grafické násilí a gore
– propagace násilí
– nezákonné aktivity a objekty
– sebepoškozování a jeho propagace
– zobrazení nahoty nebo sexuálního chování nedospělých
– propagace terorismu nebo násilného extremismu
– zavádějící, nepravdivý a podvodný obsah, který může někoho reálně poškodit
– osobní informace a data
Co tady mám k dispozici.
Text to image, generování obrázků z textového promptu.
Text effect, tedy písmenka vytvořená v nějakém stylu…
A… to je všechno?
Přebarvování vektorové grafiky je v Coming soon, takže to bude někdy příště…
In exploration, v průzkumu, s podtitulem „ náhled na to, o čem sníme.“
Řeknu to ještě jednou. Náhled na to, o čem v Adobe sní, nebo možná už přemýšlejí, že by udělali.
Video už jste viděli hned na začátku,
Takže ty nástroje, o kterých sní, shrnu. Inpainting, mazání kusu obrázku, který se domaluje vygenerováním z textového popisu. Personalizovaný obsah, nevím, dál. Text to vector, z textového promptu se vytvoří vektorová grafika, ne pixelová grafika.
Extend image, jinde tomu říkají Outpainting, tedy domaluj chybějící část obrázku za hranicí obrázku, z textového zadání.
3D to Image, z náhledu to vypadá, že na holý 3D objekt se domalují textury.
Text to pattern, to znamená vytvoření seamless texture, kachliček, tohle už umí třeba Midjourney.
Text to brush. Z promptu se vytvoří štětec. To je spojení vytvoření obrázku z textového promptu, což už funguje a nastavení takového obrázku jako tvaru štětce, se kterým malujete… to standardně umí grafické editory posledních… mnoho let.
Sketch to image. Změna stylu, z kresby je vytvořen barevný obrázek.
Text to template. To je zase vytvoření obrázku z textového promptu a přidání nějaké textové šablony, ze které pak můžete vytvářet další variace, třeba narozeninová přání, nebo vánoční pohledy.
…a to je vše.
Vůbec nechci být nijak negativní, chápu, že Adobe se snaží zpřístupnit své nástroje co nejdřív, i když na nich teprve pracuje. Jen mě trochu děsí fakt, že o mnohých z těch nástrojů teprve mají sny. Ale snad to není myšleno doslova, ale v poeticky nadšené m a pozitivním smyslu.
Tak já s nadšením vyzkouším ty dva nástroje, co jsou k dispozici.
Text to image, generování obrázku z textového zadání.
Zase si něco přečtu. Adobe je vzrušené z toho, že to zkouším. Dík, Adobe.
Firefly bylo trénováno na obrázcích z Adobe Stock a dalších různorodých zdrojích obrázků, které byly pečlivě vybrány tak, aby tam nebylo nic nevhodného, a zároveň s ohledem na autorská práva autorů.
K tomu si dovolím dvě poznámky. Jednak nám Adobe sděluje, že nebyla porušena žádná autorská práva při tréninku, to znamená… Co to vlastně znamená? Že nebyly použity obrázky z těch fotobank, kde autoři obrázky prodávají s různými licencemi, tedy případně i exkluzivně, předpokládám. Protože se dá odhadovat, že autoři takových obrázků si, hypoteticky, nepřejí, aby na jejich originálním obrázku někdo trénoval nějakého bota, stroj, nástroj.
Tajemná zákoutí autorských práv budou možná v budoucnu odhalena.
Pochybuju, že by autoři v minulosti výslovně deklarovali, že jejich díla nesmí být použita nástroji, které v době vydání díla ještě neexistovaly… kdo ví.
Druhá poznámka je, že Adobe Stock už povoluje autorům nabízet obrázky generované pomocí nástrojů umělé inteligence, takže, teoreticky, obrázky použité k tréninku mohly být už ty, které generoval jiný nástroj umělé inteligence, čímž se tak trochu nuluje ta první poznámka, protože… Ty jiné nástroje generující obrázky mohly být trénovány na čemkoli. Ale to jsou všechno jen moje domněnky, nejsem ani právník, ani nikdo z Adobe, kdo opravdu ví, jak to je.
Ale takhle se k tomu tvoření obrázků nikdy nedostaneme, takže už jen stručně.
Adobe dál píše:
V generovaných výsledcích by nemělo být nic škodlivého. Dejte nám zpětnou vazbu, pokud je něco v nepořádku, vždy pro vás pracujeme na zlepšení.
Ještě jednou, nedělejte nic protizákonného.
A omezení Firefly jsou: nelze upladovat ani exportovat video obsah.
V tuto chvíli nelze použít Firefly k editaci, upravení vlastního obsahu uživatele. Firefly je vyvíjen na základě komerčního obsahu, včetně toho z Adobe Stock.
Firefly je v beta verzi jen pro nekomerční použití.
Se vším souhlasím, toto video je vytvořeno jako recenze produktu, tedy lze užít i nekomerční materiál pro případně komerční využití. Youtube má právo si do tohoto videa vkládat reklamy. Když budete hodně klikat na Sledování, Odběr, Subscribe a poctivě sledovat moje videa, tak se třeba dopracuju i k tomu, že budu mít právo ty reklamy výrazně zredukovat. Zatím vás není dost a Youtube mi tuhle pravomoc ještě nedal, takže zvažte prosím pomačkání těch tlačítek okolo… Děkuji předem, budu děkovat i potom. Zpátky k obrázkům.
Klikám na náhodný obrázek s příkladem, a tady je celé nastavení promptu, chápu.
Zpátky pro nějakou inspiraci, poučit se, jaká je struktura promptu, co tam v těch příkladech je a není…
Věty v přirozeném jazyce, popis scény. Krátký prompt o pár slovech. Prompty s popisem stylu, světla, charakteristiky objektu. Druh záběru, druh média, jasně.
A dole je řádek promptu… Tak já rovnou začnu s porovnáváním, to chcete všichni vidět, že?
Budu porovnávat… S Midjourney. To byste nečekali, co? Já netvrdím, že Midjourney je nejlepší ze všech, ani proto, že nachytalo už mnoho lidí na té svojí realističnosti. Jsou i jiné nástroje, ve kterých můžete dělat hodně realistické obrázky. Ani mě Midjourney neplatí a nesponzoruje, spíš naopak, já jsem běžný uživatel, který za Midjourney platí. A vážně se nemusíme v komentářích hádat, kdo nebo co je lepší. Já osobně budu porovnávat obrázky z Firefly s obrázky z Midjourney, protože v tuto chvíli považuju Midjourney za online nástroj, který poskytuje nejširší rozsah možností a stylů.
Jako první zkusím zopakovat něco z mojí galerie. Silná stránka Midjourney, krátký prompt začínající slovem Imagination, verze 4, takže verze s dost vyhraněným názorem na to, jak má vypadat líbivý obrázek. Svět v zavařovačce, s dramatickým nasvětlením. Tady vidíte prompt.
A budu co nejvíc fér, nebudu vnucovat Adobe prompty vyladěné pro Midjourney, budu je přepisovat do srozumitelného jazyka.
Tady to je. Úžasná představa nádherné krajiny ve sklenici s dramatickým osvětlením. Žádné nastavení nikde neměním.
To není vůbec špatný, na první pokus… Dramatcké osvětlení znamená blesk, ale proč ne. Mám čtyři varianty, to je takový umělointeligentní standard, asi.
Můžu obrázek ohodnotit, a můžu si ho stáhnout? Můžu, ale musím si nejdřív něco přečíst. Adobe bude vkládat do obrázku značku, že to bylo vytvořeno AI. Tak proč ne, je to beta, je to pravidlo, nevidím v tom problém. Tady je toho víc o tom značkování. Já myslím, že se brzo dostaneme do stavu, kde bude existovat něco jako DRM, ale pro AI. Ale zpátky k obrázkům.
Začnu s nastavením. Vpravo nahoře mám možnost změnit druh obsahu, klikám na Fotografii, očekávám o něco realističtěji vypadající obrázky.
No, vypadá to pěkně. Tady je možnost vložit obrázek do Firefly galerie, vyzkouším co to dělá. Nic zásadního, asi.
Měním typ obsahu na nic, None, žádný styl. Jo, teď to vypadá výrazně jinak. A teď ještě Art. Mám pořád čtyři stejné obrázky, tedy něco jako obdoba seed v Midjourney, seed se nemění, mění se jen styl těch obrázků. Takhle to chápu.
Další nastavení. Měním poměr stran na 16:9, není to volný výběr jakéhokoli poměru stran, jen tyhle přednastavené. A pod tím Populární styly, zkusím Vrstvený papír.
Tak teď se ty obrázky změnily výrazně, mně se tenhle poměr stran líbí víc a ty obrázky taky. Znovu zkouším použít změnu Content Type, z Art na Graphic.
Nebojte se, že neukazuju detaily ve velkém zvětšení, k tomu se dostanu pozděj, já si obrázky stahuju k sobě na disk, a zvětším si je pořádně a okomentuju detaily, uvidíte to ke konci videa.
Zkusím další nastavení, změna na Digital Art, a pod tím Vibrant Color, Dramatic lighting, to tam teď bude dvakrát, tak by to mělo být extra dramatické. A Makrofotografie, tedy očekávám přiblížení k tomu světu uvnitř sklenice a nádherné detaily přes celou obrazovku.
A nebo ne…
Nevadí, co dál.
Zkusím jiný prompt, něco jiného, ale stejně úžasného.
Planeta Země ze skla, ve 3D a v low-poly. To by mělo udělat ze zeměkoule kouli fasetovanou, zlehka hranatou. A rovnou možná nějaké styly, Origami, to by mohlo dát podobný ploškovatý vzhled, studené barvy, světlo zezadu, a široký záběr, chceme celou Zemi a kus vesmíru k tomu.
No… Zkusím nějaké změny různých nastavení…
Úplně mě to nenadchlo… co s tím?
Pryč s origami a s low-poly, ukaž co umíš v kulaté verzi koule.
To je výrazně lepší. Dám zase nějakou zpětnou vazbu.
Ten výsledek neurazí, ale určitě by to šlo líp. Zkusím vylepšit prompt, chci fakt pěknou zeměkouli, a na zajímavějším pozadí.
To pozadí se mění, je vidět změna stylu kapek, někde jsou stylizované, někde pěkně zaostřené, jako reálná voda, pokud byste ji fotili na hodně krátký čas.
Co se stane, když tam těch stylů přidám víc, znásobí se krása obrázku?
Asi ne. Nevadí. Dost bylo Země, je čas na zvířátka.
Midjourney umí pěkné barevné portréty tvořené různými vzorky a linkami, tady pro inspiraci nějaké obrázky z galerií různých uživatelů Midjourney. Zároveň čtu prompty, které uživatelé používají, a udělám si z toho nějaký výběr do Firefly.
Portrét německého ovčáka v psychedelických barvách s komplikovanými linkami a obrysy. A k tomu rovnou nějaké styly, Psychedelic je tady rovnou v převolbách, taky to má být umění, Iridescent jsou duhové barvy, božské to určitě chci taky…
Tohle je vizuálně velmi uspokojivý výsledek. Je to fakt umění. Nemusí se vám to líbit, ale mít nekonečné možnosti a různé styly znamená, že si každý najde to svoje. A tenhle pesan je viditelně výrazně jiný než pesani z Midjourney, což je jedině dobře.
Ještě zkusím, jak se změní vizuál když přepnu z Art na Graphic. Nijak výrazně. Co styl Fotografie, to by mohlo změnit obrázky výrazněji? Taky ne. Ani „žádný“ styl nezabral.
Jen tak mimochodem, já si tenhle stejný prompt vyzkouším právě teď v Midjourney, přidám jen pár slov k ovlivnění stylu, protože použiju verzi 4.
A tohle je pro srovnání první výsledek, který poskytne Midjourney.
Zkusím jiný prompt, pomalu se přesunu k něčemu reálnějšímu.
Fotorealistický steampunkový retrofuturistický kávovar, dělající kafe do prostého bílého hrnku.
Steampunk je rovnou ve stylech, přidám teplejší dostíny, studiové osvětlení a malá hloubka ostrosti.
Nooo… Je to steampunk, jsou to správné odstíny i světlo, hloubka ostrosti je malá. Hrnek je bílý, a mašinka dělá kafe, na všech obrázcích.
Ovšem teda ta konstrukce. Očekávám, že když je steampunk dokonce jedním z přednastavených stylů, dostanu precizní, futuristické, dokonalé mašinky plné různých detailních udělátek, hejblátek, koles a mechanických dokonalostí. Tohle je jako obrázek hodně dobré, splňuje to zadání do písmene, ale ty objekty na obrázku…
Není tu jediné kulaté kolečko. Ta jakoby ozubená kola, to je neobyčejně ohavné. Nic z těch objektů nevypadá realisticky, všechno se bortí, nemá to čisté, pravidelné linie. Měly by to být dokonalé kovové součástky složitého mechanického stroje, na které je radost se podívat, jak všechny společně fungují dohromady, všechno do sebe zapadá a je to esteticky i funkčně dokonalé. To je definice steampunku.
Zkusím poladit prompt a nějaká nastavení, třeba se něco změní?
Nezmění?
Zkusím pár dalších změn.
Tady na mě dokonce vyskakuje kafe z hrnku.
Nelepší se to, nelepší.
Zkusím ještě o něco jednodušší prompt, méně je někdy více…
A výrazná změna zobrazených objektů, paráda.
Ale ta zásadní chyba přetrvává.
Tohle je fakt škoda, každý obrázek sám o sobě splňuje zadání a dělá přesně to co chci. To vypadá na nedostatek tréninkových dat, možná? Nedostatek zpětné vazby, nedostatek lidského zásahu při tréninku? Těžko říct.
Zkusím stejný prompt v Midjourney, ve verzi 4, přidám nějaké další výrazu do promptu, což ve verzi 4 pomáhá, je to, jak vidíte podobné různým nastavením ve Firefly. A několik parametrů, verze 4, poměr stran, nechci tam žádné texty.
Tohle je dost steampunk, estetické mašinky, všechno jak má být, krom toho bílého hrnku.
Ještě vyzkouším verzi 5.
Výsledek vypadá realističtěj, úplně jinak, ale ve třech ze čtyř chybí bílý hrnek a bílý je celý kávovar. To není špatné, na první pokus. Nevím, jestli může mít vliv, že v promptu, protože je to souvislá věta, by měl být člen před hrnkem a mě tam chybí, takže je tam malá gramatická chyba. Mám ale s Midjourney zkušenost, že chápe i překlepy, kde chybí písmena ve slově, a přesto vygeneruje správný obrázek.
Dívám se ještě do galerií ostatních uživatelů Midjourney. Ano, tenhle prompt už napadl dost lidí přede mnou, nejspíš si s tím víc pohráli… jejich prompty jsou jednodušší, dali tomu větší volnost. Tohle jsou vážně hezké mašinky.
Toto je asi polovina mých pokusů s Firefly, ještě se podíváme na detaily některých vygenerovaných obrázků a na konci videa vám řeknu, co uvidíte v druhé části.
První prompt byla fantastická krajinka v láhvi s dramatickým světlem. Detaily jsou propracované, všechny obrázky vypadají jako malby, bez ohledu na různá nastavení. Ty horní okraje skleněné nádoby jsou trochu nedokonalé, ale nic hrozného. Tady v té verzi je pěkně vidět malou hloubku ostrosti, rozmazané je popředí a pak pozadí za sklenicí. Někde je dokonce i část blesku mimo zaostřenou část.
Tady je srovnání s Midjourney. Tohle je verze 5, v poměru stran 21:9, a velmi realisticky vypadající strom a kameny uvnitř i krajina okolo.
A tady je obrázek vygenerovaný ve verzi 4, s moc pěknými detaily, a k tomu celý původní grid všech čtyř obrázků. Jak Midjourney tak Firefly nabídly 4 různorodé krajinky s různými objekty uvnitř, v různých sklenicích a s různým pozadím okolo.
Skleněná země, tady mi šlo o to vidět detail kontinentů, vypadá to jako vrstvy různých kovů na skle. Určitě to není špatné.
Jak by vypadal stejný prompt v Midjourney?
Zase, přidávám něco navíc, co vylepší kvalitu a detaily, protože používám verzi 4.
Tak to není zrovna to co si představuju, ale fajn, pak je to moje chyba, že si neumím vytvořit prompt podle toho, co si představuju. Rozhodně je to stejný prompt jako ve Firefly, takže je fér to srovnat. Ve Firefly bylo těch pokusů o vyladění víc, v Midjourney dělám jen jeden pokus, pro představu. Je vidět jiný styl, Midjourney mi nabízí opravdu čtyři různé koncepty planety, s větší volností a fantazií. Firefly vytvořil jen čtyři variace na stejné téma. Midjourney si pod vibrant colors, živé barvy, představuje opravdu jásavou pestrobarevnou paletu všech barev. Firefly zůstal u těch studených modrých, i když byly pozděj změněny v promptu na živé barvy. výsledek od Midjourney, ale chápu, že někdo dá raděj přednost rezervovanému tónu výsledků od Firefly.
V tomto videu jste viděli první část mých pokusů s Firefly a srovnání podobných promptů zadaných do Midjourney, kde se hodilo srovnávat především s verzí 4. Příště budu pokračovat s realističtějšími prompty, srovnávat opět s Midjourney, tentokrát spíš s verzí 5, protože ta dává výsledky bližší reálným fotografiím. A příště také uvidíte práci s druhým dostupným nástrojem, s textovými efekty. Ten vytváří okrasná písmena na různá témata a z různých typů fontů.
Druhá část vyjde následující den po vydání tohoto videa, ať je to pěkně pohromadě, žádné dlouhé čekání. Ale i tak doporučuju zapnout si odběr, ať vám to neuteče.