Ideogram 2 – generátor obrázků s nejlepším textem
Odkazy v článku odkazují na příslušnou část videa. Při čtení můžete otevřít video pro “náhled” přesně v tom čase, ke kterému text odkazuje.
Vyšel další model obrázkové umělé inteligence který je lepší v psaní textu než Midjourney a je lepší než Flux a je pro všechny zdarma!
Už zase něco nového, převratného a nejlepšího?
Už vás to otravuje? Mě taky, protože něco nového je tu asi osmkrát denně. A zatímco v anglicky mluvícím světě se nepovažuje za slušné komentovat něco jiného než pozitiva, já, a věřím že i vy, jsme zvědaví i na ty stinné stránky a nefungující záležitosti.
Je tady [ajdýougram], česky to asi budeme vyslovovat Ideogram, verze 2, a hlásá, že je lepší než tohle a támhleto, internetem prosakují informace, že tohle je největší konkurence Midjourney a kvůli Ideogramu se Midjourney na chvíli otevřelo zdarma pro všechny. To poslední bude asi pravda. A všechno ostatní zkontrolujeme v tomhle videu.
Na adrese ideogram.ai najdete možnost se přihlásit s Google nebo Apple účtem. Poté na úvodní stránce vidíte nejnovější obrázky ostatních uživatelů. Ve verzi zdarma tvoříte vše veřejně, takže i vaše obrázky se tu objeví.
Obrázky ostatních můžete filtrovat podle jejich stylu, a taky podle času generování. Můžete v nich hledat… Aha, nemůžete, to je placená funkce, je u ní takový malinkatý zámeček. To je zajímavá volba, prohledávání je jen pro platící uživatele.
Klikám do promptu nahoře a otevírá se celé prostředí nastavení promptu, to vypadá přehledně. Ideogram byl už před několika měsíci, v minulé verzi jedna, znám pro svou skvělou schopnost psát písmena do generovaných obrázků. Tohle je verze dva, a doba pokročila, takže já se s tím nebudu párat, já jsem náročný uživatel, mé požadavky jsou vysoké, a rovnou používám můj starý dobrý prompt s klukem a jeho psem, nejlepším přítelem člověka. Česky to neumí, ale upřímně, tohle je nejlepší výsledek ze všech současných obrázkových generátorů, protože česky žádný z nich neumí dobře, a většina z nich vám dodá výrazně horší výsledek.
Zkusím český nápis bez diakritiky, opět prompt z minula, zeď v zadní špinavé uličce s grafitti nápisem KONKURENCE MIDJOURNEY? ZDARMA?
Všechna nastavení nechávám automatická, jen specifikuju, že styl má být Anime. A dostávám správná písmenka, až na jednu výjimku s přidanou diakritikou, kterou to najednou mí, ale je to celé takové…vyblité. Takže nastavení Anime znamená změnu barev?
A do třetice, promptuju pizzu s nápisem Flux, kde každé písmeno je vytvořeno z jiné potraviny… a dostávám jeden vcelku dobrý výsledek, dva naprosto perfektní jak co se týká písmen, tak toho, které ingredience patří na tenhle druh pizzy a jednu tak trochu sprosťárnu. Ale celkově je to famózní. Tohle je nejlepší výsledek tohoto promptu ze všech generátorů obrázků, které znám.
Vyzkouším nějaké složitější prompty. Tady je jeden vygenerovaný chatbotem, tolik poetických anglických slovíček ani neumím. Nastavím si barevné schéma… a můžu si vybrat jen z přednastavených kombinací, vlastní barvy jsou jen pro placené účty. No, tady není moc z čeho vybírat, všechny ty přednastavené barvy jsou takové… zvláštně nesourodé, až vizuálně nepříjemné. Vybírám odstíny zelené. Dostávám tři omalovánky a jeden realističtější obrázek. Opravdu to mělo být realistické, ne omalovánka, tohle v mém zadání nebylo. Je pravda, že promptu to rozumí dobře, opravdu mám tři postavy, které více méně dělají a vypadají tak, jak bylo v promptu zadáno.
Zkusím ještě jednou, bez barevného schématu. A zase dostávám tři ilustrace a jednu realistickou scénu. Prompt je splněn dobře, ale celkový dojem z obrázků je velmi rozpačitý.
Zkouším několik dalších složitějších promptů a pokud jsou to realistické scény, tak je na obrázku to, co bylo v promptu.
Nastavení a další možnosti jsou pro neplatícího uživatele trochu omezené.
Po kliknutí na tři tečky vpravo nahoře mám sice možnost stáhnout obrázek, ale pouze jako JPG v 70% kvalitě, stáhnout PNG v plné kvalitě smí jen platící uživatelé.
Stejně tak Upscale je pro platící uživatele a taky Edit. Což je Inpainting, tedy můžete zabrat štětcem libovolnou část obrázku a vygenerovat ji znovu. Je zvláštní, že tyhle funkce si nemůžu vyzkoušet ještě před zaplacením, třeba za větší množství kreditů.
Mimochodem, Ideogram Editor. Téměř totožný jako Midjourney editor. Ideogram editor existoval už před půl rokem, takže obrázek si jistě uděláte sami. Nemyslím generovaný obrázek.
Nechápu tuhle taktiku, uživateli se před zaplacením ukáže jen nižší kvalita obrázků a omezené funkce, takže při rozhodování jestli si tuhle službu zaplatit nebo ne, dostávám jako ochutnávku ne to nejlepší, ale něco výrazně horšího a omezeného. Zvláštní.
Další funkce, které si zdarma nevyzkoušíte, ačkoli tohle už je pochopitelné, jsou různé poměry stran obrázku, nicméně ty základní jsou k dispozici a asi vám budou stačit.
A další možnosti promptu jako rychlost generování, Seed a negativní prompt nejsou k dispozici v účtu zdarma.
Jedna ze zajímavých funkcí Ideogramu je Magic Prompt. Podle manuálu je použit lokální jazykový model, který má optimalizovat prompt. V případě mých složitějších promptů to spíš nadělalo víc škody než užitku. Tady jsou některé příklady.
Tři fantastické postavy byly generovány z promptu z jiného chatbotu, který nebyl Ideogramem původně optimalizován nijak, asi protože už byl beztak plný zbytečných nabubřelých slov. Když to zkusím znovu a Magic Prompt vypnu, s úplně stejnými nastaveními, konečně dostávám čtyři realistické obrázky, bez té ilustrované stylizace. Tváře jsou deformované, ale to je při téhle velikosti tváře očekávané. Prompt je splněn správně. Proč má optimalizace textu vliv na styl generovaného obrázku? Nevím.
Ještě horší je Magic Prompt na mém příkladu s nápisem na pizze. Zkouším to znovu, tentokrát se slovem PIZZA. Nedostávám, co chci. Není to překvapení, protože Magic Prompt zrušil popis mého typu záběru, místo „záběru shora na oválnou pizzu“ to přepisuje na „fotografie pizzy.“ Přidává to větu, že na pizzu patří různé věci, včetně tedy těch správných. A popisuje to, že pizza je na dřevěném prkénku, což v promptu vůbec nebylo. Sice to není špatně, ale dost to omezuje výsledek.
Navíc dostávám horší splnění promptu, a to myslím v oblasti toho, z čeho mají být písmena vytvořena, jeden obrázek peče pizzu kulatou bez písmen. Vylepšení se moc nekoná.
Zkouším to ještě jednou, bez Magic Promptu. Výsledkem je čtyřikrát oválná pizza, s velmi zajímavými věcmi okolo na stole, ale pizza samotná je docela nepěkná a písmena ani jednou nedodržují prompt a jsou taková trochu ubohá.
Mezi těmi perfektními nápisy FLUX na jedničku s hvězdičkou a tady těmi nebohými písmeny PIZZA je zhruba týden rozdíl. Jazykový model je podle Ideogramu lokální, neměl by tedy podléhat těm módním trendům, kdy si oblíbíte, nebo dokonce zaplatíte, nějakého chatbota a on vám za měsíc zdivočí, zblbne, začne odmlouvat a dodává vám hloupé nepoužitelné nesmyslné bláboly.
Co se stalo, nevím. Jak má fungovat Magic Prompt, přiznávám se, taky nevím. Že by to vylepšilo moje obrázky se říct nedá. A bez Magic Promptu jsou obrázky viditelně horší, alespoň v části obrázku.
Remix je tlačítko, které vám umožní generovat obrázek z jiného obrázku. S účtem zdarma nemáte možnost uploadu, ale můžete využít některý z vygenerovaných obrázků. Tady zkouším klavíristu, a budu chtít udělat ilustraci. Zatrhávám Anime, nastavuju 93% podobnosti s vloženým obrázkem, to by mělo být dost na to, aby obrázek zůstal zachován a změnil se jen jeho styl. A přidávám barevnou paletu, protože to chci veselé a barevné. Do promptu se při Remixu vloží původní prompt. Tady byl původně zapnut Magic Prompt, takže se vkládá tento, upravený, podle mě opět horší, prompt. To se mi nelíbí, takže zkusím promptovat pouze změnu, kterou chci provést. Píšu tedy živé barvy anime ilustrace, silné černé linky, unikátní styl.
Magic Prompt to „vylepšuje“ změnou záběru a změnou promptu na dívku s dlouhými růžovými vlasy a zelenýma očima v růžovobílé košili a zelené zástěře? Na pozadí je kuchyň s oranžovými a bílými kachličkami.
No, vyloženě to ten prompt pozvedlo na magickou úroveň.
Já se vám fakt snažím ukázat něco pěkného… tolik hezkých obrázků je na hlavní stránce.
A tady je třeba psisko, a je promptované ve španělštině. Tak že by Ideogram uměl i česky? Schválně, vezmu originální prompt, přeložím ho… a to nedává moc smysl. Magic Prompt přeložil původní prompt do angličtiny, vezmu tedy ten anglický prompt, přeložím, Magic Prompt nechám na Auto a uvidíme, co se stane.
Obrázky nic moc, ale Magic Prompt se nepoužil, tyhle obrázky jsou výsledkem česky napsaného promptu. To je fajn, teď ještě zkusím udělat ty obrázky podobné těm originálním. Upravím prompt do vět, které dávají smysl v češtině, zapnu Magic Prompt… A dostávám podobné koukatelné obrázky, z českého promptu, vylepšené Magic Promptem v angličtině.
Konečně něco vyloženě pozitivního. A zvířátka nakonec, to se vám muselo líbit!
Je Ideogram nejúžasnější novinka? Měli byste zrušit Midjourney, smazat Flux a Stable Diffusion a vrhnout se na Ideogram? Asi se shodneme na tom, že ne. Na Ideogramu je zajímavé, že stejně jako třeba Midjourney, si vyvíjí a používá svůj vlastní model, s vlastním stylem, nepoužívá Stable Diffusion nebo Flux, jako to dělají jiné weby. Psaní anglického textu v obrázku funguje velmi dobře, i při složitějších promptech. Porozumění promptu taky hodnotím velmi kladně, co napíšu, to většinou dostanu.
Problém nastává při jiných než realistických scénách, a při zapnutí nebo popisu nějakého stylu. Pokud vypnete Magic Prompt, změní se barevná paleta obrázku, barvy jsou desaturované nebo jinak omezené. Některé části obrázku jsou kvalitativně výrazně horší, nebo kompletně změní styl. Možná je to vlastnost, ale já o takovou vlastnost tedy nestojím.
Při zapnutém Magic Promptu jsou ignorovány takové základní věci jako je popis záběru, jsou přidávána zbytečná a nesouvisející slova, někdy chatbot vyloženě halucinuje a vymýšlí si totálně odlišné detaily, takže ve výsledku dostanete něco úplně jiného.
A tohle vše ještě umocňuje skutečnost, že s účtem zdarma si nevyzkoušíte nejvyšší kvalitu. Většina lidí rozdíl mezi JPG kompresí a originálem nepozná, ale viditelný rozdíl tam je. Upscalovat ani editovat také nesmíte před zaplacením, ačkoli to jsou podle mě jedny z nejoblíbenějších funkcí.
Cenově je Ideogram více jak dvakrát levnější než Midjourney. Basic předplatné nabízí 400 kreditů měsíčně, to je dvojnásobek co Midjourney, plus k tomu 100 pomalých kreditů denně, to nevím, jak počítat, protože to může být, teoreticky, až 3000 dalších extra kreditů měsíčně. Zní to jako hodně obrázků, ale moje zkušenost za první týden s novou verzí 2 je ta, že strávíte hodně času generováním stejného promptu znovu a znovu. Výsledky nejsou konzistentní, je to spíš náhodné losování nějakého obrázku, především pokud víte, co chcete a trváte na tom, že to opravdu chcete.
To je srovnání jen s Midjourney, jako nejoblíbenějším placeným generativním nástrojem, který má svůj vlastní styl obrázků.
Co říkáte na nějaké větší srovnání s ostatními modely a nástroji, někdy příště? Přihlaste se k odběru, ať o tom víte první.