Obrázková AI Midjourney už dlouhé měsíce upevňuje svoje postavení a její placená verze pro profesionály směle vytlačuje někdejší neotřesitelné autority.

V tomto světle se nemůže nabízet žádná jiná otázka než: Kde je Adobe? Jak to, že to nebyla právě tato společnost, která jako první vyrukovala s něčím podobným, když už celou dekádu rozvíjí svoji vlastní rodinu grafických neuronek Sensei a stále platí za jedničku mezi vizuálními kreativci?

Microsoft AI do kanceláří, Adobe AI do studií

To bychom ji ale křivdili. Velkým rybám sice možná zpočátku trošku ujel vlak nebo si dávaly na čas, teď se ale mohou přetrhnout, aby profesionální komunitu a investory ubezpečily, že určitě nezaspaly.

Midjourney a jemu podobné služby jsou totiž sice fajn, ale představte si situaci, když by takové generativní kousky uměl přímo grafický editor? A přesně na tom Adobe nyní pracuje.

Pokud Microsoftu patří kancelář a bílé límečky, a tak jim může prodat umělou inteligenci Copilot v balíku Office, Adobe hodlá to samé udělat s fotografy, grafiky, animátory a střihači videa. Říká tomu Firefly.

Světluška zatím jen na pozvánku

Šéf digitálních médií David Wadhwani se sice Světluškou pochlubil už na sklonku března, teprve v posledních týdnech ale Adobe otevírá stavidla a do uzavřené bety pouští více šťastlivců. Určitě se tedy zaregistrujte, stojí to totiž za to.

Grafický generátor Adobe Firefly v oficiální upoutávce. V praxi zatím funguje jen funkce Text to image:

Firefly je v tuto chvíli především technologické demo a nikoliv hotový produkt pečlivě integrovaný do všech služeb a programů amerického hegemona – to je až vize a plán pro příští měsíce.

V praxi to znamená, že když už vás Adobe pustí dovnitř, Firefly bude zatím fungovat vlastně docela podobně jako Midjourney, Stable Diffusion a Microsoft Bing Image Creator.

Je to tedy webová aplikace s textovým proužkem, do kterého zadáte v angličtině příkaz (prompt), co má umělá inteligence nakreslit. A dokáže toho při troše štěstí a snahy opravdu mnoho, o čemž svědčí veřejně přístupná galerie dosavadních výtvorů.

Firefly žádné soudy nehrozí Firefly se oproti Midjourney, Stable Diffusion a dalším AI generátorům obrázků liší v tom, že jej Adobe trénoval na snímcích z fotobanky Adobe Stock a na fotografiích s řádnou svobodnou licencí. Díky tomu by se měla firma vyvarovat žalobám v USA i Evropě, se kterými se potýkají jak společnost Stability AI (Stable Diffusion), tak MIdjourney. Podstata žalob spočívá v tom, že se tyto generátory učily na veřejně dostupných obrázcích na internetu, aniž by k tomu měly souhlas autora.

Firefly Text to image a Firefly Text Effects

Firefly momentálně nabízí dvě webové aplikace a třetí je v přípravě. První jménem Text to image generuje obecné obrázky dle slovního zadání a druhá Text Effects zase dle slovního zadání aplikuje efekty na text. Třeba vám nakreslí textové logo tvořené elektrickými kabely.



Webové rozhraní Adobe Firefly s šachovnicí dostupných aplikací

Třetím modulem, u kterého ale zatím svítí omluvné coming soon, bude Recolor vectors a Adobe slibuje, že s jeho pomocí budeme moci slovním příkazem přebarvovat vektorovou grafiku – ilustrace! To jsou už kousky, které nikdo jiný zatím neumí a je to opravdu ukázka zase něčeho nového.

Firefly for Video

Statickými obrázky to přitom asi neskončí, Adobe už totiž koketuje s myšlenkou, že vypustí pixelový generátor i do videa. Ale trošku jinak. Neměl by tam za úkol vytvářet zcela nová a plně syntetizovaná filmová políčka – to zatím nikomu nefunguje dostatečně věrohodně –, ale postaral by se třeba o to, aby scénu ponořil do teplých barev podvečerní zlaté hodinky, dohledal vhodné prostřihy (B-roll) aj.

Ostatně, podívejte se na upoutávku vize Firefly for Video výše. Ale ještě jednou, je to opravdu jen nápad a demonstrace možností. Zatím, to neexistuje. Alespoň veřejně.

Aplikace Firefly Text to image

Ale už dost teorie, pojďme si ukázat, jak se pracuje s aplikacemi Firefly, které tu už reálně jsou a fungují alespoň v uzavřené betě. Začneme v obrázkovém generátoru Text to image.



Úvodní obrazovka Firefly Text to image s ukázkovou galerií včetně použitých promptů a velkým textovým políčkem pro ten váš originální

Spodní části obrazovky vévodí velký textový pruh, kam můžeme napsat vlastní nový příkaz. Jako u ostatních generativních obrázkových neuronek počítejte s tím, že se s Firefly zatím komunikuje výhradně v angličtině. Není to ChatGPT, ani nový Bing.

Tajemný mops toulající se ulicemi města v dešti

Základní logika promptů nijak nevystupuje z řady, takže zde platí víceméně stejná pravidla jako v Midjourney a SDXL. Nejlepších výsledků dosáhnete komplexním a dostatečně expresivním zadáním.

Pojďme si to vyzkoušet na tomto anglickém promptu: Mysterious pug roaming the city streets in the rain. Pro ty, kteří v hodinách angličtiny raději četli Živě.cz: Tajemný mops toulající se ulicemi města v dešti.

Firefly je zatím rychlý jako ďas, takže během několika málo sekund na mě vyskočilo toto:



Rozhraní AI editoru se čtyřmi hotovými náhledy

Generátor vytvořil stejně jako Midjourney čtyři návrhy, na rozdíl od Discordu ale pracujeme v uzpůsobeném rozhraní, takže se zobrazil také postranní panel s hromadou dodatečných parametrů.

Zvětšenina má rozměry 1024×1024 px a více

Hotový obrázek můžete po klepnutí a zobrazení zvětšeniny zkopírovat do schránky, nebo uložit jako soubor. Jak bude velký? To záleží na poměru stran, ta kratší má totiž vždy 1024 pixelů.



Po klepnutí na miniaturu se zobrazí karta s detaily

To není vůbec špatné, ale má to jeden háček. Protože je zatím Firefly k dispozici jen v betaverzi a zdarma, Adobe si nepřeje nekontrolovatelné šíření jeho obrázků. Součástí každého výstupu je proto decentní upozornění na zdroj v levém dolním rohu. Nesmíte jej odstranit a stejně tak nesmíte používat výtvory ke komerčním účelům.



Vygenerovaný tajemný mops v plném rozlišení 1024×1024 pixelů

Čtverec, širokoúhlý záběr i portrét

Výchozí poměr stran 1:1 naštěstí doplňují i široké záběry 4:3 a 16:9 a ještě portrétní na výšku 3:4. Ovšem pozor, Firefly při jakékoliv nové změně parametrů okamžitě překresli všechny obrázky.



Výběr poměru stran a regenerace scény v poměru 4:3, 3:4 a 16:9

Úpravou poměru stran se tak může při přepočítání celé scéna dramaticky proměnit, ale stejně tak možná zůstane beze změny. Pokud tedy vytvoříte něco hezkého a nebudete o to chtít přijít, raději si to zavčas uložte.



Tajemný mops v deštivém městě a 16:9 (1792×1024 px)

Jednotlivé vykreslené kombinace si nicméně Firefly během sezení pamatuje, takže když vytvoříte obrázek v 16:9, poté se vrátíte zpět k 1:1 a skočíte znovu na 16:9, bez čekání se zobrazí již zhotovený širokoúhlý záběr.

Kresba, nebo raději fotografie?

O něco níže v postranním panelu můžete generátoru přikázat, aby vytvářel grafiku v určitém typu (Content type). Všimněte si, že jsme doposud pracovali v režimu Art, všechny dodatečné modifikátory totiž najdete pod textovým promptem ve formě bublin.



Textový prompt doplňují modifikátory. O Golden hour si povíme později

V nabídce je vedle Art ještě Photo, Graphic a None. I zde platí, že občas změna typu zcela překreslí obrázek a už se k němu nedokážete vrátit, no a občas se třeba jen mírně změní barevný nádech při zachování scény a původního mopse.



Nastavení Content type a postupně None, Photo, Graphic a Art

Zároveň nečekejte, že když vyberete Photo, bude výsledek vypadat opravdu jako záběr z fotoaparátu. Ostatně, náš mops se napříč styly proměnil spíše náhodně. S dramatičtějšími proměnami pomohou až styly.

Desítky stylů od Pixel artu po Neon

Styly nejsou exkluzivní, takže je můžete kombinovat a v promptu se budou opět zobrazovat jako dodatečné modifikátory – bubliny – bez potřeby úpravy samotného příkazu.



Neonový mops. Přibyl fialový nádech

Dejme tedy tomu, že bychom chtěli mopsíkovi dodat neonový nádech. Vybereme stylový modifikátor Neon, který je hned v sekci Popular, a nebohé psisko v plném rozlišení pak bude vypadat jako na obrázku výše.



Neonový a pixelartový mops naráz



Prompt s modifikátory pro obrázek výše

V druhé ukázce jsme efekt neonu zkombinovali s dalším modifikátorem Pixel art.

A protože mopsů není nikdy dost, níže se podívejte ještě na několik dalších ukázek. Jen znovu připomeneme, že každý prompt je v podstatě unikátní, takže i když použijete tento v článku, neznamená to, že vám Firefly vyrobí úplně přesně to samé.



Stylové modifikátory a mops na staré fotografii, kreslený mops a malovaný mops

Světlo a kompozice

Nakonec si můžeme pohrát ještě s modifikátory po osvětlení scény a kompozici. Jedním z nich je právě ta zlatá hodinka (Golden hour), která tu už dříve padla. Dodala scéně teplý nádech a světlo krátce před západem Slunce.



S vypnutým světelným modifikátorem a s aktivním kompozičním modifikátorem Macrophotography

Zdaleka to ale nefunguje vždy, anebo se změna těchto modifikátorů propíše do výsledku jen velmi slabě. Když odstraním modifikátor zlaté hodinky, prostor za mopsíkem trošku zchladne.

Modifikátor Macrophotography pak zase sníží hloubku ostrosti, takže na posledním obrázku jsou pozadí za psíkem i část jeho těla už silně rozmazané, zatímco hlava a kapky v popředí ostré jako břitva.

Firefly vs SDXL a Midjourney v5

Stylem práce se Adobe Firefly Text to image podobá aplikaci Dreamstudio od Stability AI, ve kterém si můžete hrát s jejím novým modelem SDXL. I ta nabízí dodatečné styly.



Stejný dotaz v SDXL



Stejný dotaz v SDXL ve stylu Digital art

Midjourney uvězněná v rozhraní Discordu sice vyžaduje dodatečnou znalost textových parametrů pro nastavení poměrů stran apod. a je oproti Firefly a Dreamstudiu nesrovnatelně pomalejší (i v placené verzi), nicméně zase exceluje precizností a vyšší fotorealističností na první dobrou.



Identický dotaz v Midjourney v5

Aplikace Firefly Text effects

Tak, dost bylo obecných obrázků a pojďme se na závěr ještě podívat na tu druhou aplikaci Text effects, která zase na povel vytvoří rastrový efekt pro písmo.

Ovládací rozhraní je podobné tomu předchozímu, takže když jsem dal Firefly AI povel, aby vyplnila nápis Zive.cz v písmu Source Sans 3 efektem elektrických kabelů, dopadlo to jako na obrázku níže opět se čtyřmi variantami.



Editor typografických efektu Firefly Text effects

Obrázek můžete stáhnout, přičemž i v tomto případě bude mít kratší strana délku 1024 pixelů. Logo níže má proto už docela úctyhodné rozměry 2403×1024 pixelů.



A takhle vypadá výsledek v plném rozlišení

Dvanáct fontů a libovolné pozadí

V postranním panelu najdete i v tomto editoru několik modifikátorů. K dispozici máte 12 fontů, způsob mapování efektu na písmo (text effect fit) a také barvu pozadí.

Firefly umí generovat nápis i s transparentní barvou, takže hotový soubor ve formátu PNG pak budete moci použít jako vrstvu v nějaké další grafice. Nezapomeňte ale na to, že obsahuje logo Adobe.



Výběr písma, barev a striktní namapování efektu na font (text effect fit: tight), takže kabely dodržují tvar písma. V tomto případě to vypadá ještě věrohodně, jindy by to už vadilo

Demonstrace aplikované AI

Midjourney a GPT/ChatGPT jsou krásnými a velmi povedenými demonstracemi základní technologie. Microsoft Bing a Adobe Firefly jsou zase ukázkou toho, jak se možná tato základní AI promítne do konečných produktů.



Kytky.cz s kytičkami, Mops.cz ze psí srsti a Mobilmania.cz z mobilů

S tím také Adobe počítá, takže aplikace Text effects je pravděpodobně příslibem toho, že se textové prompty objeví i v tak zdánlivě upozaděných funkcích grafických editorů jako je nastavení písma.

Pokud se budeme ubírat právě touto cestou, políčko s textovým promptem bude dříve či později prostě všude. Tedy alespoň do té doby, než jej nahradí nějaké univerzální pole úplně na všechno, které bude dávat povely obecné AGI.