Nejnovější obrázková AI od Googlu před pár dny konečně dorazila i do bezplatného chatbota Gemini a může si s ní pohrát úplně každý. Stačí navštívit adresu gemini.google.com, no a pokud se na vás usměje štěstí, bude tam na vás čekat oznámení lákající na novou funkci.
Zdarma 2048×2048 pixelů, ale bez lidí
Obrázkový generátor od Googlu se jmenuje Imagen 3, firma jej oficiálně představila na jarní vývojářské konferenci I/O a chlubí se, že zvládne fotorealistickou kresbu a práci s textem.

Imagen 3 a prompt: An image of a ball gown made of paper napkins in an elegant showroom
To dnes ale tvrdí v podstatě úplně všichni, přestože realita je ideálu z tiskových zpráv často na hony vzdálená. Nejlepší tedy bude, když si to vyzkoušíme sami. A protože je to chatbot jako každý jiný, prostě mu můžeme rovnou a bez další parametrizace napsat, co po něm chceme.
V základní verzi Gemini se ale připravte na některá omezení:
- Imagen 3 zvládne jen čtvercový formát 1:1
- Imagen 3 odmítne kreslit lidské postavy
Obrázek má na druhou stranu slušné rozlišení 2048×2048 px.

Na obrázky lidí zapomeňte, to bude jen v placené verzi
Na kreslení lidských postav už budete potřebovat zpoplatněné Gemini Advanced, což je vlastně obdoba ChatGPT Plus v podání Googlu, která stejně tak umí spouštět kód v Pythonu a používá pokročilejší jazykové modely.
Široký poměr stran zatím jen skrze API
Snad brzy nabídne i práci s širokoúhlým poměrem stran, který je už dnes nezbytný pro lepší práci s kompozicí. Imagen 3 jej sám o sobě podporuje a Google odlišné obrazové formáty nabízí třeba skrze své API pro vývojáře a hezkou knihovnu v Pythonu, vše je ale zatím k dispozici jen pro pár šťastlivců v uzavřené betě.

Imagen 3 a prompt: A photorealistic image of a breathtaking mountain vista with jagged peaks and snow-capped summits, bathed in the warm glow of a setting sun. Dramatic clouds, painted in vibrant hues of orange, pink and purple., streak across the sky, casting long shadows across the rugged landscape
A takhle to dopadne u konkurence a v kompozici roztažené do šířky:

Stejný prompt v Midjourney v širokoúhlém formátu 16:9
Maluje hezky, ale Midjourney to ještě není
Povely můžete samozřejmě psát i v češtině a stejně jako u ostatních generátorů nakonec často dosáhnete nejlepšího výsledku jednoduše tak, že to nebudete AI příliš komplikovat

Imagen 3 a tentokrát naprosto jednoduchý prompt v češtině: Planeta Země z vesmíru
Výstupy Imagenu nejsou špatné a můžete experimentovat na jedné straně jak s fotorealistickou (téměř)fotografií, tak na druhé s nejrůznějším ilustračními styly.
Midjourney je na tom ale zatím lépe. Jeho parametrické doladění dokáže občas divy a z trůnu jej proto zatím nesesadí ani nejnovější technologie od Googlu.
Krátké texty zvládne, ale na češtině si vyláme zuby
Co se slibovaných textů týče, krátká hesla AI zvládne celkem dobře, cokoliv složitějšího je ale otázkou čiré náhody a čeština s diakritikou bude naprosto nedostižný ideál. Na „žluťoučké koníčky“ prostě zapomeňte. Nutno podotknout, že na podobných úkolech si ale vylámou zuby úplně všichni.

Krátký text zvládne, ale určitě ne v češtině
Hráky s Imagenem nemusejí skončit jen u obvyklých kýčovitých AI malůvek. S trochou píle vykouzlí i nějaké to logo, které by se dalo docela slušně vektorizovat třeba do SVG.

Imagen 3 a prompt: Vytvoř logo s papouškem
Premiant mezi bezplatnými generátory
Kresbičky jsou sice povedené a při troše štěstí vykouzlíte téměř fotorealistické makro růže s kapičkami rosy v ranním slunci, nicméně takových záběrů je plný Shutterstock. Něco tomu chybí. Snad právě větší umělecká originalita, kterou známe z Midjourney – ještě o kousíček kreativnější duše.

Imagen 3 a prompt: Generate an image of glistering dewdrops clinging to a velvety red rose petal. Capture the intricate details of the water droplets, reflecting the morning sunlight, and the delicate veins of the petal
Duše sice chybí i ostatním, čili jejich výtvory poznáte na sto honů – zaplevelily polovinu internetu –, takový Grok se ji nicméně alespoň snaží chytře nahradit větší mírou svobody a tvorbou třeba bizarních malůvek papeže Františka v bazénku s jeptiškami. Něco podobného si globální a ze své pozice nutně korektní Google samozřejmě nemůže vůbec dovolit, takže na jakoukoliv kontroverzi rovnou zapomeňte.
Kočičky a králíčky při odpolední zlaté hodince dá ovšem levou zadní a vzhledem k tomu, že je na rozdíl od Midjourney úplně zdarma, to nakonec není vůbec špatné! Tedy až na tu absenci lidí.
Další ukázky z Imagenu najdete v galerii.