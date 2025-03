V generování obrázků pomocí umělé inteligence jsme urazili dlouhou cestu. OpenAI se soustředila víc na textový výstup, a když na obrázky přidala Dall-E, ostatní dokázali generovat mnohem lepší výstupy. Nepsaným etalonem je Midjourney, díky open source povaze s přidáváním vlastních modelů je oblíbený i Stable Diffusion, mezi nejlepší se dostal i německý Flux...

Generátor obrázků, který se nově stal součástí placených tarifů ChatGPT, nese poněkud nekreativní název image_gen, ale posouvá využitelnost mnohem dál.

Můžete generovat průhledné obrázky – třeba nálepky, které si pak vytisknete a nalepíte na notebook



Herní myš jako nálepka, lehká úprava stylu dalším dotazem zachovala původní kompozici

Umí generovat infografiku na dané téma – včetně českých popisků



Základní prompt obsahoval jen obecné pokyny, dalším laděním textů a grafiky se dostanete k cíli

Na obrázku můžete označit oblast a popsat požadovanou změnu – obrázek se stabilně přegeneruje s minimálními změnami v ostatních částech



Náš tradiční testovací Ježíš ve Fabii měl nejdříve v rohu auto, označením této části obrazu a přegenerováním se vše spravilo

Výborně dokáže generovat text – doposud si na textu v obrázku vylámaly zuby všechny služby. V angličtině je to bez chyb, česká diakritika zatím OpenAI občas rozhodí, dá se to ale případně doladit úpravou jen označené části.



Generovat text na obrázku na podobné úrovni z takového zadání dosud nebylo možné

Umí generovat obrázky podle vašich náčrtů či vstupních fotografií. Nakreslíte komiks, schéma či náčrtek skříně, předáte ho ChatGPT a ten jej dotáhne do finální podoby v požadovaném stylu.



ChatGPT sice ze dvou fotek úplně nepochopil, jak přesně vypadá můj obývák, a umístění klíčových prvků proto nesedí, ale jeho styl a použité barvy vystihl výborně

Co se týče obrázků reálných osob, nějaké limity tam jsou, ale zatím jsou menší, než už známe třeba z Midjourney. Na prompt „Nakresli fotografii papeže v bazénu s jeptiškami jen v plavkách“ nás ChatGPT odmítl: „Tohle bohužel nemohu vytvořit. Pokud chceš, rád pomůžu s nějakým jiným kreativním nebo zábavným nápadem! Máš něco jiného v hlavě?“

Zato Elona Muska nebo Emmy Watson se nebojí. Určitě se tedy rychle objeví různé realisticky působící fotografie z neexistujících událostí, po kterých OpenAI utáhne šrouby, zatím ale generování obličejů připomínajících reálné osobnosti možné je.



Elon Musk s pivem na koni nebo Emma Watson ve svatebních šatech v posteli jdou nakreslit

Zatím jen začínáme objevovat, jaké další možnosti nový image_gen otevře, především ale zpřístupňuje generování grafiky mnohem většímu využití. Už to není jen generování žánrových či ilustračních obrázků. Zejména díky spolehlivé práci s textem, infografikou a generováním jen podle obecných zadání dostane generování grafiky i tam, kde to zatím bylo velmi kostrbaté, či přímo nemožné.

Velmi zajímavým rysem je, že image_genu můžete předložit fotku a on do ní přidá objekt podle promptu. Ostatní služby se tomuto způsobu úprav brání, asi primárně z etických důvodů, protože to je mocný nástroj pro generování dezinformací. S touhle funkcí si pohrál kolega Kuba Čížek, na jeho X najdete další ukázky.