Na Živě jsme jsme několikrát psali o AI celebritách – o neexistujících osobách, jejichž obrázky na sociální sítě generuje umělá inteligence. Jsou to v naprosté většině ženy, na pohled velmi atraktivní ženy, které na Instagramu i jinde sledují miliony fanoušků.

Téma nás víc než ze sociálního pohledu zaujalo technologicky. Jak to přesně dělají? Bylo by zajímavé zkusit něco podobného v našich podmínkách. A tak se narodil aiťák.

Je to náš AI maskot, kterého už několik měsíců můžete sledovat na našem Instagramu nebo mezi ostatními příspěvky na Facebooku.

Neměli bychom asi dělat další AI holku

Vnadná umělá influencerka by naše převážně mužské publikum nejspíš zaujala. Ale měla by si hrát na to, jak ji zajímá IT, věda a technika? To by asi nebylo moc uvěřitelné. Takový avatar by se k nám ani nehodil.

Jsme vlastně sami ajťáci, kteří žijí mezi svými obrazovkami. Sedne na nás hodně klišé, která kolem lidí v IT vznikla. Náš maskot by mohl být podobný. Dokonce to může úplná esence stereotypů: starší, konzervativní ajťák, kterého ty internety a lidi kolem už vlastně trochu otravují… a nemá problém dát jim to najevo. Ten trochu arogantní chlápek ze supportu, ke kterému se vám nikdy nechce.

Do obrázkové AI DALL-E jsme zadali všechny ajťácké stereotypy, které nás napadly. Nechali jsme si od ní podle nich nakreslit typického ajťáka – a hned se nám zalíbil.



První verze aiťáka, jak ji vytvořilo DALL-E

Jenže DALL-E v ChatuGPT nedokáže udržet stejnou podobu postavy v různých scénách. Komplikovanými postupy se toho částečně dalo dosáhnout v Midjourney, ale ani tam to nebylo jisté. Museli jsme počkat.

Funguje to, na obrázcích je stále stejný ajťák

Dočkali jsme se 12. března, kdy Midjourney představilo nový parametr cref (viz dokumentace) pro zachování stejného vzhledu postav. Za něj se přidá odkaz na obrázek obličeje, který služba použije u postavy v zadané scéně.

Jako zdroj jsme použili našeho ajťáka z DALL-E a opravdu to fungovalo. Postupně jsme přišli na to, jak s cref pracovat, jak říct AI, aby se inspirovala jen obličejem a účesem, ne oblečením, jak dosáhnout „fotek“ místo ilustrací.



Tohle byl úplně první výstup z Midjourney, když jsme použili parametr cref s ajťákem

V Midjourney jsme se vzorem z DALL-E dál pracovali a postupně vytvořili několik portrétů postavy, která je vizuálně zajímavá, výrazná a rozpoznatelná. Tyto portréty jsme začali používat jako zdroj pro různé scény se stejným ajtákem. Dřív bylo zachování stejné „osoby“ jen velmi obtížné až nemožné, teď se úspěšnost přiblížila k jistotě.

Náš zdrojový ajťák, z těchto vzorů vycházejí všechny obrázky, které generujeme

Co kdyby nám to AI i psala?

Ženské AI celebrity to na sociálních sítích mají možná jednodušší. Důležitý je obraz, plavky všechno přebijí a na textech zase tolik nesejde. Na ajťáka v plavkách sice taky určitě dojde, ale nejspíš to nebude scéna, kterou toužíte vidět. Navíc tvoříme příspěvky pro jiné publikum než standardní influenceři.

Bylo jasné, že důležité budou texty. Jenže my neumíme na lusknutí prstu vytvořit vtipný post na sociální sítě. Nemáme ani čas, abychom je dlouhými brainstormingy vyseděli. Ale umíme si poradit: AI nám nebude ajťáka jen kreslit, bude nám pro něj psát i textové příspěvky.

Zkusili jsme to v ChatuGPT a výsledky byly nad očekávání dobré. Vtipné, sarkastické, AI napadaly velmi přiléhavé hlášky z našeho oboru. Nakonec jsme si k tomu vytvořili uživatelské GPT, kterému jen pošleme zadání a ono vrátí pět návrhů, ze kterých si vybereme.



GPT definují, jak se má ChatGPT přesně chovat, jak reagovat na vstupy

Později jsme zjistili, že ChatGPT může z návrhů sám vyhodnotit, který se mu zdá nejlepší. Vypadá to třeba takhle.



Jako základ většinou použijeme titulek našeho zpravodajského článku

Úspěšnost není stoprocentní. ChatGPT většinou pustíme na stejné zadání několikrát, abychom měli větší výběr. Často se stává, že téma úplně vzdáme, protože se nepodaří najít vtipný komentář. Ale i tak je tato metoda velmi efektivní a účinnější, než jsme čekali.

Mezi tím někoho napadlo: Když už nám všechno bude dělat AI, tak to vlastně bude aiťák!

Aby byla výsledkem skutečně práce umělé inteligence, návrhy ChatuGPT upravujeme většinou jen stylisticky. Nebo někdy spojíme dva dobré nápady do jednoho. Celé komentáře ale nevymýšlíme sami.

Chceme ještě víc AI

ChatGPT nám sestavuje i přesné, popisné prompty pro generování obrázku v Midjourney. Opět jsme si vytvořili uživatelské GPT, kterému stačí zadat pár slov vystihujících scénu, AI potom domyslí zbytek.



Další GPT slouží pro přípravu zadání do Midjourney

V promptu, který nám ChatGPT sestaví, jsou už rovnou i všechny parametry včetně odkazu na jeden ze zdrojových portrétů aiťáka.



Z několika slov dostaneme košatý prompt, rovnou i s potřebnými parametry

Text zkopírujeme do Midjourney a necháme si vygenerovat obrázek. Někdy zkusíme udělat víc výstupů, a když to nevyjde, třeba i změníme zadání. Do výsledku sáhneme v editoru, uděláme třeba drobnou retuš. Obrázek vložíme do šablony s textovou bublinou.

Ruční práce nám zatím zůstává při vkládání příspěvků na sociální sítě. Jinak je ale naše IT celebrita výsledkem práce AI.

Proč je aiťák na všech obrázcích tak hubený? Nevíme. ChatGPT to v zadání, kterým tvoří prompty pro Midjourney nemá. Ani v povelech, které do Midjourney vkládáme, nic takového není. AI je zřejmě přesvědčena, že IT guy musí vypadat takhle.

Co bude dál?

Aiťák nás baví. Jeho ústy si můžeme dovolit víc, než jako novináři píšeme v článcích i na sociálních sítích. U něj nevadí subjektivní, někdy až do krajnosti posunuté komentáře. Je to trochu náš Alzák, trochu Jeremy Clarkson – prostořeká postavička, která si nebere servítky.



Aiťák se nám dostal i na obálku aktuálního Computeru

Tím, že jsme celý proces postavili na AI, ani není práce s aiťákem časově tolik náročná, jako kdyby bylo potřeba dělat všechno ručně. I samotné workflow nás stále fascinuje – je úžasné, co dnešní AI nástroje dokážou.

Se sociálními sítěmi ale nekončíme, aiťák se dostane i na Živě. První výsledek experimentu tady najdete asi už o víkendu.

V Midjourney se dají s parametrem cref dělat i jiná kouzla. Aiťák může být třeba ilustrovaný, ve stylu pixel artu nebo i jako figurka Lega