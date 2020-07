Nějakým tím generátorem obrázků, který využívá prvky A.I., už dnes nikoho neoslníte. Loňské léto svých pět minut slávy zažil inovovaný FaceApp, a sociální sítě poté zaneřádily tisíce selfies s upraveným věkem i pohlavím.

Podobné aplikace nicméně dělají oboru A.I. spíše medvědí službu. Skoro to totiž vypadá, že tyto technologie neumějí nic jiného – natož něco opravdu praktického, co nás jako společnost posune zase o kousek dál.

Selfie římského císaře z počátku letopočtu

Daniel Voshart se nyní ve svém zápisku na Mediu pokouší přesvědčit všechny případné skeptiky, že tak tomu určitě není a transformace obrazových dat opravdu není jen jakási laciná pouťová atrakce, ale nástroj, který by mohl neuvěřitelným způsobem pomoci třeba historikům, archeologům a antropologům.



CGI snímky římských císařů Augusta a Maximina Thraxe podle fotografií jejich soch a bust (Zdroj: Daniel Voshart)

Daniel si totiž položil otázku, jak by asi vypadali římští císaři z přelomu letopočtu, když by kdysi okolo let 27 př. n. l. až 285 n. l. existoval fotoaparát.

Antika se proslavila svými realistickými torzy těl, bustami a dalším personifikovaným sochařským uměním, ze kterého lze vydedukovat základní kontury a rysy tváří tehdejších vladařů. Voshart tímto způsobem posbíral a upravil na 800 snímků padesátky Římanů a v dalším kroku potřeboval provést přesně to, co známe z aplikací jako třeba právě FaceApp.

Další fotografie císařů najdete v galerii v záhlaví článku

Generative Adversial Network

Mnohé z nich využívají v posledních letech velmi populární techniku strojového učení GAN – Generative Adversial Network. Nejsem si úplně jistý, zdali existuje nějaký široce uznávaný český překlad, v podstatě se ale jedná o techniku strojového učení se dvěma soupeřícími sítěmi.



Hřebeny Čížkova Sněžníku (1 925 m n. m.). I když byste tam chtěli strávit dovolenou, máte smůlu, Čížkův Sněžník totiž neexistuje. Vytvořila jej technologie GAN.

Zatímco jedna síť generuje fiktivní data, druhá síť tato strojově vytvořená data porovnává se skutečnými a dává té první zpětně vědět, jak se ji dařilo. Postupným opakováním se celý systém zlepšuje a zlepšuje, až začne generátor vytvářet fiktivní data, která jsou téměř k nerozeznání od originálu.

Ale pozor, neznamená to, že vytvoří kopii 1:1, což nedává smysl, prootže by prostě stačilo klepnout na CTRL+C a CTRL+V, ale že vytvoří odvozeninu, která má rysy originálu. To je mnohem cennější a komplikovanější.



Hřebeny Králického Sněžníku (1 424 m n. m.) z rozhledny Val. Toto je už skutečné místo i skutečná fotografie. Posloužila jako kompoziční základ pro strojovou syntézu výše.

Kvalitně naučený GAN proto dokáže syntetizovat věrohodná zvuková data, dokáže vytvářet text, ale nás zajímá to třetí – dokáže generovat už relativně fotorealistická obrazová data. Tedy obrázky, které jsou sice fiktivní, ale přesto tak věrohodné.

Selfie fotografie lidí, kteří neexistují

Typickým příkladem je třeba právě selfie. GAN, který se na tisících fotografií osob naučil, jak na pixelové úrovni vypadají rysy lidského obličeje, je dokáže opět na pixelové úrovni syntetizovat a vytvořit tak fotografii člověka, který nikdy neexistoval.



Vlevo skutečná předloha s fotografií autora článku, vpravo „děti“ – odvozené tváře příbuzných, a přesto neexistujících osob, které vytvořila síť GAN

Co je však ještě mnohem důležitější, podobné GAN systémy jsou samozřejmě parametrické, takže nemusejí vytvářet jen nějaký náhodný obličej – šum, ale obličej, který přesně hledáme. Třeba obličej ženy, muže, mladého, starého, bílého, tmavšího…

Jelikož se síť učila na perfektně popsaných datech a viděla nepřeberné množství (třeba) modrookých Švédek, dokáže na náš povel vygenerovat i nějakou další modrookou Švédku.



Siddharth Čížek, Muhammad Čížek a Santiago Jesús Čížek, aneb parametrická transformace vstupní fotografie pomocí základních fyziologických rysů

Anebo, a to se už konečně dostáváme k pointě s římskými císaři, dokáže rysy modrooké Švédky přenést na fotografii úplně jiné osoby. Vždyť to v obou případech není nic jiného než matice pixelů, kterou naše neuronová síť zná do posledního bitu.

Antická socha + GAN = fotografie císaře

Co tedy Daniel udělal? Rysy antických bust, rytin z mincí i velkých soch pomocí techniky GAN prolnul s fotografickým modelem mužské tváře odpovídajících parametrů. Výsledek je… Bez nadsázky ohromující.



Císař Augustus na kamenné předloze a ve vizualizaci pomocí GAN (Zdroj: Daniel Voshart)

Možná namítnete, že s podobnými technikami archeologové, antropologové, specialisté z oblasti forenzních věd a další experti pracují už dávno, a tak ručně vymodelují hrubou podobu člověka, u něhož znají leda tak jeho lebku, jenže zatímco člověk má přece jen omezenou paměť, stroj může i ty nejdrobnější fyziologické rysy a nuance porovnat s modelem postaveným na tisících nebo i milionech tváří. To nedokáže žádný člověk na světě.



Císař Tiberius na kamenné předloze a ve vizualizaci pomocí GAN (Zdroj: Daniel Voshart)

Artbreeder v prohlížeči

Technika GAN v posledních letech vdechla život i několika zajímavým webovým experimentům na hraně vizuálního umění. K těm nejznámějším dnes patří Artbreeder, který využil i Daniel a který si můžete vyzkoušet přímo ve svém prohlížeči a bez potřeby doktorátu z matematiky.



Generátor fiktivní grafiky Artbreeder. Stačí zvolit typ snímku a začít si hrát na boha.

Artbreeder se věnuje tzv. breedingu, tedy technice, kdy člověk pomocí vlastní kreativity a stroje v pozadí vytváří na základě vstupních dat nějaký nový odvozený originál. Díky použití A.I. sítí typu GAN je přitom výsledek často opravdu fotorealistický.

Může to být třeba fotografie krajinky z vašeho mobilu, kterou do Artbreederu nahrajete, počkáte si, než ji servery patřičně zpracují, no a pak pomocí hromady posuvníků transformujete data takovým způsobem, že se vám snímek Králického Sněžníku promění v jakýsi fiktivní štít velehor.



Parametrický generátor krajiny podle předlohy zcela vlevo. Všimněte si, že vpravo je několik možností v podstatě identické scény, ačkoliv je to pokaždé úplně jiné místo.

Vaše nastavení oněch posuvníků jsou vlastně parametry, které pak Artbreeder předal neuronové síti BigGAN, kterou loni publikoval britský DeepMind (Google) a nabídl ji všem výzkumníkům pod svobodnou licencí.

Osobitá fikce

Výsledek přitom není jen jakási náhodná strojová syntéza bez špetky osobitosti, právě nastavením parametrů jste totiž do díla vtiskli svoji kreativitu a autorský záměr.

Takže všeho nechte a vypusťte svoji kreativitu z okovů právě na Artbreederu. Po jednoduché registraci můžete zdarma k analýze nahrát několik vlastních fotografií a transformovat je do něčeho úplně jiného a nového, přičemž pro ty nejzkušenější jsou k dispozici i zdrojáky na GitHubu.