Technologie | Historie | Umělá inteligence

Toto není žádný FaceApp! GAN z vás udělá Inda a ukáže fotky císařů ze starověku

  • GAN je počítačová technika umělé tvorby grafických dat
  • Vytvoří fotografii fiktivního člověka nebo krajiny
  • Expert vytvořil možnou podobu římských císařů

Nějakým tím generátorem obrázků, který využívá prvky A.I., už dnes nikoho neoslníte. Loňské léto svých pět minut slávy zažil inovovaný FaceApp, a sociální sítě poté zaneřádily tisíce selfies s upraveným věkem i pohlavím.

Podobné aplikace nicméně dělají oboru A.I. spíše medvědí službu. Skoro to totiž vypadá, že tyto technologie neumějí nic jiného – natož něco opravdu praktického, co nás jako společnost posune zase o kousek dál.

Selfie římského císaře z počátku letopočtu

Daniel Voshart se nyní ve svém zápisku na Mediu pokouší přesvědčit všechny případné skeptiky, že tak tomu určitě není a transformace obrazových dat opravdu není jen jakási laciná pouťová atrakce, ale nástroj, který by mohl neuvěřitelným způsobem pomoci třeba historikům, archeologům a antropologům.

Klepněte pro větší obrázek
CGI snímky římských císařů Augusta a Maximina Thraxe podle fotografií jejich soch a bust (Zdroj: Daniel Voshart)

Daniel si totiž položil otázku, jak by asi vypadali římští císaři z přelomu letopočtu, když by kdysi okolo let 27 př. n. l. až 285 n. l. existoval fotoaparát.

Antika se proslavila svými realistickými torzy těl, bustami a dalším personifikovaným sochařským uměním, ze kterého lze vydedukovat základní kontury a rysy tváří tehdejších vladařů. Voshart tímto způsobem posbíral a upravil na 800 snímků padesátky Římanů a v dalším kroku potřeboval provést přesně to, co známe z aplikací jako třeba právě FaceApp.

Další fotografie císařů najdete v galerii v záhlaví článku

Generative Adversial Network

Mnohé z nich využívají v posledních letech velmi populární techniku strojového učení GAN – Generative Adversial Network. Nejsem si úplně jistý, zdali existuje nějaký široce uznávaný český překlad, v podstatě se ale jedná o techniku strojového učení se dvěma soupeřícími sítěmi.

Klepněte pro větší obrázek
Hřebeny Čížkova Sněžníku (1 925 m n. m.). I když byste tam chtěli strávit dovolenou, máte smůlu, Čížkův Sněžník totiž neexistuje. Vytvořila jej  technologie GAN.

Zatímco jedna síť generuje fiktivní data, druhá síť tato strojově vytvořená data porovnává se skutečnými a dává té první zpětně vědět, jak se ji dařilo. Postupným opakováním se celý systém zlepšuje a zlepšuje, až začne generátor vytvářet fiktivní data, která jsou téměř k nerozeznání od originálu.

Ale pozor, neznamená to, že vytvoří kopii 1:1, což nedává smysl, prootže by prostě stačilo klepnout na CTRL+C a CTRL+V, ale že vytvoří odvozeninu, která má rysy originálu. To je mnohem cennější a komplikovanější.

Klepněte pro větší obrázek
Hřebeny Králického Sněžníku (1 424 m n. m.) z rozhledny Val. Toto je už skutečné místo i skutečná fotografie. Posloužila jako kompoziční základ pro strojovou syntézu výše.

Kvalitně naučený GAN proto dokáže syntetizovat věrohodná zvuková data, dokáže vytvářet text, ale nás zajímá to třetí – dokáže generovat už relativně fotorealistická obrazová data. Tedy obrázky, které jsou sice fiktivní, ale přesto tak věrohodné.

Selfie fotografie lidí, kteří neexistují

Typickým příkladem je třeba právě selfie. GAN, který se na tisících fotografií osob naučil, jak na pixelové úrovni vypadají rysy lidského obličeje, je dokáže opět na pixelové úrovni syntetizovat a vytvořit tak fotografii člověka, který nikdy neexistoval.

Klepněte pro větší obrázek
Vlevo skutečná předloha s fotografií autora článku, vpravo „děti“ – odvozené tváře příbuzných, a přesto neexistujících osob, které vytvořila síť GAN

Co je však ještě mnohem důležitější, podobné GAN systémy jsou samozřejmě parametrické, takže nemusejí vytvářet jen nějaký náhodný obličej – šum, ale obličej, který přesně hledáme. Třeba obličej ženy, muže, mladého, starého, bílého, tmavšího…

Jelikož se síť učila na perfektně popsaných datech a viděla nepřeberné množství (třeba) modrookých Švédek, dokáže na náš povel vygenerovat i nějakou další modrookou Švédku.

Klepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázek
Siddharth Čížek, Muhammad Čížek a Santiago Jesús Čížek, aneb parametrická transformace vstupní fotografie pomocí základních fyziologických rysů

Anebo, a to se už konečně dostáváme k pointě s římskými císaři, dokáže rysy modrooké Švédky přenést na fotografii úplně jiné osoby. Vždyť to v obou případech není nic jiného než matice pixelů, kterou naše neuronová síť zná do posledního bitu.

Antická socha + GAN = fotografie císaře

Co tedy Daniel udělal? Rysy antických bust, rytin z mincí i velkých soch pomocí techniky GAN prolnul s fotografickým modelem mužské tváře odpovídajících parametrů. Výsledek je… Bez nadsázky ohromující.

Klepněte pro větší obrázek
Císař Augustus na kamenné předloze a ve vizualizaci pomocí GAN (Zdroj: Daniel Voshart)

Možná namítnete, že s podobnými technikami archeologové, antropologové, specialisté z oblasti forenzních věd a další experti pracují už dávno, a tak ručně vymodelují hrubou podobu člověka, u něhož znají leda tak jeho lebku, jenže zatímco člověk má přece jen omezenou paměť, stroj může i ty nejdrobnější fyziologické rysy a nuance porovnat s modelem postaveným na tisících nebo i milionech tváří. To nedokáže žádný člověk na světě.

Klepněte pro větší obrázek
Císař Tiberius na kamenné předloze a ve vizualizaci pomocí GAN (Zdroj: Daniel Voshart)

Artbreeder v prohlížeči

Technika GAN v posledních letech vdechla život i několika zajímavým webovým experimentům na hraně vizuálního umění. K těm nejznámějším dnes patří Artbreeder, který využil i Daniel a který si můžete vyzkoušet přímo ve svém prohlížeči a bez potřeby doktorátu z matematiky.

Klepněte pro větší obrázek
Generátor fiktivní grafiky Artbreeder. Stačí zvolit typ snímku a začít si hrát na boha.

Artbreeder se věnuje tzv. breedingu, tedy technice, kdy člověk pomocí vlastní kreativity a stroje v pozadí vytváří na základě vstupních dat nějaký nový odvozený originál. Díky použití A.I. sítí typu GAN je přitom výsledek často opravdu fotorealistický.

Může to být třeba fotografie krajinky z vašeho mobilu, kterou do Artbreederu nahrajete, počkáte si, než ji servery patřičně zpracují, no a pak pomocí hromady posuvníků transformujete data takovým způsobem, že se vám snímek Králického Sněžníku promění v jakýsi fiktivní štít velehor.

Klepněte pro větší obrázek
Parametrický generátor krajiny podle předlohy zcela vlevo. Všimněte si, že vpravo je několik možností v podstatě identické scény, ačkoliv je to pokaždé úplně jiné místo.

Vaše nastavení oněch posuvníků jsou vlastně parametry, které pak Artbreeder předal neuronové síti BigGAN, kterou loni publikoval britský DeepMind (Google) a nabídl ji všem výzkumníkům pod svobodnou licencí.

Osobitá fikce

Výsledek přitom není jen jakási náhodná strojová syntéza bez špetky osobitosti, právě nastavením parametrů jste totiž do díla vtiskli svoji kreativitu a autorský záměr.

Takže všeho nechte a vypusťte svoji kreativitu z okovů právě na Artbreederu. Po jednoduché registraci můžete zdarma k analýze nahrát několik vlastních fotografií a transformovat je do něčeho úplně jiného a nového, přičemž pro ty nejzkušenější jsou k dispozici i zdrojáky na GitHubu.

Diskuze (6) Další článek: Google odkládá mobile-first indexování ve vyhledávání. Vývojáři mají skoro rok navíc

Témata článku: Technologie, Technika, Historie, Google, Web, Umělá inteligence, Neuronová síť, GitHub, Strojové učení, DeepMind, CTRL + V, Daniel, Rys, FaceApp, Augustus, Data, Starověk, CTRL + C, Ind, Císař, Fotografie, Val, Gan


Určitě si přečtěte

Windows 10 May 2020 Update je venku. Odstraňuje hesla a přináší Linux

Windows 10 May 2020 Update je venku. Odstraňuje hesla a přináší Linux

** Jarní aktualizace Desítek přináší dost novinek, jsou ale spíš menší ** Zlepšují se stabilita, rychlost i komfort ovládání ** Revoluce ve Windows 10 teprve přijde

Vladislav Kluska | 93

Apple vychrlil novinky: Nové operační systémy a příprava na vlastní procesory

Apple vychrlil novinky: Nové operační systémy a příprava na vlastní procesory

** Apple dnes představuje novinky ** Tradiční keynote v rámci konference WWDC probíhá jen online ** Nové operační systémy, ale i něco navíc

David Polesný | 108

Apple má šanci definitivně se uzamknout. macOS byl na jeho poměry až příliš otevřený

Apple má šanci definitivně se uzamknout. macOS byl na jeho poměry až příliš otevřený

** Apple, vývojáře i uživatele rozhodně nečekají dva roky prázdnin ** macOS se může uzavřít podobně jako iOS a iPadOS ** Přechod na Arm znamená stopku pro hackintoshe

Lukáš Václavík | 105

Nové názvy, upravený vývoj. Microsoft ukázal, jak teď bude vydávat Windows 10

Nové názvy, upravený vývoj. Microsoft ukázal, jak teď bude vydávat Windows 10

** Podzimní vydání Windows 10 přinese jen minimum novinek ** Aktualizace ponese formální označení 20H2 ** Microsoft mění názvy v programu Windows Insider

Lukáš Václavík | 17


Aktuální číslo časopisu Computer

Megatest: nejlepší notebooky do 20 000 Kč

Test 8 levných IP kamer

Jak vybrat bezdrátová sluchátka

Testujeme Android 11