Neuronka DALL-E nakreslí pandu v pyžamu venčící psa a další bizarní kousky

Neuronka DALL-E nakreslí pandu v pyžamu venčící psa a další bizarní kousky

Poslední roky se doslova roztrhl pytel s všemožnými generativními neuronovými sítěmi. Vědci už dnes strojově pomocí NN generují umělý zvuk, text, obrázky, virtuální města a nakonec i ženská poprsí a klíny.

Už by to snad začala být i nuda, kdyby se ovšem krátce po Novém roce opět neozvala laboratoř OpenAI, která se specializuje zejména na text. Její neuronová síť GPT-3 si během učení přečetla téměř všechny anglické texty na internetu, načež se naučila vytvářet text na libovolné téma.

Dětská panda v pyžamu venčí psa

Vědci z OpenAI zapojili do hry zjednodušenou verzi GPT-3 a trénovali ji generovat obrázky z textových obrázků. Jako učební zdroj sloužily páry text-obrázek. Výsledek se jmenuje DALL-E a stojí za to.

Jelikož se neuronová síť GPT-3 doposud specializovala především na textovou informaci, dokázala jej perfektně skloubit obrazem a generuje fiktivní grafiku na základě přirozeného anglického vstupu.

1ee8b2f9-cc3e-46db-a5e9-96685295b5af
Nakresli pandu v pyžamu, jak venči psa

A pozor, tím nemám na mysli dnes už primitivní příkaz: „Nakresli kočku,“ ale mnohem komplexnější: „Nakresli dětskou pandu v pyžamu, jak venčí psa!“ DALL-E splní podobný bizarní úkol dříve, než si průměrný Homo sapiens sapiens podobnou bizarní scénu vůbec stačí představit.

Nakresli křeslo ve tvaru avokáda

DALL-E ale zvládne i mnohem rozumnější úkoly, které mohou podněcovat naši kreativitu. Dejme tomu, že potřebujete do obývacího pokoje nějaké osobité křeslo, které nikdo nemá. A tak požádáte neuronku, aby nakreslila křeslo ve tvaru avokáda. Člověka by takový nesmysl nejspíše nikdy nenapadl, ovšem síť, jejíž nitro tvoří několik miliard rozhodovacích vah, zvládne i takový úkol.

39298cd1-bbf4-4868-8197-16b641221bff2ad2f8b6-4623-4e0e-a67d-7833d894475342c705d4-d6e1-466b-bc8c-a595433923b9
Nakresli křeslo ve tvaru avokáda, ledovce a prasátka

Laboratoř OpenAI se na blogu pochlubila s hromadou dalších interaktivních ukázek, které si můžete sami vyzkoušet, čili se můžete podívat i na to, jak si DALL-E představuje, že vypadá třeba jídlo v České republice.

Stále čekáme na praktické aplikace

Výsledky jsou obdivuhodné, pochopitelný údiv internetové komunity musíme ale trošku utlumit rýpavou otázkou: K čemu je to vlastně dobré? Ať už totiž s nějakou podobnou lahůdkou vyrukuje britský Deepmind, anebo americký OpenAI, vždy to jsou v prvé řadě líbivá dema, ale už bychom asi chtěli, aby někdo dokázal základní technologii aplikovat i do skutečného světa a něčeho opravdu praktického.

OpenAI se o to sice snaží, nabízí svoje technologie jako službu, faktem však zůstává, že praktických koncových aplikací je zatím spíše jako šafránu a stále se jedná především o primární výzkum v oblasti A.I.

Určitě si přečtěte

Články odjinud