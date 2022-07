OpenAI patří ke špičce vývoje umělé inteligence, která se zaměřuje na zpracování a pochopení textových a obrazových dat. Vše začalo v roce 2018 s vývojem první architektury GPT, další rok přišlo vylepšené GPT-2 a v roce 2020 už verze GPT-3 pracovala se 175 miliardami parametrů.

V této fázi systém zvládá konverzaci s člověkem na takové úrovni, že už lze těžko rozpoznat, že jde o umělou inteligenci. Dokáže pochopit třeba i programový kód v různých jazycích, psát vtipy, scénáře a další.

DALL-E: výměna textu za pixely

Systém DALL-E je jinou formou GPT-3, která se zaměřuje na obraz. Základní systém rozpozná z textu, co po něm chcete, a druhá část podle toho vygeneruje několik různých obrazů, při opětovném dotazu vytvoří nové, takže je každý unikátní.

Jednoduché rozhraní DALL-E

První generace DALL-E byla trénovaná na více než 400 milionech obrázků z celého internetu, DALL-E 2 pracuje s 3,5 miliardami parametrů a generuje obrázky s 4× vyšším rozlišením. Může jít o kresby, realistické fotografie nebo 3D grafiku, vše v jakémkoli stylu, třeba i podle konkrétního umělce.

V rozhraní betaverze DALL-E lze také nahrát vlastní obrázek, který si můžete nechat upravit a podle kterého můžete vytvořit jiné. Různé variace nebo jen zkopírovat styl grafiky a obrazu.

Čím přesnější zadání, tím lepší

Při zadávání textového popisu v angličtině máte zcela volnou ruku. OpenAI dodává, že je lepší popisovat co nejpřesněji, takže DALL-E bude lépe vědět, co má vytvořit a minimalizujete tak další úpravy.

Ideální je zadat dotaz (přeloženo z angličtiny) „Astronaut, který jede na koni ve vesmíru, fotorealistický styl“. DALL-E přitom chápe vyšší koncepty a pokud do obrázku chcete přidat třeba nějaký dodatečný objekt, správně k němu přidá i stín a odrazy na případném lesklém materiálu tak, aby to odpovídalo zdroji světla a úhlu. Tedy pokud jde o realistický styl.

Umělci budou žít napořád

Že DALL-E dokáže napodobit jakýkoli styl umělce, přeneseně znamená, že lze vytvořit obrazy od umělců, kteří už nejsou na světě. Můj oblíbený test je vytvoření nákresů jako od Leonarda Da Vinci pro moderní objekty. V galerii si jich pár můžete prohlédnout a jsou to skvosty.

Každý takový obraz si dokážu představit, že může být okrasou na zdi. DALL-E a budoucí systémy zajistí, že umělci budou prostřednictvím své tvorby „nesmrtelní“. To je možnost, která doposud byla jen v rukou konkrétních lidí, kteří byli schopní styl zkopírovat.



Tesla Model S, ručně nakreslená od od Leonarda Da Vinciho, na starém papíře (zadání, které systém dostal, najdete v popisku obrázku v galerii)

Nyní tento efekt vidíme na obrazech, ale do budoucna jistě bude takto možné vytvořit písničky, knihy, filmy a další obsah od známých zpěváků, režisérů, herců a dalších osobností, kteří už třeba nežijí. Jediným předpokladem je, aby měl systém dostatek dat, aby „nasál“ styl umělce.



Darth Vader od Van Gogha a Picassa (Zdroj: DALL-E)

Nemusí to přitom končit stylem, ale třeba i chováním a podobou člověka. Technologie deep fake už dokáže skvěle simulovat obličeje, podobně je tomu u simulace hlasu. V budoucnosti lze jistě čekat i technologie, které coby služba budou simulovat třeba i vaše milované, kteří už nejsou mezi námi. Bez velkého množství kvalitních dat to ale nepůjde.

Darth Vader a Chewbacca si dávají páku, digitální umění (Zdroj: DALL-E)

Pokud si chcete zajistit simulovanou nesmrtelnost, své milované fotografujte často, natáčejte je při různých příležitostech, ze všech možných úhlů, ve vysokém rozlišení, s kvalitní zvukem a podobně. Pokud byste chtěli jít do extrémů, nahrávejte si rozhovory a běžný život, nikoli pouze speciální události. Mobilní telefony zvládající 4K@60 už má většina z nás neustále v kapse, tak je pořádně využívejte. V budoucnu mohou mít tato data pro vás cenu zlata právě pro rekonstrukci a simulaci.

Byznys model DALL-E

K DALL-E jsem se dostal ještě před betaverzí, kdy bylo zakázáno jakékoli komerční použití, protože všechny generované obrázky a fotografie jsou ve vlastnictví OpenAI.

S betaverzí už ale DALL-E přechází na byznys model, kdy vygenerované obrázky vlastníte a můžete je tak využívat komerčně, včetně prodeje, tisku a použití pro různé produkty. Stále však platí omezení – nesmíte šířit nic s lidskými tvářemi, násilné nebo „krvavé“ věci, urážlivé náboženské obrazy a další.



Ukázka upřesňování dotazu a neustále nově a jinak generovaných obrázků (Zdroj: DALL-E)

Každý uživatel dostává pro první měsíc kredit 50 generování a poté každý měsíc 15 generování zdarma. Kredit pro dalších 115 generování stojí 15 dolarů. Každé generování zahrnuje 4 různé obrázky (dříve bylo 6, ale došlo k omezení). A věřte mi, že tuto kapacitu dokážete využít velmi rychle. Obvykle totiž zkoušíte spoustu generování, než se dostanete k cíli, obzvláště pokud jde o konkrétní detaily, které chcete vidět v obraze.

Budou z grafiků bezdomovci?

DALL-E a nový byznys model znamená, že už si můžete nechat vygenerovat jakékoli obrázky a koláže za naprosto minimální cenu a okamžitě. Co by u grafika trvalo dny a tisíce korun, DALL-E zvládne za pár sekund a za jednotky korun a můžete si okamžitě vygenerovat obrovské množství variací.

Tomáš Garrigue Masaryk jako hacker na svým kompu. Tohle by asi nezvládl ani lidský grafik (Zdroj: DALL-E)

Co tedy bude s grafiky? Je to podobné jako u programátorů, kteří už také většinou neprogramují v assembleru, ale přešli na vyšší jazyky. Grafici se tak musí přizpůsobit a DALL-E brát jako nový nástroj, který jim umožní pracovat efektivněji – z pohledu času i nákladů. Grafický architekt je asi to slovo, kam by se normální grafik měl posunout – bude schopen tento nástroj velmi dobře ovládat, bude znát jeho slabiny, jak přesně se ho ptát na určité věci a rozšíří objem práce, kterou bude obstarávat a sjednocovat třeba do jednoho grafického stylu.

Zajímavostí je, že DALL-E je vlastně strašák nejen pro grafiky, ale i pro starší nástroje typu Photoshop a podobně, které z budoucího pohledu nebudou tolik potřeba. Už nemusíte řešit spoustu věcí přímo ve Photoshopu, prostě to řeknete DALL-E a ten to během pár sekund udělá.

DALL-E je revoluce, která postupně změní mnoho segmentů a ovlivní budoucnost řady oblastí. Tvorbu dat všeho druhu čeká zemětřesení, které tu v historii doposud nebylo.