Umělá inteligence | Byznys | OpenAI

Vyzkoušeli jsme DALL-E 2, noční můru všech grafiků. Umělá inteligence zvládne náročné koláže a má smysl pro humor

  • OpenAI uvolnilo do betaverze umělou inteligenci DALL-E pro generování obrázků a fotografií
  • Technologie zvládne generovat obrazy všeho druhu i podle jakéhokoli stylu
DALL-E, OpenAI
Vyzkoušeli jsme DALL-E 2, noční můru všech grafiků. Umělá inteligence zvládne náročné koláže a má smysl pro humor | DALL-E, OpenAI

OpenAI patří ke špičce vývoje umělé inteligence, která se zaměřuje na zpracování a pochopení textových a obrazových dat. Vše začalo v roce 2018 s vývojem první architektury GPT, další rok přišlo vylepšené GPT-2 a v roce 2020 už verze GPT-3 pracovala se 175 miliardami parametrů.

V této fázi systém zvládá konverzaci s člověkem na takové úrovni, že už lze těžko rozpoznat, že jde o umělou inteligenci. Dokáže pochopit třeba i programový kód v různých jazycích, psát vtipy, scénáře a další.

DALL-E: výměna textu za pixely

Systém DALL-E je jinou formou GPT-3, která se zaměřuje na obraz. Základní systém rozpozná z textu, co po něm chcete, a druhá část podle toho vygeneruje několik různých obrazů, při opětovném dotazu vytvoří nové, takže je každý unikátní.

Klepněte pro větší obrázekJednoduché rozhraní DALL-E

První generace DALL-E byla trénovaná na více než 400 milionech obrázků z celého internetu, DALL-E 2 pracuje s 3,5 miliardami parametrů a generuje obrázky s 4× vyšším rozlišením. Může jít o kresby, realistické fotografie nebo 3D grafiku, vše v jakémkoli stylu, třeba i podle konkrétního umělce.

V rozhraní betaverze DALL-E lze také nahrát vlastní obrázek, který si můžete nechat upravit a podle kterého můžete vytvořit jiné. Různé variace nebo jen zkopírovat styl grafiky a obrazu.

Čím přesnější zadání, tím lepší

Při zadávání textového popisu v angličtině máte zcela volnou ruku. OpenAI dodává, že je lepší popisovat co nejpřesněji, takže DALL-E bude lépe vědět, co má vytvořit a minimalizujete tak další úpravy.

Klepněte pro větší obrázek

Ideální je zadat dotaz (přeloženo z angličtiny) „Astronaut, který jede na koni ve vesmíru, fotorealistický styl“. DALL-E přitom chápe vyšší koncepty a pokud do obrázku chcete přidat třeba nějaký dodatečný objekt, správně k němu přidá i stín a odrazy na případném lesklém materiálu tak, aby to odpovídalo zdroji světla a úhlu. Tedy pokud jde o realistický styl.

Klepněte pro větší obrázek

Umělci budou žít napořád

Že DALL-E dokáže napodobit jakýkoli styl umělce, přeneseně znamená, že lze vytvořit obrazy od umělců, kteří už nejsou na světě. Můj oblíbený test je vytvoření nákresů jako od Leonarda Da Vinci pro moderní objekty. V galerii si jich pár můžete prohlédnout a jsou to skvosty.

Každý takový obraz si dokážu představit, že může být okrasou na zdi. DALL-E a budoucí systémy zajistí, že umělci budou prostřednictvím své tvorby „nesmrtelní“. To je možnost, která doposud byla jen v rukou konkrétních lidí, kteří byli schopní styl zkopírovat.

Klepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázek
Tesla Model S, ručně nakreslená od od Leonarda Da Vinciho, na starém papíře (zadání, které systém dostal, najdete v popisku obrázku v galerii)

Nyní tento efekt vidíme na obrazech, ale do budoucna jistě bude takto možné vytvořit písničky, knihy, filmy a další obsah od známých zpěváků, režisérů, herců a dalších osobností, kteří už třeba nežijí. Jediným předpokladem je, aby měl systém dostatek dat, aby „nasál“ styl umělce.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Darth Vader od Van Gogha a Picassa (Zdroj: DALL-E)

Nemusí to přitom končit stylem, ale třeba i chováním a podobou člověka. Technologie deep fake už dokáže skvěle simulovat obličeje, podobně je tomu u simulace hlasu. V budoucnosti lze jistě čekat i technologie, které coby služba budou simulovat třeba i vaše milované, kteří už nejsou mezi námi. Bez velkého množství kvalitních dat to ale nepůjde.

Klepněte pro větší obrázekDarth Vader a Chewbacca si dávají páku, digitální umění (Zdroj: DALL-E)

Pokud si chcete zajistit simulovanou nesmrtelnost, své milované fotografujte často, natáčejte je při různých příležitostech, ze všech možných úhlů, ve vysokém rozlišení, s kvalitní zvukem a podobně. Pokud byste chtěli jít do extrémů, nahrávejte si rozhovory a běžný život, nikoli pouze speciální události. Mobilní telefony zvládající 4K@60 už má většina z nás neustále v kapse, tak je pořádně využívejte. V budoucnu mohou mít tato data pro vás cenu zlata právě pro rekonstrukci a simulaci.

Byznys model DALL-E

K DALL-E jsem se dostal ještě před betaverzí, kdy bylo zakázáno jakékoli komerční použití, protože všechny generované obrázky a fotografie jsou ve vlastnictví OpenAI.

S betaverzí už ale DALL-E přechází na byznys model, kdy vygenerované obrázky vlastníte a můžete je tak využívat komerčně, včetně prodeje, tisku a použití pro různé produkty. Stále však platí omezení – nesmíte šířit nic s lidskými tvářemi, násilné nebo „krvavé“ věci, urážlivé náboženské obrazy a další.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Klepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázek
Ukázka upřesňování dotazu a neustále nově a jinak generovaných obrázků (Zdroj: DALL-E)

Každý uživatel dostává pro první měsíc kredit 50 generování a poté každý měsíc 15 generování zdarma. Kredit pro dalších 115 generování stojí 15 dolarů. Každé generování zahrnuje 4 různé obrázky (dříve bylo 6, ale došlo k omezení). A věřte mi, že tuto kapacitu dokážete využít velmi rychle. Obvykle totiž zkoušíte spoustu generování, než se dostanete k cíli, obzvláště pokud jde o konkrétní detaily, které chcete vidět v obraze.

Budou z grafiků bezdomovci?

DALL-E a nový byznys model znamená, že už si můžete nechat vygenerovat jakékoli obrázky a koláže za naprosto minimální cenu a okamžitě. Co by u grafika trvalo dny a tisíce korun, DALL-E zvládne za pár sekund a za jednotky korun a můžete si okamžitě vygenerovat obrovské množství variací.

Klepněte pro větší obrázekTomáš Garrigue Masaryk jako hacker na svým kompu. Tohle by asi nezvládl ani  lidský grafik (Zdroj: DALL-E)

Co tedy bude s grafiky? Je to podobné jako u programátorů, kteří už také většinou neprogramují v assembleru, ale přešli na vyšší jazyky. Grafici se tak musí přizpůsobit a DALL-E brát jako nový nástroj, který jim umožní pracovat efektivněji – z pohledu času i nákladů. Grafický architekt je asi to slovo, kam by se normální grafik měl posunout – bude schopen tento nástroj velmi dobře ovládat, bude znát jeho slabiny, jak přesně se ho ptát na určité věci a rozšíří objem práce, kterou bude obstarávat a sjednocovat třeba do jednoho grafického stylu.

Zajímavostí je, že DALL-E je vlastně strašák nejen pro grafiky, ale i pro starší nástroje typu Photoshop a podobně, které z budoucího pohledu nebudou tolik potřeba. Už nemusíte řešit spoustu věcí přímo ve Photoshopu, prostě to řeknete DALL-E a ten to během pár sekund udělá.

DALL-E je revoluce, která postupně změní mnoho segmentů a ovlivní budoucnost řady oblastí. Tvorbu dat všeho druhu čeká zemětřesení, které tu v historii doposud nebylo.

Diskuze (11) Další článek: Americký startup CO2Rail chce zachytávat CO2 ze vzduchu pomocí speciálních železničních vagónů

Témata článku: Umělá inteligence, Byznys, Internet, Tesla, Neuronová síť, Grafický editor, Strojové učení, Betaverze, Fotografování, Adobe Photoshop, OpenAI, Obraz, Darth Vader, Leonard Da Vinci, Noční můra, Koláž, Obrázek, Generování, Da Vinci, Styl, Vincent Van Gogh, Picasso, GPT, Photoshop, DALL-E



Sex manželských párů? Jen výjimečně. Ložnice ovládnou roboti s umělou inteligencí

Sex manželských párů? Jen výjimečně. Ložnice ovládnou roboti s umělou inteligencí

** Sex manželských párů jen při zvláštních příležitostech. ** Ložnice ovládnou sexuální roboti s umělou inteligencí. ** I to je jeden ze závěrů Mezinárodní robotické konference.

Filip KůželJiří Liebreich
RobotiSexUmělá inteligence
Když se hardwarová firma pustí i do softwaru. Telefon pro Snapdragon Insidery se zasekl na Androidu 11

Když se hardwarová firma pustí i do softwaru. Telefon pro Snapdragon Insidery se zasekl na Androidu 11

** Telefon od Snapdragonu měl být výkladní skříní značky ** Po necelém roce trží na Androidu 11 s lednovým zabezpečením ** Telefon se doprodává a prakticky byl odstaven na druhou kolej

Martin Chroust
Android 11QualcommSmartphony
Jak zabezpečit domácí síť. 10 rad pro klidnější digitální existenci

Jak zabezpečit domácí síť. 10 rad pro klidnější digitální existenci

Těchto deset jednoduchých kroků zásadně zvýší bezpečnost vaší sítě. Projděte si je, zda jste něco neopomněli.

Jiří KurucAntonín Trčálek
SíťBezpečnost
Dvě mouchy jednou ranou. Biotechnologický startup vyrábí protein do krmiv z oxidu uhličitého

Dvě mouchy jednou ranou. Biotechnologický startup vyrábí protein do krmiv z oxidu uhličitého

Pomocí fermentace plynu se mění CO₂ z průmyslových emisí do jednobuněčného proteinu použitelného v krmivech.

Horizon magazineTom Cassauwers
CO2StartupyTechnologie
Nastal pravý čas na výměnu telefonu. Jak poznat, že ten váš už dosluhuje?

Nastal pravý čas na výměnu telefonu. Jak poznat, že ten váš už dosluhuje?

** Jak poznat, že váš telefon má nejlepší dny za sebou? ** Vypadá potlučeně, má pavučinu nebo nedostává aktualizace? ** Ukážeme si, kdy má smysl jeho oprava, a kdy už jen koupě nového

Martin Chroust
Prasklý displejVysloužilý mobilSmartphony
Testujeme Samsung Galaxy Z Fold4. Není to revoluce, ale spíš odstraňování neduhů třetí generace

Testujeme Samsung Galaxy Z Fold4. Není to revoluce, ale spíš odstraňování neduhů třetí generace

** Do redakce nám dorazil skládací Galaxy Z Fold4 ** Změn není tolik, ale zato jsou smysluplné ** Telefon nám dorazil v šedozelené barevné kombinaci

Martin Chroust
Skládací konstrukcePreview
Jak poznat, že máte možná hacknutý telefon? Toto je devět symptomů, které můžete pozorovat

Jak poznat, že máte možná hacknutý telefon? Toto je devět symptomů, které můžete pozorovat

** Jak poznat, že je váš smartphone hacknutý? ** Hledejte známky po nestandardním chování telefonu ** Stačí když telefon vydrží méně nebo topí i v klidovém režimu...

Martin Chroust
Jak...Malware