Umělá inteligence | Byznys | OpenAI

Vyzkoušeli jsme DALL-E 2, noční můru všech grafiků. Umělá inteligence zvládne náročné koláže a má smysl pro humor

  • OpenAI uvolnilo do betaverze umělou inteligenci DALL-E pro generování obrázků a fotografií
  • Technologie zvládne generovat obrazy všeho druhu i podle jakéhokoli stylu

OpenAI patří ke špičce vývoje umělé inteligence, která se zaměřuje na zpracování a pochopení textových a obrazových dat. Vše začalo v roce 2018 s vývojem první architektury GPT, další rok přišlo vylepšené GPT-2 a v roce 2020 už verze GPT-3 pracovala se 175 miliardami parametrů.

V této fázi systém zvládá konverzaci s člověkem na takové úrovni, že už lze těžko rozpoznat, že jde o umělou inteligenci. Dokáže pochopit třeba i programový kód v různých jazycích, psát vtipy, scénáře a další.

DALL-E: výměna textu za pixely

Systém DALL-E je jinou formou GPT-3, která se zaměřuje na obraz. Základní systém rozpozná z textu, co po něm chcete, a druhá část podle toho vygeneruje několik různých obrazů, při opětovném dotazu vytvoří nové, takže je každý unikátní.

Klepněte pro větší obrázekJednoduché rozhraní DALL-E

První generace DALL-E byla trénovaná na více než 400 milionech obrázků z celého internetu, DALL-E 2 pracuje s 3,5 miliardami parametrů a generuje obrázky s 4× vyšším rozlišením. Může jít o kresby, realistické fotografie nebo 3D grafiku, vše v jakémkoli stylu, třeba i podle konkrétního umělce.

V rozhraní betaverze DALL-E lze také nahrát vlastní obrázek, který si můžete nechat upravit a podle kterého můžete vytvořit jiné. Různé variace nebo jen zkopírovat styl grafiky a obrazu.

Čím přesnější zadání, tím lepší

Při zadávání textového popisu v angličtině máte zcela volnou ruku. OpenAI dodává, že je lepší popisovat co nejpřesněji, takže DALL-E bude lépe vědět, co má vytvořit a minimalizujete tak další úpravy.

Klepněte pro větší obrázek

Ideální je zadat dotaz (přeloženo z angličtiny) „Astronaut, který jede na koni ve vesmíru, fotorealistický styl“. DALL-E přitom chápe vyšší koncepty a pokud do obrázku chcete přidat třeba nějaký dodatečný objekt, správně k němu přidá i stín a odrazy na případném lesklém materiálu tak, aby to odpovídalo zdroji světla a úhlu. Tedy pokud jde o realistický styl.

Klepněte pro větší obrázek

Umělci budou žít napořád

Že DALL-E dokáže napodobit jakýkoli styl umělce, přeneseně znamená, že lze vytvořit obrazy od umělců, kteří už nejsou na světě. Můj oblíbený test je vytvoření nákresů jako od Leonarda Da Vinci pro moderní objekty. V galerii si jich pár můžete prohlédnout a jsou to skvosty.

Každý takový obraz si dokážu představit, že může být okrasou na zdi. DALL-E a budoucí systémy zajistí, že umělci budou prostřednictvím své tvorby „nesmrtelní“. To je možnost, která doposud byla jen v rukou konkrétních lidí, kteří byli schopní styl zkopírovat.

Klepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázek
Tesla Model S, ručně nakreslená od od Leonarda Da Vinciho, na starém papíře (zadání, které systém dostal, najdete v popisku obrázku v galerii)

Nyní tento efekt vidíme na obrazech, ale do budoucna jistě bude takto možné vytvořit písničky, knihy, filmy a další obsah od známých zpěváků, režisérů, herců a dalších osobností, kteří už třeba nežijí. Jediným předpokladem je, aby měl systém dostatek dat, aby „nasál“ styl umělce.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Darth Vader od Van Gogha a Picassa (Zdroj: DALL-E)

Nemusí to přitom končit stylem, ale třeba i chováním a podobou člověka. Technologie deep fake už dokáže skvěle simulovat obličeje, podobně je tomu u simulace hlasu. V budoucnosti lze jistě čekat i technologie, které coby služba budou simulovat třeba i vaše milované, kteří už nejsou mezi námi. Bez velkého množství kvalitních dat to ale nepůjde.

Klepněte pro větší obrázekDarth Vader a Chewbacca si dávají páku, digitální umění (Zdroj: DALL-E)

Pokud si chcete zajistit simulovanou nesmrtelnost, své milované fotografujte často, natáčejte je při různých příležitostech, ze všech možných úhlů, ve vysokém rozlišení, s kvalitní zvukem a podobně. Pokud byste chtěli jít do extrémů, nahrávejte si rozhovory a běžný život, nikoli pouze speciální události. Mobilní telefony zvládající 4K@60 už má většina z nás neustále v kapse, tak je pořádně využívejte. V budoucnu mohou mít tato data pro vás cenu zlata právě pro rekonstrukci a simulaci.

Byznys model DALL-E

K DALL-E jsem se dostal ještě před betaverzí, kdy bylo zakázáno jakékoli komerční použití, protože všechny generované obrázky a fotografie jsou ve vlastnictví OpenAI.

S betaverzí už ale DALL-E přechází na byznys model, kdy vygenerované obrázky vlastníte a můžete je tak využívat komerčně, včetně prodeje, tisku a použití pro různé produkty. Stále však platí omezení – nesmíte šířit nic s lidskými tvářemi, násilné nebo „krvavé“ věci, urážlivé náboženské obrazy a další.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Klepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázek
Ukázka upřesňování dotazu a neustále nově a jinak generovaných obrázků (Zdroj: DALL-E)

Každý uživatel dostává pro první měsíc kredit 50 generování a poté každý měsíc 15 generování zdarma. Kredit pro dalších 115 generování stojí 15 dolarů. Každé generování zahrnuje 4 různé obrázky (dříve bylo 6, ale došlo k omezení). A věřte mi, že tuto kapacitu dokážete využít velmi rychle. Obvykle totiž zkoušíte spoustu generování, než se dostanete k cíli, obzvláště pokud jde o konkrétní detaily, které chcete vidět v obraze.

Budou z grafiků bezdomovci?

DALL-E a nový byznys model znamená, že už si můžete nechat vygenerovat jakékoli obrázky a koláže za naprosto minimální cenu a okamžitě. Co by u grafika trvalo dny a tisíce korun, DALL-E zvládne za pár sekund a za jednotky korun a můžete si okamžitě vygenerovat obrovské množství variací.

Klepněte pro větší obrázekTomáš Garrigue Masaryk jako hacker na svým kompu. Tohle by asi nezvládl ani  lidský grafik (Zdroj: DALL-E)

Co tedy bude s grafiky? Je to podobné jako u programátorů, kteří už také většinou neprogramují v assembleru, ale přešli na vyšší jazyky. Grafici se tak musí přizpůsobit a DALL-E brát jako nový nástroj, který jim umožní pracovat efektivněji – z pohledu času i nákladů. Grafický architekt je asi to slovo, kam by se normální grafik měl posunout – bude schopen tento nástroj velmi dobře ovládat, bude znát jeho slabiny, jak přesně se ho ptát na určité věci a rozšíří objem práce, kterou bude obstarávat a sjednocovat třeba do jednoho grafického stylu.

Zajímavostí je, že DALL-E je vlastně strašák nejen pro grafiky, ale i pro starší nástroje typu Photoshop a podobně, které z budoucího pohledu nebudou tolik potřeba. Už nemusíte řešit spoustu věcí přímo ve Photoshopu, prostě to řeknete DALL-E a ten to během pár sekund udělá.

DALL-E je revoluce, která postupně změní mnoho segmentů a ovlivní budoucnost řady oblastí. Tvorbu dat všeho druhu čeká zemětřesení, které tu v historii doposud nebylo.

Diskuze (11) Další článek: Americký startup CO2Rail chce zachytávat CO2 ze vzduchu pomocí speciálních železničních vagónů

Témata článku: Umělá inteligence, Internet, Byznys, Tesla, Grafický editor, Strojové učení, Neuronová síť, OpenAI, Fotografování, Betaverze, Adobe Photoshop, Photoshop, Picasso, Leonard Da Vinci, Grafik, Da Vinci, JSM, Noční můra, Koláž, Obrázek, Vincent Van Gogh, Generování, Variace, GPT, DALL-E



Sex manželských párů? Jen výjimečně. Ložnice ovládnou roboti s umělou inteligencí

Sex manželských párů? Jen výjimečně. Ložnice ovládnou roboti s umělou inteligencí

** Sex manželských párů jen při zvláštních příležitostech. ** Ložnice ovládnou sexuální roboti s umělou inteligencí. ** I to je jeden ze závěrů Mezinárodní robotické konference.

Filip KůželJiří Liebreich
RobotiSexUmělá inteligence
Superzemě jsou větší, běžnější, a také obyvatelnější než planety jako Země. Jsou doslova superobyvatelné

Superzemě jsou větší, běžnější, a také obyvatelnější než planety jako Země. Jsou doslova superobyvatelné

** Země podle všeho není nejlepším ze všech možných světů, alespoň pokud jde o obyvatelnost lidmi ** Máme štěstí, že jsme naživu ** U superzemí, tedy planet větších než Země a menších než ledoví obři jako Uran nebo Neptun, to je jiné

Stanislav Mihulka
ZeměAstronomie
Google už nevydržel čekat. Kompletně odhalil design a barevné varianty hodinek Pixel Watch

Google už nevydržel čekat. Kompletně odhalil design a barevné varianty hodinek Pixel Watch

** Hodinky Pixel Watch se ukazují v celé své kráse ** Displej bude krýt Gorilla Glass zatím neznámé generace ** Pásky rozhodně nebudou univerzální

Martin Chroust
Pixel WatchChytré hodinky
Tuto českou základnu plnou satelitů nesmíte vidět. V Mapy.cz je každá anténa pečlivě vyretušovaná

Tuto českou základnu plnou satelitů nesmíte vidět. V Mapy.cz je každá anténa pečlivě vyretušovaná

** Zapomeňte na rozčtverečkovaná místa, kterých si každý všimne ** Mapy.cz musely dokonale zakrýt desítky parabol ** Základnou se přitom na webu chlubí i její majitel. Kocourkov

Jakub Čížek
ČeskoMapy.czMapy
15 praktických tipů a triků pro Mapy.cz, které možná neznáte

15 praktických tipů a triků pro Mapy.cz, které možná neznáte

** Mapy.cz neslouží jen k zobrazení podkladů a plánování tras ** Nabízejí celou řadu dalších praktických funkcí a možností ** Vybrali jsme 15 tipů a triků, o kterých možná nevíte

Karel Kilián
Mapy.czMapyTipy
Nastal pravý čas na výměnu telefonu. Jak poznat, že ten váš už dosluhuje?

Nastal pravý čas na výměnu telefonu. Jak poznat, že ten váš už dosluhuje?

** Jak poznat, že váš telefon má nejlepší dny za sebou? ** Vypadá potlučeně, má pavučinu nebo nedostává aktualizace? ** Ukážeme si, kdy má smysl jeho oprava, a kdy už jen koupě nového

Martin Chroust
Prasklý displejVysloužilý mobilSmartphony
Google si i na září připravil několik šikovných drobností, které se brzy dostanou na všechny Androidy

Google si i na září připravil několik šikovných drobností, které se brzy dostanou na všechny Androidy

** Google i v září pošle do Androidů „neviditelný“ update ** Obsahuje sice jen pár drobností, i tak se mohou leckomu hodit ** Nejužitečněji vypadá update funkce Sdílení nablízko

Martin Chroust
Nearby ShareAndroid
Google není jen vyhledávač: 15 užitečných funkcí, o kterých možná ani nevíte

Google není jen vyhledávač: 15 užitečných funkcí, o kterých možná ani nevíte

** Google umí kromě vyhledávání i spoustu dalších věcí ** Vybrali jsme více než 15 užitečných funkcí a schopností ** Stačí zadat do vyhledávače ta správná klíčová slova

Karel Kilián
TipyVyhledávačeGoogle
Sociální síť BeReal jde proti proudu. Žádné filtry a přetvařování, tohle má být čistá realita

Sociální síť BeReal jde proti proudu. Žádné filtry a přetvařování, tohle má být čistá realita

** BeReal je novou hvězdou mezi sociálními sítěmi ** Ukazuje pouze všední realitu běžných dní ** Aplikace vám jednou denně dá dvě minuty na poslání vlastní fotky

Martin Chroust
BeRealMobilní aplikaceSociální sítě