Google uvolnil kód neuronové sítě. Snít může i vaše PC

Google se v červnu pochlubil, co umí jeho obrázková umělá inteligence, když dostane příkaz, aby začala kreslit náhodné obrázky. Nyní si to může vyzkoušet i široká veřejnost.

Google se letos v červnu pochlubil, co dokáže jeho technologie rozpoznávání předmětů na fotografiích, pokud ji inženýři použijí trošku jiným způsobem.

Za běžných podmínek robot prochází fotografii za fotografií a pokouší se na nich identifikovat různé předměty ze své obrazové databáze. Když je na snímku pes.jpg ve skutečnosti kočka, může pak Google soubor správně zařadit prezentovat ve svém vyhledávači.

Klepněte pro větší obrázek
ImageNet – obří akademická databáze detailně roztříděných obrázků. V podstatě se jedná o anglicko-obrázkový slovník, na jehož základě se může robot učit, jak vypadají jednotlivé objekty. 

Aby to mohlo fungovat, Google musí vědět, jak jednotlivé předměty vypadají. K tomu slouží obrazové korpusy, což jsou vlastně obří databáze referenčních fotografií. Jednou z nich je třeba projekt ImageNet, který se dnes skládá ze 14 milionů lingvisticky velmi detailně popsaných snímků. Chytrý software se na základě této referenční databáze naučí, jak různé předměty vypadají, a může je pak identifikovat i na dalších fotografiích.

Neuronová síť Googlu se učí snít

Během červnového experimentu, o kterém jsem se rozepsal ve starším článku, předložili inženýři Googlu podobně nacvičenému softwaru fotografii oblohy a dali mu příkaz, ať ve snímku zobrazí cokoliv, co v něm vidí.

Tento problém řeší softwarová neuronová síť, což je ideální výpočetní model pro strojové učení a složité paralelní úlohy. Neuronová síť Googlu pro identifikaci obrázků se skládá z několika úrovní, z nichž každá analyzuje fotografii různým způsobem. Jedna vrstva může zesilovat hrany, druhá barvy, třetí hledá komplexní předměty a poslední složí vše dohromady.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Vlevo vstupní fotografie nebe a vpravo pak tentýž snímek obohacený o různé objekty, které na fotografii vidí neuronová síť Googlu

Když tedy neuronová síť Googlu uviděla snímek nebe, zpracovávala jej tak dlouho, dokud ji kus oblaku nezačal připomínat třeba psí hlavu, kterou poté do snímku vykreslila. Jenže při dalším průchodu ji mrak se psí hlavou připomínal zároveň rybu, a tak se nakonec místo obláčku objevilo jakési monstrum složené hned z několika tvorů. Umělá inteligence tedy vytvořila cosi, co v reálném světě neexistuje, a tím pádem dosáhla určitého prvotního stupně své vlastní imaginační schopnosti. Pokud by tyto nové a doposud neexistující objekty uložila do své paměti – do referenční databáze, můžeme už opravdu mluvit o jakési primitivní formě představivosti – snění.

Klepněte pro větší obrázek
Google v oblacích našel různé skutečné objekty ze své referenční databáze, když je ale začal autonomně kombinovat, vytvářel vlastně zcela nové a doposud neznámé věci – třeba prasošneka a psorybu.

Deep Dream na GitHubu

Robot nakonec stvořil překrásné snové kompozice a Google si byl svým dílem natolik jistý, že postup uvolnil na GitHubu pod názvem Deep Dream. Projekt využívá Python a hromadu jeho knihoven pro matematické výpočty a především technologii samotné neuronové sítě pro strojové učení jménem Caffe, která vznikla na půdě univerzity v Berkeley.

Pokud máte slušný hardware (Caffe k chodu vyžaduje grafické karty s technologií CUDA) a vše správně nainstalujete (návod k instalaci Caffe, knihoven a postup v Pythonu najdete zde), můžete na své mašině generovat stejné zasněné snímky jako Google na svých superpočítačích.

Deep Dreamer pro OS X

Instalace hromady technologií s nejistým výsledkem ovšem není pro každého, vývojáři ze společnosti Realmac to tedy běžným smrtelníkům usnadnili a pro uživatele OS X připravili program Deep Dreamer, který je postavený právě na kódu Deep Dream. Namísto složité instalace se ale jedná o běžný grafický program, do kterého nahrajete fotografii, pohrajete si s několika šoupátky a výsledkem bude to samé.

Deep Dreamer je v základní a omezené betaverzi zdarma a v plnotučné podobě je k dispozici za tři stovky. Ani on ale není pro každého, strojové rozpoznání objektů na snímku pomocí některého z dostupných grafických korpusů (k dispozici je třeba databáze zvířat) je totiž i v tomto případě velmi náročný proces.

Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek
Vygenerované snímky z Deep Dreameru. V prvních dvou snímcích hledá stroj předměty podle své referenční databáze (zvířata), v tom třetím pak zase zesiluje hrany a vzniká tak efektní pseudomalba. 

Když jsem tedy o vygenerování několika obrázku poprosil redakčního kolegu z Computeru Jakuba Michlovského, po hodině vykreslování jediného obrázku mi napsal rozčílenou zprávičku, že je stěží ve třetině a ať na to zapomenu. Po dvou hodinách přemlouvání mi ale přeci jen něco poslal:

Klepněte pro větší obrázek Klepněte pro větší obrázek
Několik prvních průchodů hledacího mechanizmu. Kdyby jich Kuba použil více, ve snímcích se objeví ještě roztodivnější tvary, ale čas zpracovávání vzroste geometrickou řadou.
Klepněte pro větší obrázek
A ještě jeden snímek ze samotného průběhu zpracovávání – všimněte si v rámu okna čísel, které napovídají, že byl zdrojový obrázek rozdělen na hromadu menších segmentů, které se postupně analyzují

Webový Deepdreamer.io

Naštěstí je tu ještě jedna možnost – síla datového centra. Technologii si tedy můžete s vlastní fotografií vyzkoušet i na webu Deepdreamer.io. Výsledek se nedozvíte hned a stejně tak nemůžete upravit žádné parametry, ale až bude hotovo, webová služba vám odešle e-mail. Jelikož je o službu momentálně enormní zájem, počkáte si v lepším případě i několik hodin.

Klepněte pro větší obrázek Klepněte pro větší obrázek 
Deepdreamer.io v akci

To nejdůležitější na závěr: Google chce vidět vaše výsledky. Pokud tedy některou z těchto cest vytvoříte efektní výtvor, určitě jej nahrajte na některou ze sociálních sítí a k příspěvku připojte hashtag #deepdream. Docela slušná sbírka vygenerovaných snímků z neuronové sítě Googlu je už k dispozici na Twitteru nebo třeba na Redditu.

Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek
Ukázky publikované na Twitteru a Redditu. Všimněte si, že neuronová síť nalézá a vykresluje do podkladových fotografií převážně zvířata, takže snímky pocházejí povětšinou z jablečného Deep Dreameru, který jako referenční databázi používá právě zvířata (takže jiným objektům nerozumí).

Takže hurá do toho, ať se ty syntetické neurony trošku zapotí.

Témata článku: Software, Google, Technologie, Umělá inteligence, Vyhledávače, Neuronová síť, Data, File, Deep, Dream, IO, Hashtag, Vimeo

28 komentářů

Nejnovější komentáře

  • br_ko 29. 7. 2015 11:39:00
    Remember, Google is Skynet, time has begun and you can stop it!
  • Dr.No64 28. 7. 2015 22:02:19
    óó úžasné a k čemu to je ?:-)):-))
  • Axel_foley4 28. 7. 2015 21:42:46
    Takže hurá do toho, ať se ty syntetické neurony trošku zapotí. Já se...
Určitě si přečtěte

Sbíječky vyměnili za klávesnice. Nový projekt má za cíl přeučit horníky na programátory

Sbíječky vyměnili za klávesnice. Nový projekt má za cíl přeučit horníky na programátory

** Programátorů je málo a horníků bez práce po uzavření dolu Paskov bude moc ** Problém řeší unikátní projekt ** Pilotní kurz dává naději, že by z horníků mohli být použitelní kodéři

28.  11.  2016 | David Polesný | 78

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

** Novinka od Asusu míří přímo proti MacBooku od Applu ** Nabídne daleko více výkonu za stejné peníze

2.  12.  2016 | David Polesný | 119