Umělá inteligence Googlu začala „snít“

Dejte počítači čtvrtku papíru s nahodilým barevným šumem a řekněte mu, ať nakreslí vše, co v něm vidí. Neuronová síť Googlu to dokázala a stvořila úžasné malby.

Google, Microsoft, Facebook, Twitter a další budují složité softwarové neuronové sítě, které mají za cíl analyzovat obrovská kvanta dat z vyhledávačů, sociálních sítí a dalších zdrojů. Google se jako největší vyhledávač velmi intenzivně soustředí třeba na rozpoznávání a vůbec počítačové pochopení obrazových dat.

Aby mohl Google na dotaz „čížek lesní“ zobrazit relevantní obrázky čížka lesního, nemůže se dnes jako před lety řídit pouze tím, že se některé soubory jmenují cizek_lesni.jpg, a proto je na nich tedy nejspíše čížek lesní, ale musí skutečně analyzovat obrazová data a pokusit se na fotografii identifikovat čížka lesního.

Klepněte pro větší obrázek
Vyhledávání obrázků na Googlu

Aby mu to šlo, musí se umělá inteligence od Googlu nejprve naučit, jak vlastně čížek lesní vypadá. V praxi to funguje tak, že software dostane sadu fotografií lesního ptáka a uloží si základní charakter jeho podoby, aby jej dokázal identifikovat nehledě na jeho velikost, úhel pohledu aj. Ať už bude čížek velký, nebo malý, ať už bude snímaný zepředu, nebo z profilu, Google by jej měl v ideálním případě identifikovat, protože jej poznal stejně, jako to umí člověk.

Software se učí představám

Výzkumníci z laboratoří Googlu se ale nyní na blogu pochlubili ještě jednou unikátní specialitou, kterou jejích neuronová síť dokáže. Jelikož se software naučil, jak vypadá čížek lesní, dokáže si jej vlastně i představit a synteticky zobrazit.

Jak taková představa počítače vlastně vypadá? Stačí mu předložit obrázek s náhodným barevným šumem a zadat mu příkaz, aby na něm našel třeba banán. Pro člověka by bylo něco takového zpravidla nemožné, protože nemá k dispozici takovou míru detailní abstrakce, ale stroj jednoduše vezme pixel po pixelu, začne hledat nahodilé barevné shluky, zesílí hrany a po několika iteracích se rázem v barevném šumu zobrazí kresba čehosi, co skutečně připomíná banán. Alespoň tedy v takové podobě, jak si jej stroj představuje – jak se jej naučil chápat.

Klepněte pro větší obrázek
Inženýři předložili neuronové síti čtverec s náhodným šumem a řekli ji, ať na něm najde banán. Neuronová síť se skládá z několika úrovní, z nichž každá má nějaký úkol. Jedna se pokouší v obrazu detekovat hrany, další upravuje barvy a postupně se zvyšuje míra abstrakce k hledání jednoduchých i komplexnějších tvarů. Poslední vrstva neuronové sítě složí vše dohromady a vznikne obraz, na kterém jsou banány. Pro člověka je šum vlevo příliš nahodilý, ale stroj si všimne i toho nejmenšího detailu.

Inženýři z Googlu se na blogu pochlubili několika podobnými kousky, kdy měl stroj najít různé věci i na reálných fotografiích – třeba na snímku oblak, v jejichž geometrických tvarech objevil hromadu objektů.

Klepněte pro větší obrázek
Stroji, zesil, co vidíš na fotografii s mraky. Aneb co počítači připomínají různé tvary na snímku.
Klepněte pro větší obrázek
A to samé ve větším detailu. Některá oblaka připomínají podle stroje psorybu, jiná rybovelbouda a jiná prasošneka – abstraktní myšlení v praxi

Nakonec inženýři stroji opět předali snímek s náhodným šumem a v hromadě iterací mu dali naprostou kreativní volnost, čili software stále dokola hledal a objevoval cokoliv, co zná, až se plátno proměnilo ve zvláštní psychedelickou malbu plnou barevných staveb a tvarů v podobném nádechu jako třeba slavný Výkřik od Edvarda Muncha.

Klepněte pro větší obrázek
Autorem těchto úžasných kreseb není umělec po požití nadměrného množství LSD ale stroj, který dostal na počátku čtvrtku s nahodilým barevným šumem a příkaz, ať nakreslí vše, co ve zdánlivé nahodilosti skutečně vidí. Nejvyšší vizuální abstrakce současné A.I. od Googlu v praxi.

Takže už víme, že neuronová síť Googlu umí malovat a maluje to, co sama chce, podle toho, co se dříve naučila. S trochou nadsázky lze tvrdit, že software začal snít. 

Témata článku: Google, Technologie, Web, Internet, Umělá inteligence, Vyhledávače, Oblaka, Co je software, Banán, Kresba, Software co to je, Nadměrné množství, Úhel pohledu, Zdánlivý detail, Inteligence, Reálný fotograf, Poslední vrstva, Inception, Čtverec

Určitě si přečtěte


Aktuální číslo časopisu Computer

26 procesorů v důkladném testu

Zhodnotili jsme 18 bezdrátových reproduktorů

Jak fungují cash back služby?

Pohlídejte své děti na internetu