Člověk nevnímá vizuální informaci jen pomocí svých očí, ale také na základě zkušenosti a naučených vzorů. Když tedy poprvé vstoupíte do místnosti a uvidíte část stolu, pochopíte, že je v místnosti stůl, poněvadž z předchozí zkušenosti tušíte, jak takový stůl ve své celistvosti asi vypadá.
Vědci z britské laboratoře DeepMind (Alphabet) sestavili s využitím strojového učení a neuronových sítí nový model, který k vidění používá stejné principy. Jelikož z předchozího učení ví, jak vypadají jednotlivé tvary, dokáže si jejich podobu představit i z úplně jiných úhlů, ze kterých je zatím nikdy neviděl. Jedná se tedy o jistou formu představy – umělého dopočítání chybějících dat na základě zkušenosti.
Demonstrace prostorové představivosti:
Jak ukazuje video výše, pomocí tohoto A.I. systému lze libovolně natáčet virtuální scénou a program ji bude vykreslovat podle toho, jak se naučil, že by měla vypadat. No, a to se už konečně dostáváme k širokým možnostem využití. S tímto přístupem totiž dokáže algoritmus z 2D dat vytvořit 3D. Když mu předložíte fotografii kabelky, dokáže se, pochopitelně s určitou chybou, podívat, jak vypadá z druhé strany.
Vlevo vstupní 2D snímek a vpravo 3D scéna vytvořená neuronovou sítí:
Podobné techniky mohou pomocí při lepším pochopení kontextu obrazových scén, které má stroj zpracovávat, může pomoci v robotizaci pro lepší představu o prostoru apod.