V průběhu posledních let nasbíral Google ohromné množství fotografických dat. Teď přichází řada na jejich analýzu.
Jedním z těchto zdrojů je samozřejmě Street View. Každý jeho snímek obsahuje různé ïnformace včetně textů a číslic – třeba adresy domů na fotografiích. Ty by nyní rád Google dekódoval a zpřesnil tak mimo jiné polohu některých snímků. Využití je ale mnohem širší.
Ve studii Reading Digits in Natural Images with Unsupervised Feature Learning (PDF) inženýři z Googlu společně s vědci ze Stanfordu zkoumali, jak si různé OCR mechanismy poradí s dekódováním číslic na přirozených fotkách. Klasické OCR algoritmy nefungovaly příliš dobře a chybovost byla velmi vysoká. Když ale nasadili systém umělé inteligence, který se postupně učil rozeznávat symboliku písma, na vzorku 500 000 fotografií nakonec vědci dosáhli až 90% úspěšnosti. Člověk přitom dosáhl úspěšnosti 98 %.
Umělá inteligence si s vysokou úspěšností poradí prakticky se všemi čisly v běžných fotografiích
OCR v tomto případě selhalo čistě proto, že se nejedná o ideální fotografie ze skeneru, ale skutečně o snímky pořízené z různých úhlů, o čísla třeba částečně překrytá zelení a snímky rozmazané.
Jak se neustále zlepšují nejrůznější statistické a AI algoritmy, cena dat, které Google v průběhu let nasbíral, neustále poroste, z fotografií se totiž podaří dekódovat stále více informací. Jestli je to v pořádku, nechť už posoudí každý z vás, lepší dokumentovaná technologie totiž může přirozeně pomoci i v automatizovaném prolamování testu CAPTCHA.