V davu už se neschováte. Počítače najdou a rozpoznají většinu obličejů během okamžiku

Strojové rozpoznávání lidských tváří má zatím slabiny na větších snímcích anebo v případě, že je lidí na snímku větší množství. Je to obecný problém rozpoznávání objektů ve snímcích.

Nový výzkum ale ukázal, že se to dá překonat: stroj nejprve musí hledat větší věci, související s příslušnými objekty. Konstatovali to profesor robotiky Deva Ramanan a doktorand v tomto oboru Peiyun Hu z univerzity v Pittsburghu. Jejich studie byla uložena v arxiv-e a referoval o ní i web univerzity.

Nová metoda počítačového rozpoznávání přináší výrazné zlepšení oproti dosavadním. Chybovost rozpoznávání osob v davových snímcích u ní klesla na polovinu. Až 81 procent tváří, které software najde na snímcích, jsou opravdu lidské tváře. U jiných metod je běžná chybovost 29 až 64 procent.

Klepněte pro větší obrázek
Systém našel 685 tváří z přibližně 1000 přítomných

„Je to jako když spatříte párátko v ruce určité osoby. Párátko snadněji uvidíte, když máte náznaky, že někdo by mohl používat párátko. Hlavními stopami jsou v tomto ohledu orientace prstů, pohyb a poloha ruky,"vysvětlil Deva Ramanan. Při hledání tváře, která na snímku zabírá jen pár pixelů, se nejprve pátrá po těle nebo po skupině či davu lidí. Počítač zkrátka nejprve odhadne, kde by se tvář mohla nacházet.

K čemu je to dobré?

Škála využití počítačového vidění je obrovská. Bezpečnostní důvody se nabízí přímo automaticky. Ne náhodou tento výzkum podpořila IARPA (Intelligence Advanced Research Project Activity), federální organizace pro sice rizikové, ale potenciálně nesmírně přínosné high-tech projekty, působící v Úřadu ředitele zpravodajských služeb USA.

Nová metoda poslouží i pro „počítání hlav“ při odhadech účasti na akcích, včetně demonstrací či volebních shromáždění.

Podobně jako lidské oko

Využít při hledání objektů jejich kontext není až tak nový nápad. Až donedávna se však velmi těžko uváděl do praxe. Kódování kontextu vyžaduje takzvané vysokodimenzionální deskriptory. Zahrnují množství informací, avšak práce s nimi je výpočetně náročná.

Deva Ramanan a Peiyun Hu naproti tomu využili „jamkové“ deskriptory. Kontext kódují podobně jako lidský zrak. Naše zorné pole je zaostřeno na foveu (jamku) sítnice, kde je nejvyšší ostrost vidění.

Klepněte pro větší obrázek
Systém rozpozná i obličeje z větší části zakryté

Jamkový deskriptor analogicky poskytuje ostrý detail malé skvrnky na snímku, okolní plocha je rozmazanější. To nabízí dostatečný kontext pro určení významu zaostřené skvrnky, ale ne příliš velký, takže se počítač nezahltí.

Při hledání malých objektů na snímku nepomáhá zvýšení jejich rozlišení. Objekt pak tvoří mnoho pixelů, ale ty jsou ztraceny v oceánu ostatních. Kontext tak pomáhá při zaměření systému na ty oblasti, které nejpravděpodobněji opravdu obsahují lidskou tvář.

Deva Ramanan a Peiyun Hu vyvinuli v rámci systému nejen základní kontextuální analýzu obrazu, ale i několik detektorů pro pátrání po malých objektech v odlišných rozměrových škálách. To řeší situaci, kdy by jediný detektor, hledající obličej vysoký jen pár pixelů, zmátlo, že zachytí třeba nos několikanásobně větší než je očekávaná tvář.

Témata článku: Technologie, Věda, Umělá inteligence, Výzkum, Strojové učení, Pittsburgh, Activity

17 komentářů

Nejnovější komentáře

  • other_user 11. 4. 2017 14:05:01
    Jeden by řekl, že je to minimáně znepokojující, kruh se pomalu uzavírá,...
  • Jaroslav Zelený 11. 4. 2017 11:57:20
    Super zpráva jako hrom.
  • Roman Šrámkuj 11. 4. 2017 11:39:50
    Zatim bych se moc nevzrusoval, jedna 9-ti objektivova Panomera stoji cca...
Určitě si přečtěte

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

** Gary Kildall pochopil, že levné výpočetní čipy mohou posloužit jako univerzální počítače pro všechny ** Připravil pro ně proto první operační systém ** Později mu systém vyfoukl Microsoft a nazval ho MS DOS

23.  4.  2017 | Pavel Tronner | 56

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

** Už je to tady, lidé přestávají chápat počítače ** Systémy neuronových sítí začínají pracovat tak, že ani jejich tvůrci přesně neví, co se uvnitř děje ** Do budoucna to může být závažný problém

24.  4.  2017 | Jakub Čížek | 112

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

** Slavný osmibitový počítač Sinclair ZX Spectrum byl uveden právě před 35 lety ** Připomeňte si tento průkopnický počítač v tematických článcích ** Podívejte se, jak funguje dnes

23.  4.  2017 | Pavel Tronner | 13

Správný počítač má alespoň dva monitory. Anebo je to jinak?

Správný počítač má alespoň dva monitory. Anebo je to jinak?

** David si nedokáže představit práci bez dvou a více monitorů ** Kubovi naopak stačí jeden a ve více displejích se ztrácí ** Jaký přístup je lepší?

23.  4.  2017 | Jakub Čížek | 59

Brněnské soudy daly stop Uberu. Je to dobře, nebo krok zpět?

Brněnské soudy daly stop Uberu. Je to dobře, nebo krok zpět?

** Před několika měsíci začal Uber nabízet své služby i v Brně ** Nyní ale narazil, soudům se to totiž nelíbí ** Má sdílená ekonomika dostat zelenou?

22.  4.  2017 | Jakub Čížek | 28


Aktuální číslo časopisu Computer

Supertéma: moderní cestování

Kdy opravdu přijdou nové baterie?

Velké testy: 6 herních notebooků a 8 volantů

Recenze: AMD Ryzen řady 5