Technologie | Strojové učení

V davu už se neschováte. Počítače najdou a rozpoznají většinu obličejů během okamžiku

V davu už se neschováte. Počítače najdou a rozpoznají většinu obličejů během okamžiku

Strojové rozpoznávání lidských tváří má zatím slabiny na větších snímcích anebo v případě, že je lidí na snímku větší množství. Je to obecný problém rozpoznávání objektů ve snímcích.

Nový výzkum ale ukázal, že se to dá překonat: stroj nejprve musí hledat větší věci, související s příslušnými objekty. Konstatovali to profesor robotiky Deva Ramanan a doktorand v tomto oboru Peiyun Hu z univerzity v Pittsburghu. Jejich studie byla uložena v arxiv-e a referoval o ní i web univerzity.

Nová metoda počítačového rozpoznávání přináší výrazné zlepšení oproti dosavadním. Chybovost rozpoznávání osob v davových snímcích u ní klesla na polovinu. Až 81 procent tváří, které software najde na snímcích, jsou opravdu lidské tváře. U jiných metod je běžná chybovost 29 až 64 procent.

Klepněte pro větší obrázek
Systém našel 685 tváří z přibližně 1000 přítomných

„Je to jako když spatříte párátko v ruce určité osoby. Párátko snadněji uvidíte, když máte náznaky, že někdo by mohl používat párátko. Hlavními stopami jsou v tomto ohledu orientace prstů, pohyb a poloha ruky,"vysvětlil Deva Ramanan. Při hledání tváře, která na snímku zabírá jen pár pixelů, se nejprve pátrá po těle nebo po skupině či davu lidí. Počítač zkrátka nejprve odhadne, kde by se tvář mohla nacházet.

K čemu je to dobré?

Škála využití počítačového vidění je obrovská. Bezpečnostní důvody se nabízí přímo automaticky. Ne náhodou tento výzkum podpořila IARPA (Intelligence Advanced Research Project Activity), federální organizace pro sice rizikové, ale potenciálně nesmírně přínosné high-tech projekty, působící v Úřadu ředitele zpravodajských služeb USA.

Nová metoda poslouží i pro „počítání hlav“ při odhadech účasti na akcích, včetně demonstrací či volebních shromáždění.

Podobně jako lidské oko

Využít při hledání objektů jejich kontext není až tak nový nápad. Až donedávna se však velmi těžko uváděl do praxe. Kódování kontextu vyžaduje takzvané vysokodimenzionální deskriptory. Zahrnují množství informací, avšak práce s nimi je výpočetně náročná.

Deva Ramanan a Peiyun Hu naproti tomu využili „jamkové“ deskriptory. Kontext kódují podobně jako lidský zrak. Naše zorné pole je zaostřeno na foveu (jamku) sítnice, kde je nejvyšší ostrost vidění.

Klepněte pro větší obrázek
Systém rozpozná i obličeje z větší části zakryté

Jamkový deskriptor analogicky poskytuje ostrý detail malé skvrnky na snímku, okolní plocha je rozmazanější. To nabízí dostatečný kontext pro určení významu zaostřené skvrnky, ale ne příliš velký, takže se počítač nezahltí.

Při hledání malých objektů na snímku nepomáhá zvýšení jejich rozlišení. Objekt pak tvoří mnoho pixelů, ale ty jsou ztraceny v oceánu ostatních. Kontext tak pomáhá při zaměření systému na ty oblasti, které nejpravděpodobněji opravdu obsahují lidskou tvář.

Deva Ramanan a Peiyun Hu vyvinuli v rámci systému nejen základní kontextuální analýzu obrazu, ale i několik detektorů pro pátrání po malých objektech v odlišných rozměrových škálách. To řeší situaci, kdy by jediný detektor, hledající obličej vysoký jen pár pixelů, zmátlo, že zachytí třeba nos několikanásobně větší než je očekávaná tvář.

Diskuze (17) Další článek: Při výběru SSD koukejte především na parametry, nikoliv na cenu

Témata článku: Technologie, Věda, Výzkum, Umělá inteligence, Strojové učení, Oceán, Příslušný objekt, Sítnice, Robotika, Zpravodajská služba, Pittsburgh, Bezpečnostní důvody, Sci-fi film, Nový výzkum, Tatra, Rozpoznávání, Velký snímek, Nová metoda, Lidský zrak, Activity, Snímek, Federální organizace, Kódování, Strojové rozpoznávání, Chybovost


Určitě si přečtěte

Starlink podle betatesterů: Rychlejší a levnější než satelitní internet v Česku

Starlink podle betatesterů: Rychlejší a levnější než satelitní internet v Česku

** Reddit se začíná plnit zkušenostmi se Starlinkem ** Při přímé viditelnosti dá i 120 Mb/s ** Klasický satelitní internet už teď dalece překonává

Jakub Čížek | 41

DeOldify: Téměř zázračná technologie, která obarvuje 2. světovou válku, nebo vaše fotky z dětství

DeOldify: Téměř zázračná technologie, která obarvuje 2. světovou válku, nebo vaše fotky z dětství

** Neuronová síť DeOldify obarvuje fotky ** Můžete si ji vyzkoušet sami i bez superpočítače ** YouTube je plný obarvených ikonických videí

Jakub Čížek | 21

AMD Ryzen 5000 s architekturou Zen 3: počet jader zůstává, výkon rekordně roste

AMD Ryzen 5000 s architekturou Zen 3: počet jader zůstává, výkon rekordně roste

** AMD představilo novou generaci desktopových procesorů řady Ryzen 5000 ** Nová architektura Zen 3 přináší mnoho vylepšení a přibližně 19% zvýšení výkonu IPC ** Všechny modely budou v prodeji 5. listopadu

Karel Javůrek | 44

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 4


Aktuální číslo časopisu Computer

Megatest mobilů do 5 500 Kč

Test levných herních notebooků

Hrajeme na Xbox Series X

Programy pro kontrolu dětí na počítači