Pokročilé rozpoznávání objektů pro budoucí roboty

Rozpoznávání obrázků je už poměrně snadnou záležitostí, roboti pohybující se v prostoru ale budou muset umět rozpoznávat trojrozměrné objekty v reálném čase.

Náš mozek má mnoho unikátních vlastností, jednou z nich je rozpoznávání objektů v reálném čase. A to platí nejen u dvourozměrných objektů třeba na obrázku nebo fotografiích, ale také trojrozměrných věcí v běžné nebo virtuální realitě.

Zatímco v případě rozpoznávání dvourozměrných obrázků už jsou počítačové systémy vybavené strojovým učením a umělou inteligencí velmi pokročilé a v některých specializovaných případech to dokonce zvládnou lépe než člověk, u trojrozměrných objektů je to o něco složitější a komplikovanější.

SLAM počítá s pozicí i časem

Technika SLAM (Simultaneous Localization And Mapping) řeší problém analýzy neznámého prostoru a zároveň pohyb třeba robota či auta v takové nasnímané mapě. Vědci z MIT použili principy této techniky pro rozpoznávání objektů v obraze.

 2015-08-01 v 12.28.03.jpg
Analýza objektů dle prostoru a v průběhu času

Systém funguje odlišně než běžné metody pro rozpoznávání trojrozměrných objektů v prostoru. Oproti stávajícím řešením, které analyzují každý snímek obrazu samostatně a rozpoznávají tak konkrétní objekty v daném obrazu, nový způsob využívá času i pozice.

Díky tomu systém netrpí velkým počtem chybových rozpoznání. Objekty se tak neanalyzují pouze z pohledu jednoho aktuálního snímku, ale porovnávají se i s předchozími, čímž lze předejít velkému množství chyb. Technologie okáže pracovat jak s pozicí, tak i časovou osou, zkrátka podobně jako to dělá třeba i mozek.

 2015-08-01 v 12.30.00.jpg
Porovnání s klasickým přístupem, který v určitých pohledech nerozpozná objekty vůbec nebo chybně

Pokud se tak kamera pohybuje okolo objektů, dokáže je správně rozpoznat ze všech úhlů, i když některé úhly pohledu na objekty ještě systém nikdy neviděl a nemá je s čím porovnat. Tím trpí právě jednodušší systémy, které se soustředí pouze na rozpoznání jednoho samostatného snímku. Důležitost takového přístupu je jasná, když si uvědomíme, že prakticky ani není možné postavit efektivní platformu, kde by byly uložené zcela všechny objekty ze všech možných úhlů.

 2015-08-01 v 12.29.11.jpg
Rozpoznávání objektů

S pokročilým přístup k analýze, která počítá s časem i pozicí, lze poměrně dobře řešit i problémy spojené třeba s překrývajícími objekty, které se v některém pohledu mohou splývat. Pokud mají stejnou barvu, může je algoritmus vyhodnotit mylně jako jeden předmět. Jakmile ale analýza zahrnuje jejich vlastnosti z jiného časového segmentu a stejné pozice, bude stále počítat s tím, že jde o dva samostatné objekty.

Stačí jediná běžná kamera

Představené řešení postavené na SLAMu navíc dokáže pracovat pouze s jedinou i běžnou kamerou, která je třeba v tabletu nebo mobilním telefonu. Existují samozřejmě technologie, které využívají dvou kamer, používají infračervené vysílače pro měření hloubky obrazu a podobně, ale znamená to i mnohem vyšší cenu a velikost. Navíc tyto systémy sice fungují dobře například v místnostech, ale venku už ztrácí význam, protože už není možné dobře využít jejich předností.

 2015-08-01 v 12.28.48.jpg

Jednodušší konstrukce dokáže nabídnout podobnou kvalitu rozpoznání objektů, jako složitější a dražší systémy s několika kamerami. Je ale samozřejmě nutné počítat s tím, že je důležitý i dostatečný výpočetní výkon, který umožňuje zpracování obrazu a rozpoznání objektů v reálném čase.

Pro užitečné roboty

Aby mohli roboti zvládat pokročilé různorodé věci, musí mít nejen dostatek senzorů a univerzální konstrukci, ale musí umět i důležitý základ v podobě rozpoznávání objektů v prostoru.

Principy SLAMu pomáhají analýze objektů, která ale zároveň zlepšuje i mapování prostředí. Případný robot totiž musí například rozpoznat, pokud už dříve byl ve stejné místnosti, aby dané místo nepovažoval za nové, ale rozšířil informace o stávají uložené místnosti. Nám lidem se to může zdát jako samozřejmost, ale zahrnuje to spoustu problémů, které musíme vyřešit, než se budou univerzální roboti pohybovat mezi námi.

Diskuze (6) Další článek: Radeon R9 370X vyfocen a předběžně otestován

Témata článku: , , , , , , , , , , , , ,