Pokročilé rozpoznávání objektů pro budoucí roboty

Rozpoznávání obrázků je už poměrně snadnou záležitostí, roboti pohybující se v prostoru ale budou muset umět rozpoznávat trojrozměrné objekty v reálném čase.

Náš mozek má mnoho unikátních vlastností, jednou z nich je rozpoznávání objektů v reálném čase. A to platí nejen u dvourozměrných objektů třeba na obrázku nebo fotografiích, ale také trojrozměrných věcí v běžné nebo virtuální realitě.

Zatímco v případě rozpoznávání dvourozměrných obrázků už jsou počítačové systémy vybavené strojovým učením a umělou inteligencí velmi pokročilé a v některých specializovaných případech to dokonce zvládnou lépe než člověk, u trojrozměrných objektů je to o něco složitější a komplikovanější.

SLAM počítá s pozicí i časem

Technika SLAM (Simultaneous Localization And Mapping) řeší problém analýzy neznámého prostoru a zároveň pohyb třeba robota či auta v takové nasnímané mapě. Vědci z MIT použili principy této techniky pro rozpoznávání objektů v obraze.

Klepněte pro větší obrázek
Analýza objektů dle prostoru a v průběhu času

Systém funguje odlišně než běžné metody pro rozpoznávání trojrozměrných objektů v prostoru. Oproti stávajícím řešením, které analyzují každý snímek obrazu samostatně a rozpoznávají tak konkrétní objekty v daném obrazu, nový způsob využívá času i pozice.

Díky tomu systém netrpí velkým počtem chybových rozpoznání. Objekty se tak neanalyzují pouze z pohledu jednoho aktuálního snímku, ale porovnávají se i s předchozími, čímž lze předejít velkému množství chyb. Technologie okáže pracovat jak s pozicí, tak i časovou osou, zkrátka podobně jako to dělá třeba i mozek.

Klepněte pro větší obrázek
Porovnání s klasickým přístupem, který v určitých pohledech nerozpozná objekty vůbec nebo chybně

Pokud se tak kamera pohybuje okolo objektů, dokáže je správně rozpoznat ze všech úhlů, i když některé úhly pohledu na objekty ještě systém nikdy neviděl a nemá je s čím porovnat. Tím trpí právě jednodušší systémy, které se soustředí pouze na rozpoznání jednoho samostatného snímku. Důležitost takového přístupu je jasná, když si uvědomíme, že prakticky ani není možné postavit efektivní platformu, kde by byly uložené zcela všechny objekty ze všech možných úhlů.

Klepněte pro větší obrázek
Rozpoznávání objektů

S pokročilým přístup k analýze, která počítá s časem i pozicí, lze poměrně dobře řešit i problémy spojené třeba s překrývajícími objekty, které se v některém pohledu mohou splývat. Pokud mají stejnou barvu, může je algoritmus vyhodnotit mylně jako jeden předmět. Jakmile ale analýza zahrnuje jejich vlastnosti z jiného časového segmentu a stejné pozice, bude stále počítat s tím, že jde o dva samostatné objekty.

Stačí jediná běžná kamera

Představené řešení postavené na SLAMu navíc dokáže pracovat pouze s jedinou i běžnou kamerou, která je třeba v tabletu nebo mobilním telefonu. Existují samozřejmě technologie, které využívají dvou kamer, používají infračervené vysílače pro měření hloubky obrazu a podobně, ale znamená to i mnohem vyšší cenu a velikost. Navíc tyto systémy sice fungují dobře například v místnostech, ale venku už ztrácí význam, protože už není možné dobře využít jejich předností.

Klepněte pro větší obrázek

Jednodušší konstrukce dokáže nabídnout podobnou kvalitu rozpoznání objektů, jako složitější a dražší systémy s několika kamerami. Je ale samozřejmě nutné počítat s tím, že je důležitý i dostatečný výpočetní výkon, který umožňuje zpracování obrazu a rozpoznání objektů v reálném čase.

Pro užitečné roboty

Aby mohli roboti zvládat pokročilé různorodé věci, musí mít nejen dostatek senzorů a univerzální konstrukci, ale musí umět i důležitý základ v podobě rozpoznávání objektů v prostoru.

Principy SLAMu pomáhají analýze objektů, která ale zároveň zlepšuje i mapování prostředí. Případný robot totiž musí například rozpoznat, pokud už dříve byl ve stejné místnosti, aby dané místo nepovažoval za nové, ale rozšířil informace o stávají uložené místnosti. Nám lidem se to může zdát jako samozřejmost, ale zahrnuje to spoustu problémů, které musíme vyřešit, než se budou univerzální roboti pohybovat mezi námi.

Témata článku: Technologie, Roboti

6 komentářů

Nejnovější komentáře

  • PD 5. 8. 2015 10:17:31
    Rozpoznávání věcí je pro terminátora podstatná funkce...
  • Pebog 3. 8. 2015 15:40:26
    Je možné, že počítačové systémy dokáží identifikovat nějaké obrázky "lépe"...
  • r3c1d1v15t 2. 8. 2015 13:18:37
    Tak koli tejto feature určite upgradujem na Windows 10!

Určitě si přečtěte


Deset tipů, jak ovládnout Google: Vyhledávejte jako mistři

Deset tipů, jak ovládnout Google: Vyhledávejte jako mistři

** Vyhledávače jsou natolik dobré, že si poradí i s frází v běžné češtině ** Pokud to ale nebude stačit, můžete vyzkoušet pokročilé funkce ** Vybrali jsme ty nejzajímavější

25.  9.  2016 | Jakub Čížek | 18

9 nejlepších programů na úpravu fotek. Placené i zdarma

9 nejlepších programů na úpravu fotek. Placené i zdarma

** Pro běžné úpravy fotek nemusíte pirátit Photoshop, vystačíte si s levnějšími programy ** Ceny pokročilých editorů se většinou vejdou do dvou tisíc korun ** Mnohdy stačí i bezplatné nástroje

Včera | Stanislav Janů | 40

Pojďme programovat elektroniku: Vyzkoušíme IR, ovládneme světýlko přes Bluetooth a vyšleme zprávu na sto metrů

Pojďme programovat elektroniku: Vyzkoušíme IR, ovládneme světýlko přes Bluetooth a vyšleme zprávu na sto metrů

** Budeme odposlouchávat IR ovladač klimatizace ** Vyrobíme laciný rádiový vysílač ** Vyzkoušíme komunikaci pomocí Bluetooth a v pásmu 433 MHz

21.  9.  2016 | Jakub Čížek | 19

Jak zastavit nechtěné programy na Windows? Koukněte na Plánovač úloh

Jak zastavit nechtěné programy na Windows? Koukněte na Plánovač úloh

** V systému se mohou periodicky spouštět nechtěné aplikace ** Anebo si vyberou tu nejméně vhodnou chvíli ** Prozkoumejte Plánovač úloh na Windows

23.  9.  2016 | Jakub Čížek | 128


Aktuální číslo časopisu Computer

Srovnání výhodných 27" monitorů

Velký test levných rychlých routerů

Jak nastavit Android, aby vás nesledoval

45 podrobných testů a recenzí