Pokročilé rozpoznávání objektů pro budoucí roboty

Rozpoznávání obrázků je už poměrně snadnou záležitostí, roboti pohybující se v prostoru ale budou muset umět rozpoznávat trojrozměrné objekty v reálném čase.
Pokročilé rozpoznávání objektů pro budoucí roboty

Náš mozek má mnoho unikátních vlastností, jednou z nich je rozpoznávání objektů v reálném čase. A to platí nejen u dvourozměrných objektů třeba na obrázku nebo fotografiích, ale také trojrozměrných věcí v běžné nebo virtuální realitě.

Zatímco v případě rozpoznávání dvourozměrných obrázků už jsou počítačové systémy vybavené strojovým učením a umělou inteligencí velmi pokročilé a v některých specializovaných případech to dokonce zvládnou lépe než člověk, u trojrozměrných objektů je to o něco složitější a komplikovanější.

SLAM počítá s pozicí i časem

Technika SLAM (Simultaneous Localization And Mapping) řeší problém analýzy neznámého prostoru a zároveň pohyb třeba robota či auta v takové nasnímané mapě. Vědci z MIT použili principy této techniky pro rozpoznávání objektů v obraze.

Klepněte pro větší obrázek
Analýza objektů dle prostoru a v průběhu času

Systém funguje odlišně než běžné metody pro rozpoznávání trojrozměrných objektů v prostoru. Oproti stávajícím řešením, které analyzují každý snímek obrazu samostatně a rozpoznávají tak konkrétní objekty v daném obrazu, nový způsob využívá času i pozice.

Díky tomu systém netrpí velkým počtem chybových rozpoznání. Objekty se tak neanalyzují pouze z pohledu jednoho aktuálního snímku, ale porovnávají se i s předchozími, čímž lze předejít velkému množství chyb. Technologie okáže pracovat jak s pozicí, tak i časovou osou, zkrátka podobně jako to dělá třeba i mozek.

Klepněte pro větší obrázek
Porovnání s klasickým přístupem, který v určitých pohledech nerozpozná objekty vůbec nebo chybně

Pokud se tak kamera pohybuje okolo objektů, dokáže je správně rozpoznat ze všech úhlů, i když některé úhly pohledu na objekty ještě systém nikdy neviděl a nemá je s čím porovnat. Tím trpí právě jednodušší systémy, které se soustředí pouze na rozpoznání jednoho samostatného snímku. Důležitost takového přístupu je jasná, když si uvědomíme, že prakticky ani není možné postavit efektivní platformu, kde by byly uložené zcela všechny objekty ze všech možných úhlů.

Klepněte pro větší obrázek
Rozpoznávání objektů

S pokročilým přístup k analýze, která počítá s časem i pozicí, lze poměrně dobře řešit i problémy spojené třeba s překrývajícími objekty, které se v některém pohledu mohou splývat. Pokud mají stejnou barvu, může je algoritmus vyhodnotit mylně jako jeden předmět. Jakmile ale analýza zahrnuje jejich vlastnosti z jiného časového segmentu a stejné pozice, bude stále počítat s tím, že jde o dva samostatné objekty.

Stačí jediná běžná kamera

Představené řešení postavené na SLAMu navíc dokáže pracovat pouze s jedinou i běžnou kamerou, která je třeba v tabletu nebo mobilním telefonu. Existují samozřejmě technologie, které využívají dvou kamer, používají infračervené vysílače pro měření hloubky obrazu a podobně, ale znamená to i mnohem vyšší cenu a velikost. Navíc tyto systémy sice fungují dobře například v místnostech, ale venku už ztrácí význam, protože už není možné dobře využít jejich předností.

Klepněte pro větší obrázek

Jednodušší konstrukce dokáže nabídnout podobnou kvalitu rozpoznání objektů, jako složitější a dražší systémy s několika kamerami. Je ale samozřejmě nutné počítat s tím, že je důležitý i dostatečný výpočetní výkon, který umožňuje zpracování obrazu a rozpoznání objektů v reálném čase.

Pro užitečné roboty

Aby mohli roboti zvládat pokročilé různorodé věci, musí mít nejen dostatek senzorů a univerzální konstrukci, ale musí umět i důležitý základ v podobě rozpoznávání objektů v prostoru.

Principy SLAMu pomáhají analýze objektů, která ale zároveň zlepšuje i mapování prostředí. Případný robot totiž musí například rozpoznat, pokud už dříve byl ve stejné místnosti, aby dané místo nepovažoval za nové, ale rozšířil informace o stávají uložené místnosti. Nám lidem se to může zdát jako samozřejmost, ale zahrnuje to spoustu problémů, které musíme vyřešit, než se budou univerzální roboti pohybovat mezi námi.

Témata článku: Technologie, Roboti, Slam

6 komentářů

Nejnovější komentáře

  • PD 5. 8. 2015 10:17:31
    Rozpoznávání věcí je pro terminátora podstatná funkce...
  • Pebog 3. 8. 2015 15:40:26
    Je možné, že počítačové systémy dokáží identifikovat nějaké obrázky "lépe"...
  • r3c1d1v15t 2. 8. 2015 13:18:37
    Tak koli tejto feature určite upgradujem na Windows 10!
Určitě si přečtěte

Nové úlovky kamer Googlu: Šmírovačka na Street View nepřestává bavit

Nové úlovky kamer Googlu: Šmírovačka na Street View nepřestává bavit

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

19.  5.  2017 | redakce | 38

Nastal čas znovu vynalézt klávesnici. Anebo vám ta současná opravdu vyhovuje?

Nastal čas znovu vynalézt klávesnici. Anebo vám ta současná opravdu vyhovuje?

**Měli bychom provést revoluci klávesnice? ** Anebo je její dnes už hodně zastaralý koncept prostě nejlepší? ** Budeme na klávesnici odkázaní už navždy?

20.  5.  2017 | Jakub Čížek | 58

WannaCry se neměl vůbec rozšířit. Stačilo, abychom používali Windows Update

WannaCry se neměl vůbec rozšířit. Stačilo, abychom používali Windows Update

** WannaCry se masivně rozšířil kvůli zranitelnosti ve Windows ** Ta mu umožnila, aby se pokusil sám napadnout další počítače ** Jenže ta chyba už je dva měsíce opravená!

22.  5.  2017 | Jakub Čížek | 84


Aktuální číslo časopisu Computer

Supertéma: moderní cestování

Kdy opravdu přijdou nové baterie?

Velké testy: 6 herních notebooků a 8 volantů

Recenze: AMD Ryzen řady 5