Microsoft se připravuje ovládnout podnikovou i osobní sféru s umělou inteligencí takřka ve všech segmentech. Co všechno Microsoft má nebo brzy představí?
4. Adam poznává svět
Strojové získávání dat ze strukturovaných databází je lehké, dokonce i analytika strukturovaných dat je z toho pohledu jednoduchá. Složité věci ale přichází při analýze nestrukturovaných dat, kde nejsou přesná čísla v uložených tabulkách, ale jedná se o rozpoznávání obrazu nebo hlasu.
Microsoft má s rozpoznávání obrazu zkušenosti v rámci Kinectu pro herní konzoli Xbox, který už je v druhé generaci s lepšími parametry. Jako škálovatelnou platformu učící se inteligence ale Microsoft vyvíjí svého Adama.
Typický problém, který by měla umělá inteligence v cloudu ve stylu Adama brzy bez problému vyřešit a poskytnout uživateli okamžitě odpověď
Adam je učící se umělá inteligence, která využívá technik Deep Learning strojového učení a Microsoftu se s ní podařilo překonat skutečně zajímavé milníky. Jak aktuálně Microsoft informoval na svém blogu, Adama otestovali jakou distribuovanou inteligenci pomocí 14 milionů setříděných obrázků z webu ImageNet, který obsahuje 22 000 různých kategorií.
Díky velkému počtu vzorků se podařilo neuronovou síť naučit rozpoznávat na fotografiích nejen psy samotné, ale také konkrétní rasu. Microsoft tento milník porovnává s Google a jeho systémem, který se v minulosti naučil rozpoznávat kočky na fotografiích.
Dle tvrzení je řešení od Microsoftu 50× rychlejší, více než dvakrát přesnější a vyžaduje také 30× méně počítačů (přibližně 530 místo 16 000 jako u Googlu) zapojených do společného výpočtu. Řešení je navíc škálovatelné. Nutno ale podotknout, že Google výzkum ukazoval před lety a za tu dobu jistě s umělou inteligencí pro rozpoznávání obrazu také výrazně pokročil.
Že toto řešení opravdu funguje, Microsoft ukázal živě pomocí vyfotografování psa přímo při prezentaci. Fotografie nebyla nijak speciálně upravená a obsahovala spoustu dalších objektů. K rozpoznání došlo skvěle, byl to skutečně „Ridgeback“.
Cílem projektu Adam bylo dosáhnout rychle se učícího systému, který by byl výkonově úsporný, přesný a také snadno škálovatelný pro použití coby větší platformy. Adama tak lze použít nejen na rozpoznání obrazu, ale také na hlas, text a další oblasti, kde je nutné nechat neuronovou síť projít učením se spoustou vzorků. Škálování se podařilo Microsoftu vyřešit pomocí asynchronního přístupu k učení DNN (Deep Neural Network), který má výborné výsledky.
Systém postupného učení například v případě rozpoznávání obrazu se v první vlně naučí rozeznat tvary psů, v další fázi pak třeba povrch a kožich daného psa, poté se učí rozpoznávat různé části psa (oči, uši, ocas, nohy atd.), čtvrtou fází je pochopení větších části těla psa a v neposlední řadě také naučení toho, jak vypadá psí tvář jako celek a podobně.
Výsledkem je, že se taková neuronová síť sama naučí, co vlastně dělá psa psem, stejně jako to pozná člověk. Dle vyjádření ani tvůrci přesně neví, jak dochází k učení na všech úrovních pokročilé neuronové sítě. „Je to jako kvantová fyzika na začátku 20. století. Experimenty jsou v předstihu před teorií. Víme, že jsou v tom ukryté neuvěřitelné možnosti, které ještě pořádně nechápeme.“