Počítače v Microsoftu rozpoznávají řeč na stejné úrovni jako lidé

Počítače v Microsoftu rozpoznávají řeč na stejné úrovni jako lidé

Výzkumníci Microsoftu hlásí dosažení důležitého milníku (PDF). Jejich systém pro rozpoznávání konverzace dosáhl stejné kvality, jako zvládají lidé. Nyní je cílem schopnosti lidí překonat, protože i lidé při poslechu chybují. Počítače dosáhly chybovosti 5,9 %, což je na úrovni lidských schopností.

Trénovací množinou byly telefonické nahrávky, kde lidé nemohou při rozpoznávání využít vizuální informace a musejí se spolehnout čistě na poslech. S rostoucím důrazem na hlasové asistenty s umělou inteligencí je rozpoznávání řeči klíčovou technologií pro budoucnost.

Klepněte pro větší obrázek

Aktuální výsledky se samozřejmě týkají anglického jazyka, není ale vše úplně ztracené. Jazyková propast se časem překoná. Nyní jsme ve fázi optimalizace postupů, aby se po zvládnutí angličtiny mohly počítače rychle naučit jakýkoli jiný jazyk. V důsledku tak nebudeme po zvládnutí angličtiny muset tolik čekat na kvalitní rozpoznávání češtiny. Samozřejmě bude nutné ale získat dostatečně bohatý korpus vstupních dat pro správné naučení neuronových sítí. Tam mají zatím lepší pozici Google a Apple, kteří už nyní nabízejí rozpoznávání mluvené češtiny a mohou tak sbírat testovací data. U Cortany Microsoftu na něco podobného stále čekáme.

Zdroj: Microsoft Research

Diskuze (7) Další článek: O zkušené ajťáky je nouze, T-Systems je láká na halušky

Témata článku: Microsoft, Technologie, Umělá inteligence, Cortana, Výzkum, Strojové učení, Neuronová síť, Lidé, Úroveň, Řeč, Rozpoznávání

Určitě si přečtěte


Aktuální číslo časopisu Computer

Zachraňte nefunkční Windows

Jak nakupovat a prodávat kryptoměny

Otestovali jsme konvertibilní notebooky

Velký test 14 herních myší