Počítače v Microsoftu rozpoznávají řeč na stejné úrovni jako lidé

Výzkumníci Microsoftu hlásí dosažení důležitého milníku (PDF). Jejich systém pro rozpoznávání konverzace dosáhl stejné kvality, jako zvládají lidé. Nyní je cílem schopnosti lidí překonat, protože i lidé při poslechu chybují. Počítače dosáhly chybovosti 5,9 %, což je na úrovni lidských schopností.

Trénovací množinou byly telefonické nahrávky, kde lidé nemohou při rozpoznávání využít vizuální informace a musejí se spolehnout čistě na poslech. S rostoucím důrazem na hlasové asistenty s umělou inteligencí je rozpoznávání řeči klíčovou technologií pro budoucnost.

Klepněte pro větší obrázek

Aktuální výsledky se samozřejmě týkají anglického jazyka, není ale vše úplně ztracené. Jazyková propast se časem překoná. Nyní jsme ve fázi optimalizace postupů, aby se po zvládnutí angličtiny mohly počítače rychle naučit jakýkoli jiný jazyk. V důsledku tak nebudeme po zvládnutí angličtiny muset tolik čekat na kvalitní rozpoznávání češtiny. Samozřejmě bude nutné ale získat dostatečně bohatý korpus vstupních dat pro správné naučení neuronových sítí. Tam mají zatím lepší pozici Google a Apple, kteří už nyní nabízejí rozpoznávání mluvené češtiny a mohou tak sbírat testovací data. U Cortany Microsoftu na něco podobného stále čekáme.

Zdroj: Microsoft Research

Témata článku: Microsoft, Technologie, Umělá inteligence, Strojové učení, Neuronová síť, Výzkum

7 komentářů

Nejnovější komentáře

  • Jarda.abc 19. 10. 2016 13:02:16
    Tak já nevím, ale když si pustím rádio, tak snad rozumím každému slovu a...
  • O8R7RAN 19. 10. 2016 12:30:16
    Nemám M$ rád, ale tohle mu musím férově uznat. Když jsme jednou s kámošem...
  • peter.mlich 19. 10. 2016 11:13:04
    Vyborna technologie pro odposlechy. Dokonce by to mohlo sledovat rozhovory...
Určitě si přečtěte