IBM dosáhlo významného průlomu v rozpoznávání hlasu

Nová technologie mění rozpoznávání řeči v běžnou konverzaci. S novým softwarem IBM Embedded ViaVoice 4.4 nemusí řidiči a uživatelé mobilů používat předdefinované příkazy, ale mohou mluvit přirozeně.

Společnost IBM oznámila převratnou hlasovou technologii, která umožňuje řidičům automobilů a uživatelům mobilních zařízení používat přirozené mluvené příkazy, aniž by se museli učit konkrétní, předem určené povely.

Tato pokroková technologie, která je součástí právě uvolněného softwarového balíku IBM Embedded ViaVoice 4.4, je určena pro mobilní zařízení a pro navigační systémy v automobilech.

Nový produkt má uživatelům poskytnout novou flexibilitu a přesnost při používání zabudovaných hlasových zařízení. Pro interakci se systémy rozpoznávání řeči se dosud uživatelé museli naučit, zapamatovat a používat pevně stanovený soubor frází a příkazů. Ovšem nová technologie IBM umožňuje řidiči například naladit rádio 104,3 FM mluvenými pokyny: „Naladit 104,3,“ „Nastavit rádio na 104,3,“ nebo „Změnit rádio na 104,3.“ Široké spektrum intuitivních povelů přeladí rádio na požadovanou frekvenci, takže si uživatel nemusí pamatovat seznam konkrétních příkazů.

Software IBM Embedded ViaVoice 4.4 obsahuje technologii „rozpoznávání volných příkazů,“ která pomocí vyspělého statistického modelování jazyka a sémantické interpretace dovoluje porozumět přirozenému jazyku při komunikaci mezi uživatelem a systémem rozpoznávání hlasu. Rozpoznávání volných příkazů umožňuje lidem používat intuitivní povely při ovládání rádia nebo navigačních systémů v automobilech nebo při práci s příručními zařízeními.

Nový produkt také dosahuje podstatně lepší celkovou přesnost rozpoznávání za různých hlukových podmínek. Používá totiž nové akustické modely, zdokonalené techniky trénování akustických modelů a vylepšenou detekci řeči a ticha. Právě ta zajišťuje odfiltrování krátkodobých šumů, způsobených například hrboly na vozovce, troubením nebo drncáním na železničním přejezdu.

Rozpoznávání více jazyků, přirozenější používání

Noví uživatelé mohou systém začít okamžitě používat bez toho, aby si pamatovali konkrétní slova nebo fráze, takže se mohou soustředit na řízení. Uživatelé handheldů mohou plynuleji provádět potřebné úkoly v rámci svých normálních činností. Nový systém nejen umožňuje používat volné příkazy, ale také tyto příkazy snadno rozpoznává ve více jazycích.

IBM Embedded ViaVoice verze 4.4 je špičková technologie řeči pro mobilní zařízení, například navigační systémy v autech, handsfree sady k telefonům, kapesní počítače (PDA) a další inteligentní zařízení. Aplikace v těchto zařízeních mohou používat technologii IBM buď pro automatické rozpoznávání řeči (ASR), kdy jsou příkazy zadávány přirozenou řečí, nebo pro syntézu řeči z textu (TTS), kdy syntetický hlas čte text a další informace z mobilního zařízení.

O společnosti IBM
Společnost IBM je největším výrobcem IT produktů a poskytovatelem služeb informačních technologií na světě, s více než osmdesátiletou tradicí v inovacích, které mění náš svět.
K hlavním cílům IBM patří poskytování komplexních služeb systémového integrátora a prosazování výhod elektronického obchodování do každodenního života.
Další činností IBM ČR je prodej širokého spektra IT technologií, tedy všech typů počítačů, zálohovacích a komunikačních systémů, a to včetně programového vybavení a služeb.

Témata článku: Software, IBM, Handsfree

Nejnovější komentáře

Přidat příspěvek