Vyzkoušeli jsme profesionální převod hlasu na text [video]

Vyzkoušeli jsme profesionální převod hlasu na text [video]

České soudy a státní zastupitelství budou používat diktovací technologii od Newton Technologies. Vyzkoušeli jsme ji v praxi a podívali se, jak si poradí s četbou Computeru.

Popularita technologií jako Siri a hlasového diktování na Androidu může navodit dojem, že zde nic jiného neexistuje a tyto firmy jsou ve svém oboru průkopníky. Platí to jen z poloviny, tyto hlasové systémy jsou totiž hlavně průkopníky v oblasti učení – pokud začne diktovat pouhé procento majitelů zařízení s Androidem, jazykové databáze Googlu se naučí miliony nových slov a specifických výslovností.

Nicméně vedle Googlu a Applu tu jsou další, kteří se už specializují na přesný a opravdu často naprosto bezchybný přepis mluveného slova na text. Jsou to přesně ty programy, které se dnes začínají nasazovat třeba na soudech a mají za úkol usnadnit práci zapisovatelkám, které během jediného přelíčení musí zaznamenat desítky stran pro běžného smrtelníka často jen stěží srozumitelného textu.

Tuto práci nově převezme hlasový software od společnosti Newton Technologies, která na jeho vývoji spolupracuje už nějaký pátek s Technickou univerzitou v Liberci. Firma v létě vyhrála výběrové řízení vyhlášené Ministerstvem spravedlnosti a začne automaticky přepisovat mluvené slovo na státních zastupitelstvích a českých soudech.

Chtěli jsme vyzkoušet, jak tato technologie vypadá v praxi, a podrobili jsme digitální zapisovatelku několika testům na videu.

Newton Dictate 3 v praxi

Newton Dictate používá vlastní rozměrné slovníky, přičemž na výběr jsou optimalizované verze pro různé obory – zejména ty právní a z oblasti medicíny. Technický a počítačový slovník s výrazy, které najdete i zde na Živě.cz, zatím chybí, ale to je snad jen otázkou času. Software se v každém případě umí sám zdokonalovat, optimalizuje se na konkrétního mluvčího a jeho slovní zásobu můžete sami rozšiřovat.

nastaveni slovniku.png
Nastavení slovníku a úprava konkrétního slova

Zvládne nejen přímé diktování, ale také přepis běžné zvukové stopy, umí vložit text přímo na kurzor prakticky v libovolném programu na Windows, můžete pomocí něho vytvářet hlasová makra, umí diktovat po písmenech, což se hodí pro slova, která nezná, a tak dále. Nejdůležitější je ale to, že u odborné a spisovné češtiny trpí také velmi malou chybovostí – výrobce udává až 99% úspěšnost pro zkušeného uživatele.

makra.png
Vytvoření hlasového makra, které doplní text – zde adresu

Takto legrace si pochopitelně řekne o nadstandardní počítačový výkon. Na telefonech rozpoznávají mluvené slovo servery, na počítači ale budete potřebovat dostatečný procesor. Minimální doporučenou konfigurací je tedy alespoň procesor Intel Core i5.

A cena? Ani ta nebude pro každého. Základní verze pro jednotlivce stojí 4 900 korun, ta nejvyšší pro profesionály a neomezený počet uživatelů necelých 36 000 korun. V krabici nicméně u všech edicí obdržíte i kvalitní headset se směrovým mikrofonem.

Určitě si přečtěte

Články odjinud