Vyzkoušeli jsme profesionální převod hlasu na text [video]

České soudy a státní zastupitelství budou používat diktovací technologii od Newton Technologies. Vyzkoušeli jsme ji v praxi a podívali se, jak si poradí s četbou Computeru.
Vyzkoušeli jsme profesionální převod hlasu na text [video]

Popularita technologií jako Siri a hlasového diktování na Androidu může navodit dojem, že zde nic jiného neexistuje a tyto firmy jsou ve svém oboru průkopníky. Platí to jen z poloviny, tyto hlasové systémy jsou totiž hlavně průkopníky v oblasti učení – pokud začne diktovat pouhé procento majitelů zařízení s Androidem, jazykové databáze Googlu se naučí miliony nových slov a specifických výslovností.

Nicméně vedle Googlu a Applu tu jsou další, kteří se už specializují na přesný a opravdu často naprosto bezchybný přepis mluveného slova na text. Jsou to přesně ty programy, které se dnes začínají nasazovat třeba na soudech a mají za úkol usnadnit práci zapisovatelkám, které během jediného přelíčení musí zaznamenat desítky stran pro běžného smrtelníka často jen stěží srozumitelného textu.

Tuto práci nově převezme hlasový software od společnosti Newton Technologies, která na jeho vývoji spolupracuje už nějaký pátek s Technickou univerzitou v Liberci. Firma v létě vyhrála výběrové řízení vyhlášené Ministerstvem spravedlnosti a začne automaticky přepisovat mluvené slovo na státních zastupitelstvích a českých soudech.

Chtěli jsme vyzkoušet, jak tato technologie vypadá v praxi, a podrobili jsme digitální zapisovatelku několika testům na videu.

Newton Dictate 3 v praxi

Newton Dictate používá vlastní rozměrné slovníky, přičemž na výběr jsou optimalizované verze pro různé obory – zejména ty právní a z oblasti medicíny. Technický a počítačový slovník s výrazy, které najdete i zde na Živě.cz, zatím chybí, ale to je snad jen otázkou času. Software se v každém případě umí sám zdokonalovat, optimalizuje se na konkrétního mluvčího a jeho slovní zásobu můžete sami rozšiřovat.

Klepněte pro větší obrázek
Nastavení slovníku a úprava konkrétního slova

Zvládne nejen přímé diktování, ale také přepis běžné zvukové stopy, umí vložit text přímo na kurzor prakticky v libovolném programu na Windows, můžete pomocí něho vytvářet hlasová makra, umí diktovat po písmenech, což se hodí pro slova, která nezná, a tak dále. Nejdůležitější je ale to, že u odborné a spisovné češtiny trpí také velmi malou chybovostí – výrobce udává až 99% úspěšnost pro zkušeného uživatele.

Klepněte pro větší obrázek
Vytvoření hlasového makra, které doplní text – zde adresu

Takto legrace si pochopitelně řekne o nadstandardní počítačový výkon. Na telefonech rozpoznávají mluvené slovo servery, na počítači ale budete potřebovat dostatečný procesor. Minimální doporučenou konfigurací je tedy alespoň procesor Intel Core i5.

A cena? Ani ta nebude pro každého. Základní verze pro jednotlivce stojí 4 900 korun, ta nejvyšší pro profesionály a neomezený počet uživatelů necelých 36 000 korun. V krabici nicméně u všech edicí obdržíte i kvalitní headset se směrovým mikrofonem.

Diskuze (57) Další článek: Windows Server 2012: další licence úplně jinak

Témata článku: Technologie, Video, Výslovnost, Hlasové diktování, Mluvené slovo, Kvalitní headset, Směrový mikrofon, Profesionál, Převod, Minimální úprava, Newton, TeX, Headset, Hlas, Oblast medicíny, Počítačový výkon, Vid, Pouhé procento


Určitě si přečtěte

Windy je laboratoř na počasí: 12 tipů, jak se ve službě vyznat a využít ji naplno

Windy je laboratoř na počasí: 12 tipů, jak se ve službě vyznat a využít ji naplno

** Předpověď počasí Windy nabízí nepřebernou škálu funkcí ** Zorientovat se v nich nemusí být vždy snadné ** Proto přinášíme 12 užitečných tipů a triků

Karel Kilián | 10

Nejlepší programy z roku 2000: Další várka zapomenutých legend, které jste měli v PC

Nejlepší programy z roku 2000: Další várka zapomenutých legend, které jste měli v PC

** Pokračujeme ve vzpomínání na prehistorické programy ** Pročetli jsme vaše tipy v diskuzi ** A všechny ty vykopávky spustili na Windows 2000

Jakub Čížek | 74

Z rozmazané šmouhy krásná fotka. Takhle kouzlí nová umělá inteligence MyHeritage

Z rozmazané šmouhy krásná fotka. Takhle kouzlí nová umělá inteligence MyHeritage

** MyHeritage slibuje nejlepší neuronovou síť pro vylepšování fotek ** Funguje tím líp, čím horší fotku upravuje ** Otestovali jsme desítky různých snímků

Marek Lutonský, Lukáš Václavík | 39

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 3


Aktuální číslo časopisu Computer

Megatest: nejlepší notebooky do 20 000 Kč

Test 8 levných IP kamer

Jak vybrat bezdrátová sluchátka

Testujeme Android 11