Vyzkoušeli jsme profesionální převod hlasu na text [video]

České soudy a státní zastupitelství budou používat diktovací technologii od Newton Technologies. Vyzkoušeli jsme ji v praxi a podívali se, jak si poradí s četbou Computeru.

Popularita technologií jako Siri a hlasového diktování na Androidu může navodit dojem, že zde nic jiného neexistuje a tyto firmy jsou ve svém oboru průkopníky. Platí to jen z poloviny, tyto hlasové systémy jsou totiž hlavně průkopníky v oblasti učení – pokud začne diktovat pouhé procento majitelů zařízení s Androidem, jazykové databáze Googlu se naučí miliony nových slov a specifických výslovností.

Nicméně vedle Googlu a Applu tu jsou další, kteří se už specializují na přesný a opravdu často naprosto bezchybný přepis mluveného slova na text. Jsou to přesně ty programy, které se dnes začínají nasazovat třeba na soudech a mají za úkol usnadnit práci zapisovatelkám, které během jediného přelíčení musí zaznamenat desítky stran pro běžného smrtelníka často jen stěží srozumitelného textu.

Tuto práci nově převezme hlasový software od společnosti Newton Technologies, která na jeho vývoji spolupracuje už nějaký pátek s Technickou univerzitou v Liberci. Firma v létě vyhrála výběrové řízení vyhlášené Ministerstvem spravedlnosti a začne automaticky přepisovat mluvené slovo na státních zastupitelstvích a českých soudech.

Chtěli jsme vyzkoušet, jak tato technologie vypadá v praxi, a podrobili jsme digitální zapisovatelku několika testům na videu.

Newton Dictate 3 v praxi

Newton Dictate používá vlastní rozměrné slovníky, přičemž na výběr jsou optimalizované verze pro různé obory – zejména ty právní a z oblasti medicíny. Technický a počítačový slovník s výrazy, které najdete i zde na Živě.cz, zatím chybí, ale to je snad jen otázkou času. Software se v každém případě umí sám zdokonalovat, optimalizuje se na konkrétního mluvčího a jeho slovní zásobu můžete sami rozšiřovat.

Klepněte pro větší obrázek
Nastavení slovníku a úprava konkrétního slova

Zvládne nejen přímé diktování, ale také přepis běžné zvukové stopy, umí vložit text přímo na kurzor prakticky v libovolném programu na Windows, můžete pomocí něho vytvářet hlasová makra, umí diktovat po písmenech, což se hodí pro slova, která nezná, a tak dále. Nejdůležitější je ale to, že u odborné a spisovné češtiny trpí také velmi malou chybovostí – výrobce udává až 99% úspěšnost pro zkušeného uživatele.

Klepněte pro větší obrázek
Vytvoření hlasového makra, které doplní text – zde adresu

Takto legrace si pochopitelně řekne o nadstandardní počítačový výkon. Na telefonech rozpoznávají mluvené slovo servery, na počítači ale budete potřebovat dostatečný procesor. Minimální doporučenou konfigurací je tedy alespoň procesor Intel Core i5.

A cena? Ani ta nebude pro každého. Základní verze pro jednotlivce stojí 4 900 korun, ta nejvyšší pro profesionály a neomezený počet uživatelů necelých 36 000 korun. V krabici nicméně u všech edicí obdržíte i kvalitní headset se směrovým mikrofonem.

Témata článku: Video, Technologie, Newton, Headset

57 komentářů

Nejnovější komentáře

  • Piťo 10. 10. 2012 17:55:21
    Prevod písma na reč ma zaujal už pri kúpe prvého PC asi pred 10 rokmi....
  • dusan.n 8. 10. 2012 22:58:01
    Zatím jsem to viděl v prodeji pouze na Alza.cz. Uvažoval jsem o verzi...
  • David Kopecký 8. 10. 2012 22:56:22
    si stáhnu kreklou verzy ;-) jako u win7 :-D
Určitě si přečtěte

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

** Gary Kildall pochopil, že levné výpočetní čipy mohou posloužit jako univerzální počítače pro všechny ** Připravil pro ně proto první operační systém ** Později mu systém vyfoukl Microsoft a nazval ho MS DOS

23.  4.  2017 | Pavel Tronner | 57

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

** Už je to tady, lidé přestávají chápat počítače ** Systémy neuronových sítí začínají pracovat tak, že ani jejich tvůrci přesně neví, co se uvnitř děje ** Do budoucna to může být závažný problém

24.  4.  2017 | Jakub Čížek | 112

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

** Slavný osmibitový počítač Sinclair ZX Spectrum byl uveden právě před 35 lety ** Připomeňte si tento průkopnický počítač v tematických článcích ** Podívejte se, jak funguje dnes

23.  4.  2017 | Pavel Tronner | 13

Acer chrlí novinky: levný a tenký Predator, nové Switche a další notebooky

Acer chrlí novinky: levný a tenký Predator, nové Switche a další notebooky

** Acer na konferenci v New Yorku představil velkou spoustu novinek z oblasti počítačů, notebooků i monitorů ** Notebookové novinky se dotkly řad Predator, Swift, Switch i Aspire ** Herní notebooky dostaly nový typ chlazení

27.  4.  2017 | Karel Javůrek | 7

Správný počítač má alespoň dva monitory. Anebo je to jinak?

Správný počítač má alespoň dva monitory. Anebo je to jinak?

** David si nedokáže představit práci bez dvou a více monitorů ** Kubovi naopak stačí jeden a ve více displejích se ztrácí ** Jaký přístup je lepší?

23.  4.  2017 | Jakub Čížek | 59


Aktuální číslo časopisu Computer

Supertéma: moderní cestování

Kdy opravdu přijdou nové baterie?

Velké testy: 6 herních notebooků a 8 volantů

Recenze: AMD Ryzen řady 5