Mozilla Common Voice pro rozpoznávání řeči bude dostupný i v Česku. Zapojte se do sběru potřebných dat

Mozilla Common Voice pro rozpoznávání řeči bude dostupný i v Česku. Zapojte se do sběru potřebných dat

V létě minulého roku spustila Mozilla sběr dat pro Common Voice, open-source projekt s cílem vybudovat otevřenou platformu pro rozpoznávání řeči. Primárně jej zprovoznila v angličtině s příslibem postupného přibývání dalších jazyků. Nyní se díky tuzemské komunitě dostalo i na češtinu a na webu voice.mozilla.cz se kdokoliv může zapojit do první fáze projektu – sběru dostatečného množství vět pro pozdější převod.

Common Voice funguje na jednoduchém principu, kdy uživatelé předčítají vzorové věty. Čím víc vzorků, tím spolehlivější bude následný převod na text. Pro českou verzi je však třeba nejprve sesbírat alespoň dva tisíce zmíněných vzorových vět. Ty mohou uživatelé odesílat primárně ze zdrojů publikovaných pod svobodnou licencí CC0. Těmi mohou být třeba knihy, na která se již nevztahují autorská práva. V rámci nástroje pro Cherry picking jsou potom vybrány věty vhodné pro Common Voice.

Klepněte pro větší obrázek
Stačí zkopírovat kus textu z volného díla a nástroj sám vybere vhodné věty pro Common Voice

Až dojde k sesbírání dostatečného množství těchto vět, bude spuštěna druhá fáze projektu – sběr nahrávek, kde budou uživatelé ony věty předčítat.

Váš názor Další článek: Největší rival SpaceX pracuje na vlastní opakovaně použitelné raketě

Témata článku: Open source, Mozilla, Autorské právo, Druhá fáze, První fáze, Tuzemská komunita, Otevřená platforma, Svobodná licence, Česká republika, Rozpoznávání, Následný převod, Česká verze, Minulý rok, Věta, Volné dílo, Jednoduchý princip, Dostatečné množství, Sběr, Potřebné data, Data, Fáze projektu, Uživatelé

Určitě si přečtěte


Aktuální číslo časopisu Computer

Jak rychlé je nabíjení bez drátů?

Test 11 sluchátek pro hráče

Aplikace, které vám zachrání dovolenou

Kompletní přehled datových tarifů