Open source | Mozilla

Mozilla Common Voice pro rozpoznávání řeči bude dostupný i v Česku. Zapojte se do sběru potřebných dat

Mozilla Common Voice pro rozpoznávání řeči bude dostupný i v Česku. Zapojte se do sběru potřebných dat

V létě minulého roku spustila Mozilla sběr dat pro Common Voice, open-source projekt s cílem vybudovat otevřenou platformu pro rozpoznávání řeči. Primárně jej zprovoznila v angličtině s příslibem postupného přibývání dalších jazyků. Nyní se díky tuzemské komunitě dostalo i na češtinu a na webu voice.mozilla.cz se kdokoliv může zapojit do první fáze projektu – sběru dostatečného množství vět pro pozdější převod.

Common Voice funguje na jednoduchém principu, kdy uživatelé předčítají vzorové věty. Čím víc vzorků, tím spolehlivější bude následný převod na text. Pro českou verzi je však třeba nejprve sesbírat alespoň dva tisíce zmíněných vzorových vět. Ty mohou uživatelé odesílat primárně ze zdrojů publikovaných pod svobodnou licencí CC0. Těmi mohou být třeba knihy, na která se již nevztahují autorská práva. V rámci nástroje pro Cherry picking jsou potom vybrány věty vhodné pro Common Voice.

Klepněte pro větší obrázek
Stačí zkopírovat kus textu z volného díla a nástroj sám vybere vhodné věty pro Common Voice

Až dojde k sesbírání dostatečného množství těchto vět, bude spuštěna druhá fáze projektu – sběr nahrávek, kde budou uživatelé ony věty předčítat.

Váš názor Další článek: Největší rival SpaceX pracuje na vlastní opakovaně použitelné raketě

Témata článku: Open source, Autorské právo, Mozilla, Svobodná licence, Sběr, Česká verze, Následný převod, Tuzemská komunita, Potřebné data, Jednoduchý princip, Dostatečné množství, Otevřená platforma, Minulý rok, Volné dílo, Česká republika, Věta, Fáze projektu, Data, Druhá fáze, Rozpoznávání, Uživatelé, První fáze


Určitě si přečtěte

Čistič moře nejenže nefunguje, ale navíc se láme

Čistič moře nejenže nefunguje, ale navíc se láme

** Zařízení v hodnotě 40 milionů dolarů mělo sbírat z hladiny oceánu plovoucí plastový odpad ** Mise ale nenaplňuje očekávání ** Šest set metrů dlouhé monstrum nejen moře nečistí, ale navíc rozpadá

Jaroslav Petr | 28

Prohnali jsme prohlížeče benchmarky. Nový Edge je opravdu Chrome a je rychlý!

Prohnali jsme prohlížeče benchmarky. Nový Edge je opravdu Chrome a je rychlý!

** Prohnali jsme nový Edge webovými benchmarky ** Potvrzují, že je to Chrome ** V animacích a vektorech je možná nejlepší

Jakub Čížek | 43

Biblická potopa Česka: Jak bychom dopadli, kdyby nás zatopil oceán

Biblická potopa Česka: Jak bychom dopadli, kdyby nás zatopil oceán

** Představte si biblickou potopu ** Nejprve zaniknou Děčín a Břeclav, pak i Brno a Praha ** Hlavním městem se stane Jihlava a zbytky Čechů přežijí na Kvildě

Jakub Čížek | 77

Ověřte si, jak je na tom váš disk nebo SSD: 8 tipů na aplikace, které vám to řeknou

Ověřte si, jak je na tom váš disk nebo SSD: 8 tipů na aplikace, které vám to řeknou

** Na pevných discích bývá uloženo to nejcennější – naše data ** Sledujte jejich „zdravotní stav“ pomocí jednoho z nástrojů ** Případné problémy díky nim odhalíte dříve než nastanou

Karel Kilián | 22



Aktuální číslo časopisu Computer

Test 9 levných notebooků

Jak na digitalizaci fotek

Otestovali jsme chytré osobní váhy

Ohebné displeje: budoucnost či slepá cesta?