Revoluce v komunikaci: Skype překládá v reálném čase

Dva lidé hovořící různými jazyky si spolu mohou popovídat bez tlumočníka. Toho nahradí softwarový robot od Microsoftu. Novinka je dostupná v ukázkové verzi Skype Translatoru.

Slovo „revoluční“ se snažíme používat jen výjimečně, často jím bývají různé technologické inovace přeceňovány. Ale to, co teď představil Microsoft, si toto označení zaslouží, byť to znamená teprve první krůček k něčemu, co se revoluční bude zdát až při zpětném pohledu. Jeho komunikační nástroj Skype se totiž naučil překládat konverzaci během vidohovorů.

O univerzálním přístroji, který by dokázal okamžitě překládat konverzace z jiných jazyků, sní lidstvo už velmi dlouho. A nezřídka se takové zařízení objevovalo ve sci-fi literatuře či filmech. Na jeho reálném vývoji pracuje několik výzkumných týmů, nejen dnes zviditelněný Microsoft. Z těch velkých zmiňme například Google, jehož překladač rovněž umí větu v jednom jazyce poslechnout a v jiném říct. Ale Microsoft přišel s tím vysněným univerzálním nástrojem – prostě si mohou povídat dva lidé, kteří mluví jinak.

Tlumočník ze serverů Microsoftu

Samozřejmě, má to ještě mnoho much a program je teprve ve fázi „preview“. Zatím umí překládat pouze mezi angličtinou a španělštinou a pro jeho vyzkoušení se musíte registrovat. Microsoft však na této technologii pracuje už patnáct let a je to poprvé, kdy ze své kuchyně vypustil ukázkové dílo k testování veřejnosti.

Klepněte pro větší obrázek 
Vy si povídáte, Skype překládá. Pro jistotu přitom vidíte i textový přepis konverzace, abyste mohli opravit, když by vám Skype špatně porozuměl

Translator tedy zatím nehledejte přímo v aplikaci Skypu, ten získáte až po registraci, kdy si můžete stáhnout samostatnou aplikaci Skype Translator. Ta vypadá jako Skype, jen má navíc překladací funkce. A je jasné, že tak bude v budoucnu vypadat i běžný Skype.

Podle ukázkových videí to funguje docela dobře. V rozhovoru jsou pochopitelně prodlevy, protože program překládá po jednotlivých konverzačních blocích, jak by to dělal živý tlumočník. V rámci zkoušky v praxi zkusil Microsoft nasadit Skype Translator mezi dvě školy – jednu v Mexiku, kde se mluví španělsky, a druhou v USA. Děti si měly povídat skrze videohovor, který překládat Skype Translator. A podle všeho si děti rozuměly a dobře se bavily:

Jak to funguje na pozadí? Zvuková stopa dorazí na servery Microsoftu, kde proběhne její zpracování. Základem je rozpoznání obsahu, tedy jednotlivých slov, sousloví a vět. Na to má Microsoft vyvinutou technologii, která toho umí hodně už v základu, ale její kouzlo spočívá především ve schopnosti se učit. Každý rozhovor tak poslouží jako nová zásoba vzorků různých výslovností, dialektů, přízvuků a podobně. Jako „studijní“ materiály slouží nejen rozhovory na Skypu, ale i záznamy přednášek a různorodý audio a videoobsah, kterým Microsoft svého robota krmí, aby se učil.

Hlavně porozumět

Protože ale lidé nemluví strojovým jazykem a v mluvené řeči dělají chyby, přeřeky, smích, pauzy nebo „eee“, když jim hned nenaskočilo požadované slůvko, učí se robot i tomu, co slova nejsou. Konverzační celek pak analyzuje, aby pochopil jeho kontext a nabídl podle toho adekvátní překlad. Ve správném porozumění je základ úspěchu následného překladu.

Jak to funguje:

Pak už by se dalo zjednodušeně říct, že se vyseparovaný vzorek konverzace prožene Bing překladačem a hlasový syntezátor přečte výsledek. Tak to je, nicméně i na samotném překladači se muselo zapracovat a také on se průběžně učí. Původně vznikl jako překladač textu a mluvená řeč, byť přepsaná do textu, má svá specifika, která se překladač musí průběžně naučit.

Zdaleka to nebude ještě ideální, ale funguje to rychle a pro běžnou konverzaci to bude bezesporu použitelné. Kromě překladů přímo během video/audio konverzace umí Skype Translator překládat pochopitelně i textový chat, kde už je nabídka jazyků rozšířena na 40 včetně češtiny. Ale to už tolik nepřekvapí, protože se jedná o jednoduchou implementaci Bing překladače.

Klepněte pro větší obrázek 
Schéma principu technologie Skype Translatoru

Microsoftu se vývoj technologií na rozpoznávání řeči hodí nejen pro Skype, ale také pro Cortanu a naplnění nápadu univerzálního hlasového ovládání. Všechno už pár let nabízí, ale pořád to není úplně ono, nové modely učení vyvíjené na modelech neuronových sítí by měly napomoci rychlejšímu zdokonalování a větší použitelnosti.

Klepněte pro větší obrázek  Klepněte pro větší obrázek 
Bing překladač si s češtinou rozumí, ale neumí ji vyslovit • překladač Googlu má základní hlasový syntazátor i pro češtinu, není ale zdaleka tak přirozený jako ten anglický

Připomeňme ale znovu i konkurenční Google, který nabízí možnost diktování v každém telefonu s Androidem, umožňuje vyhledávání hlasem, má rovněž svůj hlasový překladač, automatické překládání videí na YouTube a hlasovou asistentku Google Now. Bezesporu i v Googleplexu zraje myšlenka pro nasazení překladače do komunikačního nástroje Hangouts a možná její nasazení do praxe aktuální novinka Microsoftu urychlí.

Na použitelného robotického tlumočníka při komunikaci z českého nebo do českého jazyka si ale budeme muset ještě počkat. Nejprve se musí vypilovat nejpoužívanější jazykové kombinace, které najdou uplatnění u největší skupiny lidí. Ale Google už i češtině dobře rozumí a když se velcí spojí s lokálními, jako je třeba Newton technologies, máme šanci na skutečně kvalitní jazykové nástroje od ovládání až po průběžné překládání. Snad za pár let... ale rozhodně neprohloupíte, když se během čekání naučíte nějakou cizí řeč sami.

Diskuze (29) Další článek: Bitcoin byl letos nejhorší investicí. To ale vůbec nemusí být na škodu

Témata článku: Software, Microsoft, Web, Skype, Přízvuk, Textový chat, Textový přepis, Konverzace, Výslovnost, Googleplexu, Google Hangouts, Revoluce, Tlumočník, První krůček, Hangouts, Google Translator, Sky, Syntezátor, Translator, Mluvená řeč, Videoobsah, Výzkumný tým, Hlasový překladač, Skype Translator, Překladače


Určitě si přečtěte

Dnes nastal konec Windows 7. Ale nepropadejte panice, počítač vám nastartuje i zítra

Dnes nastal konec Windows 7. Ale nepropadejte panice, počítač vám nastartuje i zítra

** Dnes končí podpora Windows 7 a systém formálně umírá ** Co to ale znamená v praxi a bude mi PC fungovat i zítra? ** A mohu i v lednu 2020 zdarma přejít na Windows 10?

Jakub Čížek | 121

Koupili jsme nejlevnější dron s kamerou. Stál nás 300 Kč a má rozměry kreditky

Koupili jsme nejlevnější dron s kamerou. Stál nás 300 Kč a má rozměry kreditky

** Kvalitní drony začínají na 10 000 Kč ** Šli jsme na to jinak a koupili ten nejlevnější s kamerou ** I když je to čínský šmejd, je s ním zábava

Jakub Čížek | 35

Chrome se naučí dokonale odkazovat. Jeho odpůrci bijí na poplach, prý je to bezpečnostní katastrofa

Chrome se naučí dokonale odkazovat. Jeho odpůrci bijí na poplach, prý je to bezpečnostní katastrofa

** Google zavádí techniku ScrollToTextFragment ** Umí vytvořit odkaz na konkrétní slovo na stránce ** Podle kritiků by to mohl být bezpečnostní problém

Jakub Čížek | 40

Nový Edge je opravdu Chrome! Prohnali jsme prohlížeče benchmarky i vlastním unikátním testem

Nový Edge je opravdu Chrome! Prohnali jsme prohlížeče benchmarky i vlastním unikátním testem

** Nový Edge je postavený na Chromiu ** Prohnali jsme ho benchmarky a srovnali s ostatními ** Potvrdily nám, že je prakticky stejný jako Chrome a Opera

Jakub Čížek | 66



Aktuální číslo časopisu Computer

Velký test autokamer

Test ATX skříní

Jak surfovat pohodlně

Sportovní aplikace

Jak funguje procesor