Revoluce v komunikaci: Skype překládá v reálném čase

Dva lidé hovořící různými jazyky si spolu mohou popovídat bez tlumočníka. Toho nahradí softwarový robot od Microsoftu. Novinka je dostupná v ukázkové verzi Skype Translatoru.

Slovo „revoluční“ se snažíme používat jen výjimečně, často jím bývají různé technologické inovace přeceňovány. Ale to, co teď představil Microsoft, si toto označení zaslouží, byť to znamená teprve první krůček k něčemu, co se revoluční bude zdát až při zpětném pohledu. Jeho komunikační nástroj Skype se totiž naučil překládat konverzaci během vidohovorů.

O univerzálním přístroji, který by dokázal okamžitě překládat konverzace z jiných jazyků, sní lidstvo už velmi dlouho. A nezřídka se takové zařízení objevovalo ve sci-fi literatuře či filmech. Na jeho reálném vývoji pracuje několik výzkumných týmů, nejen dnes zviditelněný Microsoft. Z těch velkých zmiňme například Google, jehož překladač rovněž umí větu v jednom jazyce poslechnout a v jiném říct. Ale Microsoft přišel s tím vysněným univerzálním nástrojem – prostě si mohou povídat dva lidé, kteří mluví jinak.

Tlumočník ze serverů Microsoftu

Samozřejmě, má to ještě mnoho much a program je teprve ve fázi „preview“. Zatím umí překládat pouze mezi angličtinou a španělštinou a pro jeho vyzkoušení se musíte registrovat. Microsoft však na této technologii pracuje už patnáct let a je to poprvé, kdy ze své kuchyně vypustil ukázkové dílo k testování veřejnosti.

Klepněte pro větší obrázek 
Vy si povídáte, Skype překládá. Pro jistotu přitom vidíte i textový přepis konverzace, abyste mohli opravit, když by vám Skype špatně porozuměl

Translator tedy zatím nehledejte přímo v aplikaci Skypu, ten získáte až po registraci, kdy si můžete stáhnout samostatnou aplikaci Skype Translator. Ta vypadá jako Skype, jen má navíc překladací funkce. A je jasné, že tak bude v budoucnu vypadat i běžný Skype.

Podle ukázkových videí to funguje docela dobře. V rozhovoru jsou pochopitelně prodlevy, protože program překládá po jednotlivých konverzačních blocích, jak by to dělal živý tlumočník. V rámci zkoušky v praxi zkusil Microsoft nasadit Skype Translator mezi dvě školy – jednu v Mexiku, kde se mluví španělsky, a druhou v USA. Děti si měly povídat skrze videohovor, který překládat Skype Translator. A podle všeho si děti rozuměly a dobře se bavily:

Jak to funguje na pozadí? Zvuková stopa dorazí na servery Microsoftu, kde proběhne její zpracování. Základem je rozpoznání obsahu, tedy jednotlivých slov, sousloví a vět. Na to má Microsoft vyvinutou technologii, která toho umí hodně už v základu, ale její kouzlo spočívá především ve schopnosti se učit. Každý rozhovor tak poslouží jako nová zásoba vzorků různých výslovností, dialektů, přízvuků a podobně. Jako „studijní“ materiály slouží nejen rozhovory na Skypu, ale i záznamy přednášek a různorodý audio a videoobsah, kterým Microsoft svého robota krmí, aby se učil.

Hlavně porozumět

Protože ale lidé nemluví strojovým jazykem a v mluvené řeči dělají chyby, přeřeky, smích, pauzy nebo „eee“, když jim hned nenaskočilo požadované slůvko, učí se robot i tomu, co slova nejsou. Konverzační celek pak analyzuje, aby pochopil jeho kontext a nabídl podle toho adekvátní překlad. Ve správném porozumění je základ úspěchu následného překladu.

Jak to funguje:

Pak už by se dalo zjednodušeně říct, že se vyseparovaný vzorek konverzace prožene Bing překladačem a hlasový syntezátor přečte výsledek. Tak to je, nicméně i na samotném překladači se muselo zapracovat a také on se průběžně učí. Původně vznikl jako překladač textu a mluvená řeč, byť přepsaná do textu, má svá specifika, která se překladač musí průběžně naučit.

Zdaleka to nebude ještě ideální, ale funguje to rychle a pro běžnou konverzaci to bude bezesporu použitelné. Kromě překladů přímo během video/audio konverzace umí Skype Translator překládat pochopitelně i textový chat, kde už je nabídka jazyků rozšířena na 40 včetně češtiny. Ale to už tolik nepřekvapí, protože se jedná o jednoduchou implementaci Bing překladače.

Klepněte pro větší obrázek 
Schéma principu technologie Skype Translatoru

Microsoftu se vývoj technologií na rozpoznávání řeči hodí nejen pro Skype, ale také pro Cortanu a naplnění nápadu univerzálního hlasového ovládání. Všechno už pár let nabízí, ale pořád to není úplně ono, nové modely učení vyvíjené na modelech neuronových sítí by měly napomoci rychlejšímu zdokonalování a větší použitelnosti.

Klepněte pro větší obrázek  Klepněte pro větší obrázek 
Bing překladač si s češtinou rozumí, ale neumí ji vyslovit • překladač Googlu má základní hlasový syntazátor i pro češtinu, není ale zdaleka tak přirozený jako ten anglický

Připomeňme ale znovu i konkurenční Google, který nabízí možnost diktování v každém telefonu s Androidem, umožňuje vyhledávání hlasem, má rovněž svůj hlasový překladač, automatické překládání videí na YouTube a hlasovou asistentku Google Now. Bezesporu i v Googleplexu zraje myšlenka pro nasazení překladače do komunikačního nástroje Hangouts a možná její nasazení do praxe aktuální novinka Microsoftu urychlí.

Na použitelného robotického tlumočníka při komunikaci z českého nebo do českého jazyka si ale budeme muset ještě počkat. Nejprve se musí vypilovat nejpoužívanější jazykové kombinace, které najdou uplatnění u největší skupiny lidí. Ale Google už i češtině dobře rozumí a když se velcí spojí s lokálními, jako je třeba Newton technologies, máme šanci na skutečně kvalitní jazykové nástroje od ovládání až po průběžné překládání. Snad za pár let... ale rozhodně neprohloupíte, když se během čekání naučíte nějakou cizí řeč sami.

Diskuze (29) Další článek: Bitcoin byl letos nejhorší investicí. To ale vůbec nemusí být na škodu

Témata článku: Software, Microsoft, Web, Skype, Translator, Textový chat, Sky, Reálný čas, Hlasový překladač, Skype Translator, Reál, Technologická zkouška, Google Translator, Čas, Revoluce, Newton, Překladače, Mluvená řeč, Výzkumný tým, Syntezátor, Textový přepis, Překlad textu, Výslovnost, Googleplexu, Mluvené slovo


Určitě si přečtěte

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 6

Že by konečně revoluce? Nové chytré hodinky od Garminu mají průhledný solární panel

Že by konečně revoluce? Nové chytré hodinky od Garminu mají průhledný solární panel

** Chytré hodinky mají relativně malou výdrž ** Sportovní fénixy od Garminu jsou na tom ale lépe ** Poslední verze nabízí dokonce transparentní solární panel

Jakub Čížek | 54

Nové iPhony, hodinky a další novinky Applu: Zase bude za co utrácet

Nové iPhony, hodinky a další novinky Applu: Zase bude za co utrácet

Dnes proběhla další velká prezentační akce Applu, na které došlo k odhalení nových iPhonů a dalších novinek. Událost jsme sledovali online, a tak se můžete podívat na chronologický zápis těch nejdůležitějších informací.

David Polesný | 138

Je ta fotka černobílá, nebo barevná? Náš mozek realitu pouze odhaduje a vymýšlí si

Je ta fotka černobílá, nebo barevná? Náš mozek realitu pouze odhaduje a vymýšlí si

** Klasický počítač bezchybně zpracuje bit po bitu dat ** Mozek si realitu naopak spíše představuje a chybuje ** Teď se tím baví internet u další optické iluze

Jakub Čížek | 32



Aktuální číslo časopisu Computer

Megatest 18 grafických karet

Ukliďte data v počítači

Jak dobře koupit starší telefon

Vylepšete zvuk televize: test 7 soundbarů