Dva lidé hovořící různými jazyky si spolu mohou popovídat bez tlumočníka. Toho nahradí softwarový robot od Microsoftu. Novinka je dostupná v ukázkové verzi Skype Translatoru.
Slovo „revoluční“ se snažíme používat jen výjimečně, často jím bývají různé technologické inovace přeceňovány. Ale to, co teď představil Microsoft, si toto označení zaslouží, byť to znamená teprve první krůček k něčemu, co se revoluční bude zdát až při zpětném pohledu. Jeho komunikační nástroj Skype se totiž naučil překládat konverzaci během vidohovorů.
O univerzálním přístroji, který by dokázal okamžitě překládat konverzace z jiných jazyků, sní lidstvo už velmi dlouho. A nezřídka se takové zařízení objevovalo ve sci-fi literatuře či filmech. Na jeho reálném vývoji pracuje několik výzkumných týmů, nejen dnes zviditelněný Microsoft. Z těch velkých zmiňme například Google, jehož překladač rovněž umí větu v jednom jazyce poslechnout a v jiném říct. Ale Microsoft přišel s tím vysněným univerzálním nástrojem – prostě si mohou povídat dva lidé, kteří mluví jinak.
Tlumočník ze serverů Microsoftu
Samozřejmě, má to ještě mnoho much a program je teprve ve fázi „preview“. Zatím umí překládat pouze mezi angličtinou a španělštinou a pro jeho vyzkoušení se musíte registrovat. Microsoft však na této technologii pracuje už patnáct let a je to poprvé, kdy ze své kuchyně vypustil ukázkové dílo k testování veřejnosti.
Vy si povídáte, Skype překládá. Pro jistotu přitom vidíte i textový přepis konverzace, abyste mohli opravit, když by vám Skype špatně porozuměl
Translator tedy zatím nehledejte přímo v aplikaci Skypu, ten získáte až po registraci, kdy si můžete stáhnout samostatnou aplikaci Skype Translator. Ta vypadá jako Skype, jen má navíc překladací funkce. A je jasné, že tak bude v budoucnu vypadat i běžný Skype.
Podle ukázkových videí to funguje docela dobře. V rozhovoru jsou pochopitelně prodlevy, protože program překládá po jednotlivých konverzačních blocích, jak by to dělal živý tlumočník. V rámci zkoušky v praxi zkusil Microsoft nasadit Skype Translator mezi dvě školy – jednu v Mexiku, kde se mluví španělsky, a druhou v USA. Děti si měly povídat skrze videohovor, který překládat Skype Translator. A podle všeho si děti rozuměly a dobře se bavily:
Jak to funguje na pozadí? Zvuková stopa dorazí na servery Microsoftu, kde proběhne její zpracování. Základem je rozpoznání obsahu, tedy jednotlivých slov, sousloví a vět. Na to má Microsoft vyvinutou technologii, která toho umí hodně už v základu, ale její kouzlo spočívá především ve schopnosti se učit. Každý rozhovor tak poslouží jako nová zásoba vzorků různých výslovností, dialektů, přízvuků a podobně. Jako „studijní“ materiály slouží nejen rozhovory na Skypu, ale i záznamy přednášek a různorodý audio a videoobsah, kterým Microsoft svého robota krmí, aby se učil.
Hlavně porozumět
Protože ale lidé nemluví strojovým jazykem a v mluvené řeči dělají chyby, přeřeky, smích, pauzy nebo „eee“, když jim hned nenaskočilo požadované slůvko, učí se robot i tomu, co slova nejsou. Konverzační celek pak analyzuje, aby pochopil jeho kontext a nabídl podle toho adekvátní překlad. Ve správném porozumění je základ úspěchu následného překladu.
Jak to funguje:
Pak už by se dalo zjednodušeně říct, že se vyseparovaný vzorek konverzace prožene Bing překladačem a hlasový syntezátor přečte výsledek. Tak to je, nicméně i na samotném překladači se muselo zapracovat a také on se průběžně učí. Původně vznikl jako překladač textu a mluvená řeč, byť přepsaná do textu, má svá specifika, která se překladač musí průběžně naučit.
Zdaleka to nebude ještě ideální, ale funguje to rychle a pro běžnou konverzaci to bude bezesporu použitelné. Kromě překladů přímo během video/audio konverzace umí Skype Translator překládat pochopitelně i textový chat, kde už je nabídka jazyků rozšířena na 40 včetně češtiny. Ale to už tolik nepřekvapí, protože se jedná o jednoduchou implementaci Bing překladače.
Schéma principu technologie Skype Translatoru
Microsoftu se vývoj technologií na rozpoznávání řeči hodí nejen pro Skype, ale také pro Cortanu a naplnění nápadu univerzálního hlasového ovládání. Všechno už pár let nabízí, ale pořád to není úplně ono, nové modely učení vyvíjené na modelech neuronových sítí by měly napomoci rychlejšímu zdokonalování a větší použitelnosti.
Bing překladač si s češtinou rozumí, ale neumí ji vyslovit • překladač Googlu má základní hlasový syntazátor i pro češtinu, není ale zdaleka tak přirozený jako ten anglický
Připomeňme ale znovu i konkurenční Google, který nabízí možnost diktování v každém telefonu s Androidem, umožňuje vyhledávání hlasem, má rovněž svůj hlasový překladač, automatické překládání videí na YouTube a hlasovou asistentku Google Now. Bezesporu i v Googleplexu zraje myšlenka pro nasazení překladače do komunikačního nástroje Hangouts a možná její nasazení do praxe aktuální novinka Microsoftu urychlí.
Na použitelného robotického tlumočníka při komunikaci z českého nebo do českého jazyka si ale budeme muset ještě počkat. Nejprve se musí vypilovat nejpoužívanější jazykové kombinace, které najdou uplatnění u největší skupiny lidí. Ale Google už i češtině dobře rozumí a když se velcí spojí s lokálními, jako je třeba Newton technologies, máme šanci na skutečně kvalitní jazykové nástroje od ovládání až po průběžné překládání. Snad za pár let... ale rozhodně neprohloupíte, když se během čekání naučíte nějakou cizí řeč sami.