Google | Překladač | Umělá inteligence

Neuronová síť Googlu si vytvořila vlastní jazyk, kterým si pomáhá v překladech

Neuronová síť Googlu si vytvořila vlastní jazyk, kterým si pomáhá v překladech

Loni zkraje podzimu vypustil Google do svého jazykového překladače strojové učení a doufal, že postupem času zlepší a nahradí stávající statistický model, který jednotlivé věty překládá jednoduše řečeno tak, že na základě analýz hromady jazykových párů (třeba bilingvální úřední texty EU – stejný text v hromadě jazyků) spočítá, že výrazu A v jednom jazyce odpovídá nejpravděpodobněji výraz B v druhém jazyce. Statistický překladač tedy vůbec nemusí rozumět tomu, co vlastně překládá. Pouze hledá podobné páry.

Strojové učení mělo přinést opravdu hloubkové učení, kdy se stroj podobně jako člověk naučí, co k čemu patří. A překlady by tak pak měly dávat mnohem větší smysl.

Inženýři z Googlu šli nicméně ještě dál a začali experimentovat s tzv. překlady zero-shot. Neuronová síť se nejprve naučila několik jazykových párů, které spolu nepřímo souvisely. Na blogu Googlu se píše o párech:

  • japonština – angličtina
  • angličtina – japonština
  • korejština – angličtina
  • angličtina – korejština

Tak a teď to podstatné. Co kdyby neuronová síť na základě znalosti těchto překladových párů dostala příkaz, ať něco přeloží z japonštiny do korejštiny?

Přímo tento jazykový pár nezná, ale nepřímo ano skrze prostředníka – angličtinu. A zadařilo se, překlad podle Googlu skutečně dával smysl, To nakonec inženýry vedlo k další otázce. Jak je vlastně samotná znalost v neuronové síti uložená? A nevytváří si neuronová síť při učení vlastně jakýsi vlastní univerzální jazyk, díky kterému by mohla přeložit jakýkoliv jazykový pár, pokud o něm alespoň nepřímo něco ví?

Odpověď je ano. Není to ale samozřejmě jazyk v lidském slova smyslu – složený z písmen a číslic. Je to opět velmi složitá znalostní struktura, kterou můžeme vyjádřit třeba pomocí geometrie. Inženýři Googlu tedy v 3D grafu zobrazili strojovou znalost – naučený model – jako strukturu teček, kde každému shluku odpovídá věta. Poté zjistili, že stroj do takových shluků zařazuje ze všech známých jazyků.

Klepněte pro větší obrázek
Neuronová síť překladače Googlu organizuje věty se stejným významem v různých jazycích do podobných geometrických struktur. Díky tomu dokáže experimentálně překládat i mezi jazykovými páry, které doposud neznala. Suma sumárum, v podstatě si vytvořila jakýsi, touto geometrií vyjádřený, sémantický jazyk.

Jednoduše řečeno, stroj během učení zmíněných párů výše objevil i vztah mezi japonštinou a korejštinou, který se přímo neučil. Ony shluky teček jsou tedy v jeho podání vlastně ona interlingua – mezijazyk, díky kterému může překládat i jazykové páry, které nezná.

Je to vlastně to samé, jako byste se naučili překládat z češtiny do angličtiny (a naopak), z češtiny do němčiny (a naopak), načež byste díky této znalosti pochopili i vztah mezi němčinou a angličtinou.

Diskuze (7) Další článek: Samsung nabídne 24palcové počítače v monitoru s výkonnými soundbary, které lze použít i ve vypnutém stavu

Témata článku: Technologie, Google, Věda, Web, Překladač, Umělá inteligence, Strojové učení, Neuronová síť, Překladače celých vět, Angličtina, Statistický překladač, Stejný význam, Překlad, Stejný text, Jazyk, Věta, Japonština, VLA, Překladače, Shluk, Korejština, Naučený model, Univerzální jazyk, Statistický model


Určitě si přečtěte

Pojďme programovat elektroniku: Postavíme bezpečnostní systém za 30 Kč

Pojďme programovat elektroniku: Postavíme bezpečnostní systém za 30 Kč

** Před pár týdny jste si mohli v akci koupit Wi-Fi desku za jeden dolar ** Nám už TTGO T-Display dorazila do redakce ** Připojíme k ní jazýčkový kontakt a vyrobíme bezpečnostní systém

Jakub Čížek | 30

Že by konečně revoluce? Nové chytré hodinky od Garminu mají průhledný solární panel

Že by konečně revoluce? Nové chytré hodinky od Garminu mají průhledný solární panel

** Chytré hodinky mají relativně malou výdrž ** Sportovní fénixy od Garminu jsou na tom ale lépe ** Poslední verze nabízí dokonce transparentní solární panel

Jakub Čížek | 54

Zorin OS 15: Vyzkoušejte další hezký a nenáročný linux pro mamku a taťku

Zorin OS 15: Vyzkoušejte další hezký a nenáročný linux pro mamku a taťku

** Ačkoliv je grafických linuxů plný internet, stále vládnou Windows ** Jeden z nich se jmenuje Zorin OS a nedávno se dočkal aktualizace ** Dělají jej dva kluci z Irska a je fakt hezký

Jakub Čížek | 114

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 6

Bývalý zaměstnanec Nokie vysvětluje, proč telefony s Windows Phone neuspěly

Bývalý zaměstnanec Nokie vysvětluje, proč telefony s Windows Phone neuspěly

** Za neúspěchem Microsoftu v mobilech stojí i Windows 8 ** Microsoft pozdě naskočil do rozjetého vlaku ** Uživatelé neměli zásadní důvody, proč přejít

Karel Kilián | 133



Aktuální číslo časopisu Computer

Speciál o přechodu na DVB-T2

Velký test herních myší

Super fotky i z levného mobilu

Jak snadno upravit PDF