reklama

Neuronová síť Googlu si vytvořila vlastní jazyk, kterým si pomáhá v překladech

Loni zkraje podzimu vypustil Google do svého jazykového překladače strojové učení a doufal, že postupem času zlepší a nahradí stávající statistický model, který jednotlivé věty překládá jednoduše řečeno tak, že na základě analýz hromady jazykových párů (třeba bilingvální úřední texty EU – stejný text v hromadě jazyků) spočítá, že výrazu A v jednom jazyce odpovídá nejpravděpodobněji výraz B v druhém jazyce. Statistický překladač tedy vůbec nemusí rozumět tomu, co vlastně překládá. Pouze hledá podobné páry.

Strojové učení mělo přinést opravdu hloubkové učení, kdy se stroj podobně jako člověk naučí, co k čemu patří. A překlady by tak pak měly dávat mnohem větší smysl.

Inženýři z Googlu šli nicméně ještě dál a začali experimentovat s tzv. překlady zero-shot. Neuronová síť se nejprve naučila několik jazykových párů, které spolu nepřímo souvisely. Na blogu Googlu se píše o párech:

  • japonština – angličtina
  • angličtina – japonština
  • korejština – angličtina
  • angličtina – korejština

Tak a teď to podstatné. Co kdyby neuronová síť na základě znalosti těchto překladových párů dostala příkaz, ať něco přeloží z japonštiny do korejštiny?

Přímo tento jazykový pár nezná, ale nepřímo ano skrze prostředníka – angličtinu. A zadařilo se, překlad podle Googlu skutečně dával smysl, To nakonec inženýry vedlo k další otázce. Jak je vlastně samotná znalost v neuronové síti uložená? A nevytváří si neuronová síť při učení vlastně jakýsi vlastní univerzální jazyk, díky kterému by mohla přeložit jakýkoliv jazykový pár, pokud o něm alespoň nepřímo něco ví?

Odpověď je ano. Není to ale samozřejmě jazyk v lidském slova smyslu – složený z písmen a číslic. Je to opět velmi složitá znalostní struktura, kterou můžeme vyjádřit třeba pomocí geometrie. Inženýři Googlu tedy v 3D grafu zobrazili strojovou znalost – naučený model – jako strukturu teček, kde každému shluku odpovídá věta. Poté zjistili, že stroj do takových shluků zařazuje ze všech známých jazyků.

Klepněte pro větší obrázek
Neuronová síť překladače Googlu organizuje věty se stejným významem v různých jazycích do podobných geometrických struktur. Díky tomu dokáže experimentálně překládat i mezi jazykovými páry, které doposud neznala. Suma sumárum, v podstatě si vytvořila jakýsi, touto geometrií vyjádřený, sémantický jazyk.

Jednoduše řečeno, stroj během učení zmíněných párů výše objevil i vztah mezi japonštinou a korejštinou, který se přímo neučil. Ony shluky teček jsou tedy v jeho podání vlastně ona interlingua – mezijazyk, díky kterému může překládat i jazykové páry, které nezná.

Je to vlastně to samé, jako byste se naučili překládat z češtiny do angličtiny (a naopak), z češtiny do němčiny (a naopak), načež byste díky této znalosti pochopili i vztah mezi němčinou a angličtinou.

Témata článku: Technologie, Google, Web, Umělá inteligence, Překladač, Neuronová síť, Strojové učení, Věda

8 komentářů

Nejnovější komentáře

  • Jozef Kostelanský 11. 1. 2017 21:35:50
    Je otázkou času, kedy na tomto princípe sa bude dať okamžite preložiť...
  • PlandalSulen 11. 1. 2017 17:45:13
    kokal jsem ze z CJ do ANGL jde Googlem celkem rozumne prekladat, ale do...
  • drobecka 11. 1. 2017 13:44:29
    Vravel som si že dejavu a ono naozaj...
reklama
Určitě si přečtěte

Vyzkoušeli jsme FM štěnici: Když si vtipálci hrají na pirátské rozhlasové vysílání

Vyzkoušeli jsme FM štěnici: Když si vtipálci hrají na pirátské rozhlasové vysílání

** Dnes žádnou elektroniku programovat nebudeme ** Štěnice totiž funguje sama o sobě ** Stačí připojit baterii a naladit frekvenci

22.  1.  2017 | Jakub Čížek | 31

Microsoft: Zbavte se už konečně zastaralých a děravých Windows 7

Microsoft: Zbavte se už konečně zastaralých a děravých Windows 7

** Microsoft pomalu začíná kritizovat svůj nejpopulárnější OS ** Chce konečně dostat podniky na Desítky ** Bezpečnostní podpora Sedmiček vydrží ještě necelé tři roky

17.  1.  2017 | Jakub Čížek | 409

Takto si špičkoví grafici představují nový Facebook. S čistým vzhledem a bez reklam

Takto si špičkoví grafici představují nový Facebook. S čistým vzhledem a bez reklam

** Design Facebooku se delší dobu nemění a pro mnohé je nudným ** Grafici zkouší navrhovat nové koncepty toho, jak by mohla síť vypadat ** Hlasujte pro nejzdařilejší návrh

22.  1.  2017 | Stanislav Janů | 64

Umělá inteligence dokáže ze snímků srdce předpovědět, kdy zemřete

Umělá inteligence dokáže ze snímků srdce předpovědět, kdy zemřete

** Strojové učení lze skvěle použít pro vylepšení modelů pro předpověď srdečních komplikací ** Nová technologie umožňuje přesněji určit rizikové pacienty ** Dřívější diagnostika může díky včasně léčbě do budoucna zachránit životy

21.  1.  2017 | Karel Javůrek | 7

8 produktů, o kterých byste neřekli, že nesou značku Apple

8 produktů, o kterých byste neřekli, že nesou značku Apple

** Věděli jste, že Apple vyvinul celkem 45 modelů tiskáren? ** ** Monitor na výšku, plotter nebo herní konzole - to vše měl Apple ve své nabídce ** Většinu z těchto produktů pohřbil Steve Jobs

19.  1.  2017 | Stanislav Janů | 43


Aktuální číslo časopisu Computer

99 nejlepších programů pro váš počítač

Zvykejte si na umělou inteligenci

Velké testy PC zdrojů a gamepadů

Alternativní zdroje energie

reklama
reklama