Překladač Google podporuje skoro 250 jazyků. Polovinu z nich umí díky AI, která se učila „bez slovníku“ | Zdroj: Google

Zdroj: Google

Překladač Google podporuje skoro 250 jazyků. Polovinu z nich umí díky AI, která se učila „bez slovníku“

Google minulý týden oznámil, že doplní svůj překladač o 110 nových jazyků, celkově jich tak bude podporovat 243. V dohledné době by se však chtěl dostat na tisícovku. Má k tomu totiž mnohem lepší pomůcky než v minulosti.

První stovku jazyků včetně češtiny se totiž učil ještě konvenčními metodami na datových sadách, kdy měl k dispozici totožné texty v různých jazycích. Často šlo o úřední dokumenty, náboženské texty apod. Pro menší jazyky nebo dialekty ale párové texty nemá, nebo jich není tolik, aby se na nich neuronové sítě mohly učit.

V roce 2022 proto firma přišla s metodou Zero-Shot Machine Translation (ZSMT), která se učí jen na jednojazyčných textech a párech překladů z jiných jazyků. AI, konkrétně velký jazykový model PaLM 2, se tak postupně trénuje na 1138 jazycích s monoligvistickými texty a 112 jazycích, kde již zdrojová data přeložená jsou. AI v současnosti pracuje s více než miliardou vět.

image.png

ZSMT se chová trochu jako člověk, je jen mnohem rychlejší. Pokud sami znáte několik jazyků, tak chápete zákonitosti překládání. Když pak narazíte na úplně nových jazyk, můžete tyto poznatky aplikovat na něj a na cizích textech rozpoznáte větné členy a slovní druhy. A kdybyste dokonale znali sto jazyků, tak se snadněji naučíte chápat i významy slov, případně rozpoznáte jejich ohýbání (skloňování, časování).

Google přiznává, že nejde o dokonalou metodu, žádnou lepší ale nemá. Navíc neustále pracuje na jejím vývoji. V Překladači má již 134 jazyků, které vytrénoval pomocí ZSMT. Mluví jimi přes 600 milionů lidí. Nejvýznamnějším nedávným přídavkem je kantonština, která se používá v částech Číny. Přidal ale také několik dalších exotických jazyků z Asie, Afriky nebo dokonce i Evropy. Neříkejte, že jste už někdy slyšeli o manštině, keltském jazyku, který zná asi 2000 obyvatel britského ostrova Man.

Určitě si přečtěte

Články odjinud