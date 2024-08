Samsung zveřejnil zajímavý post, ve kterém vysvětluje, co to obnáší, aby se jeho Galaxy AI naučila nový jazyk. Proč je to důležité? Protože AI hluboce integrovaná do mobilního operačního systému se snáze dostane k uživatelům. Na počítači si musíte uvědomit potřebu, najít správnou AI, která potřebu vyřeší, pak se ji učíte používat, případně musíte zaplatit. Ve smartphonu ji dostanete, nabízí svoji pomoc „na každém druhém kroku“ a zpravidla je zdarma (minimálně u Galaxy AI to tak zatím je, u Apple Intelligence také).

Mysleli jste si, že právě AI tenhle proces usnadní, ba až automatizuje? Pokud by byla řeč o přeložení uživatelského prostředí (tedy systému sice rozsáhlého, ale konečného a s danou podobou), tak to může v kombinaci s lidskou kontrolou platit. Problém s AI systémem je v jeho komplexitě a variabilitě – není to konečná sada frází, které přeložíte a máte hotovo.



Co všechno vstupuje do systému, který nakonec zajistí, že si s mobilem popovídáte jako s člověkem.

Galaxy AI umí 16 jazyků, do konce roku jsou slíbené další 4 a jestli čekáte na zmínku o češtině, tak to pojďme odbýt hned. Konkrétně češtinou se zpráva nezabývá, ale odpověď je mezi řádky naprosto zřetelná a není nijak objevná. Čeština je příliš malý jazyk, přitom výzvy pro vývojáře jsou srovnatelné s velkými jazyky. Česko má příliš nízkou prioritu a v plánech Samsungu zatím nefiguruje.

Ostatně nám to už v dubnu potvrdilo i české zastoupení firmy: „V současné době nemáme informace, týkající se konkrétně rozšíření jazykové podpory Galaxy AI o český a slovenský jazyk.“

Proč je lokalizace AI takový problém

Protože každý jazyk má svou unikátní strukturu, variace a kulturu, se kterou je neoddělitelně spojený. Samsung má na řešení těchto úkolů osm vývojových center v Brazílii, Číně, Indii, Indonésii, Japonsku, Jordánsku, Polsku a ve Vietnamu.

Tak například vietnamština. Má šest různých tónování a automatické systémy měly problém převést mluvené slovo na text. Nakonec pomohlo až snížení „rozlišení“ zvuku až na segmenty o délce 20 milisekund, což však v praxi znamená navýšení výpočetního výkonu.

Polské vývojové centrum řešilo značnou variabilitu evropských jazyků a ustálené fráze, jejichž překlad slovo po slově nevede k uspokojivému výsledku a v jiných jazycích nemá odpovídající ekvivalent. Nezbývalo než jít od fráze k frázi a vysvětlovat její skutečný význam.

Arabština má 30 základních dialektů a řada z nich není přesně kodifikovaná. Řešením jsou algoritmy, které predikují v psaném textu chybějící diakritiku, takže nakonec s dostatečnou přesností rozumí i nejkomplikovanějším dialektům. Systém pak odpovídá ve standardní arabštině.

Pak jsou tu velké jazyky: hindština, čínské mandarínština a kantonština, nebo španělština. Mluví jimi stovky miliónů lidí v mnoha regionech se svými specifickými nářečími a modifikacemi. Tady se jako klíčová ukazují data, na kterých se AI může učit. Naštěstí nejde o nový obor, takže Samsung využil existujících databází – například v Číně pomohly hegemoni tamního IT trhu Baidu a Meitu.

V Indonésii pokročilé jazykové modely chyběly, a tak museli vývojáři začít od úplných základů – vyrazili s diktafony do kaváren a kanceláří, aby nahráli rozhovory běžných lidí. Indonéština hodně pracuje s kontextem, konkrétní situací a stejná věta v jiné situaci a v jiném rozhovoru může znamenat něco úplně jiného.

Japonština má omezený počet vokálů a následkem toho je vysoký počet homonym – slov, která mají stejnou podobu, ale odlišný význam. Asi si dovedete představit, že něco takového je pro digitální systémy noční můra. Řešení je nakonec stejné jako u lidí – záleží na kontextu. Lidé se to učí roky, Ai to musí zvládnout rychleji.

A to jsme teprve u porozumění problému. Až pak následuje jeho řešení. Ale to už je jiný příběh nad rámec tohoto článku…