Microsoft oznámil aktualizaci své služby Translator, která dokáže překládat mezi zhruba stovkou jazyků v call centrech, chatbotech a aplikacích třetích stran. Nová efektivnější třída modelů umělé inteligence, které dokážou překládat přímo mezi konkrétními jazyky, přináší podle interní studie až o 15 % lepší překlady ve srovnání s předchozími modely.

V sérii testů posuzovali kvalitu překladů mezi starými a novými modely Translatoru lidé. Data ukázala, že verze s použitím Z-code byla v průměru o 4 % lepší. Například překlady z angličtiny do francouzštiny se zlepšily o 3,2 %, z angličtiny do turečtiny o 5,8 %, z japonštiny do angličtiny o 7,6 %, z angličtiny do arabštiny o 9,3 % a z angličtiny do slovinštiny dokonce o 15 %.

Modernizace Microsoft Translatoru

Tyto modely také pohánějí novou funkci v aplikaci Translator – vícejazyčný překlad dokumentů – která dokáže překládat dokumenty obsahující text napsaný v několika různých jazycích. Modernizace překladače je součástí širší iniciativy XYZ-code, jejímž cílem je kombinovat modely umělé inteligence pro text, vidění, zvuk a jazyk a vytvářet tak software, který umí mluvit, vidět, slyšet a (doufejme i) rozumět.

Tým za Microsoft Translatorem tvoří skupina vědců a inženýrů z Azure AI a vědecké skupiny Project Turing, kteří se zaměřují na vytváření rozsáhlých vícejazyčných modelů, jež pohánějí různé produkty Microsoftu. Translator dříve vyžadoval pro překlad mezi deseti jazyky 20 modelů. Stejnou úlohu lze nyní provádět s jediným systémem Z-code, který běží v cloudu.

Microsoft vysvětluje, že pomocí technologie umělé inteligence aplikuje znalosti z jednoho problému na jiný, podobný problém. Překračuje tak hranice běžných jazyků, jako je angličtina, a zlepšuje překlady pro přibližně 1 500 „méně zastoupených“ jazyků.

Stejně jako všechny ostatní modely se i ten od Microsoftu učí na základě příkladů z rozsáhlých souborů dat pocházejících ze směsi veřejných a soukromých archivů – například z elektronických knih, webových stránek, jako je Wikipedie, a ručně přeložených dokumentů.

Schopnost sdílet znalosti napříč jazyky

Jako „méně zastoupené“ jsou obecně definovány jazyky s méně než jedním milionem vzorových vět, což zvyšuje náročnost vývoje modelů. Modely umělé inteligence totiž obvykle dosahují lepších výsledků, pokud mají k dispozici více příkladů.

Vzhledem k tomu, že mnoho jazyků má společné lingvistické prvky, vyvíjí Microsoft vícejazyčné modely v různých jazycích a tyto znalosti se mezi jazyky přenášejí. Například překladatelské dovednosti modelu mohou být využity ke zlepšení jeho schopnosti porozumět přirozenému (tj. běžně používanému) jazyku.

V říjnu loňského roku Microsoft vylepšil svůj překladač a přidal podporu dvanácti nových jazyků včetně gruzínštiny, tibetštiny a ujgurštiny. Nyní firma uvádí, že vylepšená verze, která byla spuštěna tento týden, dokáže lépe porozumět nuancím jazyků „s omezenými zdroji“.

„Schopnost sdílet znalosti napříč různými jazyky umožňuje vytvářet přesnější výsledky pro nedostatečně zastoupené jazyky, které nemají k dispozici obrovské množství příkladů překladů, z nichž by se mohly učit. To pomůže zlepšit vyváženost umělé inteligence a zajistit, aby se kvalitní překlady neomezovaly pouze na jazyky s bohatými zdroji,“ vysvětlil technologický ředitel divize Azure AI Xuedong Huang.