Překladač | Strojové učení | Překladače celých vět

Další postrach lidských překladatelů. Český CUBBITT má být přesnější než člověk

  • Na MFF UK vyvíjejí překladač postavený na neuronových sítích
  • Podle slepého testu je lepší než Google Translator
  • Překlad má být dokonce přesnější než od lidí

Německý překladač DeepL nám na jaře vyrazil dech. Využít strojové učení pro překlad mezi dvěma jazyky se už ale roky snaží také čeští matfyzáci. Jejich nástroj LINDAT Translation postavený na modelu CUBBITT (Charles University Block-Backtranslation-Improved Transformer Translation) si můžete pro nekomerční účely vyzkoušet zdarma a bez omezení.

Umí překládat vložený text i nahrané textové soubory. Oproti konkurenci ale zatím podporuje jen tři páry jazyků: angličtina/čeština, angličtina/francouzština a angličtina/polština, vždy v obou směrech. LINDAT Translation sice umí překládat mezi angličtinou a ruštinou, němčinou nebo hindštinou, avšak ty využívají jiný matematický model.

CUBBITT se trénoval na desítkách milionů vět. Nejen těch, pro které existují oficiální překlady mezi češtinou a angličtinou, ale i jednojazyčných. Česká věta se přeloží do angličtiny a cílem je pak znovu vytvořit původní český překlad (odtud backtranslation v názvu modelu). Autoři tvrdí, že je optimalizován pro překlad novinových článků, nikoliv beletrii, odbornou literaturu apod.

2021-08-16_16h34_50.png
LINDAT Translation umí překládat vložený text i soubory

Tvůrci CUBBITTu loni v časopisu Nature publikovali text detailně vysvětlující technologie na pozadí. Součástí byl také průzkum z roku 2018 hodnotící kvalitu překladu. Ve slepém Turingově testu nedokázalo 60 % dotázaných rozlišit strojový a profesionální překlad. Google Translator svou kvalitou „zmátl“ jen 6 % respondentů. Výsledkem studie také bylo, že CUBBITT umí překládat přesněji než lidé (ve smyslu zachování významu), ale lidští překladatelé měli text čitelnější, uhlazenější.

Protože jsme už detailně srovnávali kvality DeepL, Googlu a překladače od Microsoftu, ukážeme si na stejných příkladech také CUBBITT.

V dalších kapitolách najdete příklady různých typů textů…

Diskuze (77) Další článek: Český hlasový robot Alquist porazil americké univerzity a zvítězil v Amazon Alexa Prize

Témata článku: , , , , , , , , , , , , , , , , , , ,