Jak probíhá česká lokalizace softwaru od Microsoftu

Možná vás někdy napadla otázka, co všechno předchází tomu, než se lokalizovaná verze produktu dostane k uživatelům.

V tomto článku se seznámíme s některými procesy, bez kterých by například operační systém Windows nebyl dostupný v přibližně stovce jazyků, nám dobře známou češtinou a slovenštinou počínaje a třeba jazykem Zulu konče.

Internacionalizace

Internacionalizací se rozumí proces návrhu a vývoje produktů takovým způsobem, že mohou být používány lidmi z různých zemí, kteří mají odlišné zvyklosti, a lze je snadno a efektivně lokalizovat. V praxi to znamená, že takto správně navržený software si musí například poradit se zobrazováním a zadáváním znaků (podpora Unicode napříč celým produktem, dostupnost písem a klávesnic či editoru IME pro asijské jazyky).

Neméně důležité jsou i formáty data a času. Název dne v týdnu je zobrazen na základě lokále, nikoli jazyka operačního systému. Nastavení prvního dne v týdnu je také závislé na daném lokále. Nutností je podpora časových pásem a zimního a letního času. Ohled je třeba brát i na formáty čísel a měn.
Za zmínku stojí i možnost zpřístupnit některé specifické systémové funkce. Česká verze Windows 7 podporuje rozpoznávání českého rukopisu. Při vývoji této funkce bylo potřeba mimo jiné systém vytrénovat na vzorcích rukopisu poskytnutých českými dobrovolníky. Dále bylo třeba vymyslet i vhodné české věty, které se používají při přizpůsobení rozpoznávání.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Rozpoznávání českého rukopisu

Lokalizovatelnost

Dříve, než je možné zahájit samotné překlady textových řetězů, je potřeba zajistit, aby byly splněny požadavky lokalizovatelnosti. Všechny textové řetězce musí být odděleny od vlastního kódu (resource DLL) a lokalizovatelný text identifikován. Anglický text by také měl být snadno přeložitelný.
Pro testování lokalizovatelnosti slouží pseudolokalizace, která umožňuje odhalit potencionální chyby ještě před zahájením lokalizace do konkrétních jazyků – anglické texty jsou nahrazeny speciálními písmeny. Na pseudolokalizovaném sestavení se pak hledají funkční chyby, snadno se i odhalí řetězce, které z nějakého důvodu nebyly nahrazeny.

Klepněte pro větší obrázek
Ukázka jednoho typu pseudolokalizace

Lokalizace

Pod pojmem lokalizace se skrývá daleko víc než jen prosté překlady textových řetězců. Na začátku je potřeba koncepčně přistoupit k terminologii, definovat překlady daných termínů a dbát na jejich konzistentní používání napříč produktem. Stejně důležité je i zachovávat jednotný styl.
Překládá se nejen uživatelské rozhraní, ale i nápověda, která bývá dostupná offline jako součást produktu spolu s online verzí dostupnou na produktovém webu. Pro různé jazyky existuje různý rozsah lokalizace – Extend of localization (EOL).

Lokalizační tým dostane od produktového týmu balíčky textů, které je potřeba přeložit (handoff). Při lokalizaci se používá recyklace, pokud se některé texty od minulé verze nezměnily, jsou automaticky použity ve verzi nové. Překládají se tedy jen nové a změněné řetězce. Dále se opravují nalezené chyby. Přeložené balíčky (handback) zašle tým zpět produktové skupině, která zajistí vytvoření testovacího sestavení. Celý cyklus se opakuje do doby, než jsou přeloženy všechny požadované anglické texty a je dokončeno testování.  

Klepněte pro větší obrázek
Lokalizační proces

Testování lokalizace

Při procesu lokalizace vzniká velké množství různých typů lokalizačních chyb (bugů). Testování je proto z pohledu kvality kriticky důležité. Stále se mohou objevit problémy s lokalizovatelností, například hardcoded řetězce nebo funkční chyby. Daleko častější jsou ale chyby související s překlady. V některých případech, kdy je překlad delší než původní text, může nastat oseknutí (truncation), případně text narušuje rozložení dialogového okna. Problém se může objevit třeba v některých případech, pokud je řetězec o sedmi znacích „Send IM“ přeložen pomocí 22 znaků jako „Odeslat rychlou zprávu“.

Překladatelé rovněž nevědí, kde přesně se aktuálně překládané texty objeví. Tím vznikají problémy s přesností překladu a obecně s kontextem. Například slovo „volume“ může ve směšovači znamenat „hlasitost“, avšak při správě disků je správný překlad „svazek“. Podobná situace může nastat i u překladu slova „image“. Může se jednat o „obrázek“ či „bitovou kopii“. Stejně tak se objevují i chyby, kdy mají texty v jednom dialogovém okně nejednotný styl nebo není užit správný rod – „new“: nový (úkol) x nová (zpráva) x nové (rozložení).

Pozor je třeba dávat i na řetězce, kde se vyskytují proměnné. „Created on %s.“ může být v kontextu „Vytvořeno dne %s.“. Pokud se ale jedná třeba o domácí skupinu, může být správným překladem „Vytvořeno v počítači %s.“.

Při nalezení lokalizační chyby se identifikují konkrétní problematické řetězce, provede se analýza, proč k chybě došlo a zda existují i podobné chyby. Následně se zajistí oprava (podle času nalezení a závažnosti buď v připravované verzi produktu, nebo až ve verzi příští, pokud byla chyba objevena až po uvedení na trh).

Lokalizované verze se mimo jiné testují i pomocí selfhostingu, kdy vybraní zájemci dlouhodobě provozují připravovaný produkt na svých počítačích a snaží se odhalit chyby. Ve společnosti Microsoft také interně probíhají jazykové hry, které jsou postaveny na tom, že hráči procházejí statické screenshoty pořízené v lokalizovaném produktu. Pokud objeví nějaký problém, mají možnost jej v obrázku vyznačit a odeslat o něm informace lokalizačnímu týmu.

Užitečné materiály

  • Detailní informace o této problematice můžete nalézt na webu http://msdn.microsoft.com/en-us/goglobal/ včetně doporučení pro vývojáře, jak vytvářet aplikace připravené pro globální trh. 
  • Pokud naleznete přes veškerou péči věnovanou testování ve finální lokalizované verzi chybu, budeme rádi, když nám pošlete report na czebeta@microsoft.com.

Autor: Jan Šteberl

Články ze série Microsoft TechNet nevytváří redakce Živě.cz, ale partneři programu Microsoft TechNet. Jsou publikovány v rámci mediálního partnerství Živě.cz a společnosti Microsoft.

Diskuze (31) Další článek: HP Mini 100e: ušatý netbook do školních lavic [video]

Témata článku: Software, Microsoft, Unicode, Letní čas, Pořízený obrázek, Svazek, Zulu, Nové rozložení, Handoff, Česká lokalizace, Časový pás, Send, Lokalizace, Správný čas, Anglický text, Různé znaky, Chyba, Textový řetězec, Nová zpráva, Jednotný styl, Rozpoznávání, Připravovaný produkt, Celý cyklus, Domácí péče, Nový úkol


Určitě si přečtěte

Galerie: Navštívili jsme Cosmos Discovery. Uvidíte Sojuz, Mir i kokpit raketoplánu

Galerie: Navštívili jsme Cosmos Discovery. Uvidíte Sojuz, Mir i kokpit raketoplánu

** Brno hostí do konce léta unikátní výstavu Cosmos Discovery ** Uvidíte zde celou historii kosmonautiky ** Stovky originálů i detailních maket

Jakub Čížek, Antonín Trčálek | 4

eObčanka: Jak a proč si zřídit elektronický občanský průkaz s čipem

eObčanka: Jak a proč si zřídit elektronický občanský průkaz s čipem

** Občanka s čipem už je standardně vydávaným osobním dokladem v Česku ** Umožní využívat Portál občana a funkce elektronické státní správy ** Pokud ji chcete naplno využívat, musíte si čip aktivovat

David Polesný | 114

Nejlepší služby pro streamovanou hudbu: Není jen Spotify

Nejlepší služby pro streamovanou hudbu: Není jen Spotify

** Za měsíční předplatné je dnes možné získat přístup k desítkám milionů skladeb ** S některými méně známými interprety je ale stále problém ** Cena předplatného může být i jen pár desítek korun

Vladislav Kluska | 45

Tesla je stále ve ztrátě, ale elektromobily Model 3 se prodávají neuvěřitelně dobře

Tesla je stále ve ztrátě, ale elektromobily Model 3 se prodávají neuvěřitelně dobře

** Tesla má rekordní příjem, je ale ve ztrátě ** Objem výroby se zvyšuje, dochází ale baterie ** Pomoci mají nové továrny Gigafactory

Karel Javůrek | 91


Aktuální číslo časopisu Computer

Jak mobily určují svoji polohu?

Velký test notebooků pro studenty

Nejlepší reproduktory na párty

Služby a aplikace pro výuku angličtiny