UTF-8 vládne internetu a definitivně vytlačuje národní znakové sady

Znaková sada Unicode v posledních několika letech obrovskou rcyhlostí nahrazuje zastaralé a národní znakové sady – patrné je to zejména na webu, kde různorodost kódování způsobovala problémy. Důvod je zřejmý, Unicode – nejčastěji reprezentovaný šestnáctibitovým UTF-8 – totiž dokáže pojmout všechny speciální znaky prakticky každé světové abecedy.

S Unicode 5.1 a UTF-8 pracuje i robot Googlebot, který indexuje webové stránky. Ty jsou při zpracovávání přeloženy do UTF a servírované surfařům při prohlížení archivovaných stránek nebo při běžném vyhledávání. Unicode pak používají i všechny Google aplikace.

 unicode0.png  unicode2.png
V roce 2008 se UTF-8 stalo nejpoužívanějším znakovým kódováním
na internetu a dnes už má naprostou převahu a blíží se 50 % (Zdroj: Google Blog)

A jelikož je Google databáze webových stránek v současné době skutečně asi tou největší, Google si může dovolit prezentovat i některé vypovídající grafy. Na tom nejzajímavějším vidíte časovou osu a postupný „zánik“ národních a zastaralých znakových sad na internetu na úkor UTF-8 tak, jak to vidí robot Googlu, Googlebot.

Diskuze (33) Další článek: Gmail má tajemný štítek „buzz“

Témata článku: , , , , , , , , , ,