Unix/Linux je takový zprněnec. Nerozlišuje mezi bajty a znaky. Tudíž název souboru je sekvence bajtů, nikoli znaků. Proto je unix/Linux case insensitive, protože zkrátka pracuje s bajtíky, ne se znaky. To platí i pro názvy souborů a vše v souborovém systému.Když přišel unicode, začal mít unix/Linux příšerný, ale příšerný problém. UTF-8 kódování není standard unicode (tím se stal až později), ale v zásadě nalepovák od tvůrců unixu, jak namapovat unicode znaky na sekvence bajtů. Mám dokonce dojem, že se UTF-8 poprvé použil v operačním systému Plan9, ale nejsem si jist.Ve výsledku jsou dnešní unix a unixové operační systémy (včetně Linuxu) nalepovák, kdy vlastně není rozlišeno mezi sekvencí bajtů a UTF-8. Dostanete jiné názvy souborů, když připojíte disk jako 8bitové znaky, a úplně jiné názvy souborů, když ho připojíte jako UTF-8.Stejná nedomyšlenost je v celém POSIXu, to se stalo (nejen díky tomu) tak strašným nalepovákem, až to hezké není.Další kódování sledovalo něco jiného. UTF-16 je nalepovák pro ty softwarové firmy, kteří blbě implentovali unicode jako dvoubajtové sekvence. Je to především programovací jazyk Java a Microsoft. UTF-16 je nejblbější kódování unicode, a pokud ho nepotřebujete, nemá ho smysl používat.UTF-8 zase tak úsporné není, zvláště pokud většina znaků není anglických. UTF-8 dokáže být sakra neúsporné. Je velice velice reduntantní, a sleduje úplně jiné cíle. Výhdou UTF-8 je, že pracuje s bajtovými sekvencemi, není tedy (jako u UCS-2, UCS-4, UTF-16, UTF-32) závislé na endianu (pořadí bajtů ve slově).