Svobodný česko-anglický slovník

Projekt, snažící se vytvořit volně použitelný česko-anglický elektronický slovník krytý licencí svobodné dokumentace GNU FDL, se již pomalu stává použitelným. Co ale lidé asi uvítají nejvíce, je úplně zdarma.
Na adrese slovnik.zcu.cz se pod vedením pana Milana Svobody rodí svobodný česko-anglický slovník. V současnosti obsahuje 21 847 záznamů, což jistě není mnoho, když uvážíme, že dobré slovníky jich obsahují několik set tisíc. Na druhou stranu je to jen o něco méně než hloubka běžného kapesního slovníku. Když to vezmeme takto, jistě se již dá pro jednodušší účely využít. Dokonce nyní obsahuje i americkou výslovnost v plném přepisu pro zhruba 100 000 anglických slov.

Když říkám svobodný, myslím tím, že máte právo jej prohlížet, studovat, modifikovat a redistribuovat. Jedním z velkých kladů tak může být, pokud byste databázi chtěli dále nějak využít; třeba ve výukových programech nebo pro nějaké soukromé účely.

Já osobně si myslím, že copyright na slovník či podobné dílo je krásným příkladem toho, jak to nemělo vypadat. Vždyť kdo vlastní právo na záznam ve slovníku? Ten, kdo jej zapsal? Jazykovědci? Stát? Příroda? Jazyk je něco, co je všude kolem, jak se můžeme pokoušet dávat na něj některým lidem právo a některým ne? Otázka se v mnoha ohledech podobá otázce, zda by právo [ve smyslu souhrnu zákonů] mělo být v public domain nebo zda by mělo být copyrightováno.

Právě kvůli těmto nejasnostem a zdánlivé absurditě stávajícího pojetí copyrightu, ale i ze snahy poskytnout lidem zdarma výukovou pomůcku, se svobodné nekomerční slovníky tvoří. Je to cesta, jak vložit tyto cenné databáze do rukou veřejnosti. Copyleft (GFDL je podobně jako GPL copyleftová licence) pak má zajistit, aby i navždy v rukou veřejnosti zůstala.

Jako základ slovníku byla využita databáze anglických slov ze systému aspell (svobodný systém pro kontrolu pravopisu) a ty pak dobrovolníci překládají do češtiny. Pokud se rozhodnete nějakými slovy přispět, vaše pomoc bude jistě autory projektu vítána. Celá kolektivní práce pak probíhá jednak prostřednictvím příležitostného přidávání slov přes webové rozhraní, tak prostřednictvím zasílání patchů v případě větších příspěvků.

„Opravdu nepřipustím, aby kdokoliv vložil do tohoto slovníku i jenom nějakou část slovíček, které byly v komerčním [proprietárním] elektronickém slovníku. Cokoliv se mi nebude jenom trochu zdát (třeba patch obsahující 5000 slovíček jdoucích za sebou od třeba ba- do bb- ), mažu!“ dočteme se na domovské stránce projektu.

Samotný slovník je uložen v lehce editovatelném textovém souboru. Pro zpracování dalšími programy se však využívá v databázi MySQL či jako datový soubor pro systém DICT. Klientské programy k databázi pak existují jak pro GNU/Linux, tak pro MS Windows. Dokonce je možné přistupovat k datům uloženým na serveru a to jak pomocí klientských programů, tak i přes www rozhraní. Co se ale týče této možnosti, zde jsem poměrně skeptický a radím uživatelům, aby raději využili on-line slovníků nabízených českými portály.

Velkým přínosem však může dle mého názoru být projekt pro ty, kteří nejsou stále připojeni k Internetu a i přesto by rádi nějaký ten slovník měli. Jak pro Windows tak pro GNU/Linux sice existují komerční proprietární slovníky, nicméně pokud nemáte moc peněz nebo máte nějaké etické výhrady, možná vám může tento přijít vhod. Samozřejmě, není problém sehnat nějakou nelegálně vyextrahovanou databázi, ale ... (V tomto směru je jakýmsi veřejným tajemstvím, že data jednoho poměrně uznávaného slovníku byla uložena ve formátu „kódovaném“ pouhým přičtením určité hodnoty. Lidé jsou nepoučitelní, nicméně to je již o něčem jiném.)

Podobně jako u svobodné encyklopedie Wikipedia zde vyvstává problém, jak zajistit správnost výkladů. Ze slov pana Svobody ale můžeme lehce vystopovat podobnost se systémem, na kterém fungují WikiWiky weby:

„Jak zajistím správnost překladů? Doufám, že správci dané sekce si budou schopni udržet pořádek. Nevím jak moc dobře to bude fungovat, ale jinou možnost nevidím. Má-li někdo nápady, nechť se mi bez obav svěří :-) Jinak nikdo nemůže očekávat 100% bezchybovost. Vždyť to děláme zadarmo :-) Jestliže chcete 100% bezchybovost kupte si komerční elektronický slovník. Minulý měsíc (v srpnu 2001) byla na serveru root.cz zajímavá recenze na slovník pod [GNU/]Linuxem (samozřejmě komerční [a proprietární]).“

Co jsem měl možnost pozorovat, tento systém kontroly funguje poměrně dobře a na vážnější chyby jsem nenarazil. Otázkou však zůstává, zda nebude větším problémem než chyby obyčejná nepřesnost. Špatný odhad jemných významových nuancí mezi podobnými slovy může být později těžké odhalit.

Druhým zřejmým problémem je, jak vlastně dělat slovník? Jednotlivé databáze jsou copyrightovány, nicméně jsou copyrightovány jako celky, jednotlivou položku již copyrightovat nelze. Důvody jsou zřejmé – pokud by šlo copyrightovat i dvojici slov, nedal by se vytvořit slovník vůbec žádný. Dostáváme se tak do absurdní situace, kde vzít elektronickou databázi a stiskem dvou kláves ji zkopírovat možné není, nicméně sednout si, obklopit se slovníky a „pracovat“ je úplně v pořádku. Velmi názorný příklad, jak copyright prospívá efektivitě práce a veřejnosti. Samozřejmě by měl být slovník tvořen především znalostmi jeho autorů, zde přispěvatelů, a jeho účelem není přepisovat papírový slovník, ale každý potřebuje referenci a jaký materiál můžete u angličtiny použít, když ne opět proprietární slovníky?

Tudíž ačkoliv v žádném případě neschvaluji tvrzení, že ty svobody, o kterých mluvím, ať již se týkají software, databází či dokumentace, mají něco společného s cenou, v tomto případě vztahujícím se ke slovníkům mi opravdu připadá, že ty by měly být vlastnictvím veřejnosti. Proces „vytváření“ slovníků a jejich následného užívání či asymetrie nakládání s elektronickými vs. tištěnými slovníky tomu jednoznačně dává za pravdu. Copyright se zde projevuje jako naprosto umělé omezení.

Právě proto mohou svobodné slovníky být i něčím víc než pouhou praktickou věcí a právě proto tu máme i tento Česko-anglický.

(Autor se podílí na práci na tomto slovníku.)

Diskuze (53) Další článek: Změna pojmenování IEEE1394 na Firewire?

Témata článku: Windows, Linux, Česko, Nuance, Druhá sekce, Krásný měsíc, Slovník, Podobné dílo, Cenná data, Public domain, Následné uložení, Copyleft, Svobodný, Absurdní situace, Anglický slovník, Copyright, Moc peněz


Určitě si přečtěte

Messenger a Instagram přicházejí v Evropě o funkce. Kvůli nové směrnici o soukromí
Vladislav Kluska
EvropaInstagramFacebook Messenger
Jak zjistit majitele vozu podle registrační značky (SPZ)
Ondřej Králík
Tipy
Jak zaznamenat dění na obrazovce: našli jsme 5 nejlepších programů

Jak zaznamenat dění na obrazovce: našli jsme 5 nejlepších programů

** Nahrávat dění lze snadno a kvalitně i zdarma ** Některé programy zvládnou i streaming na videoservery ** U placených se dočkáte nadstandardních funkcí

Vladislav Kluska | 20

Vladislav Kluska
Nejlepší programySoftware
Čestné prohlášení při cestě mimo okres může být i elektronické. Stačí k tomu mobil
Lukáš Václavík
COVID-19eGovernmentDoprava
Jak sestavit rodokmen. Z informací, které jsou na internetu

Jak sestavit rodokmen. Z informací, které jsou na internetu

Podrobný návod, jak hledat ve starých matrikách informace o předcích a nemuset při tom ani vstát od počítače. Základy internetové genealogie.

Marek Lutonský | 59

Marek Lutonský
Rodokmen
Čím nahradit WhatsApp: Vyberte si z 10 alternativních komunikátorů

Čím nahradit WhatsApp: Vyberte si z 10 alternativních komunikátorů

** Z WhatsAppu kvůli novým podmínkám utíkají tisíce uživatelů ** Čím nahradit populární aplikaci pro zasílání zpráv? ** Vybrali jsme pro vás 10 alternativních komunikátorů

Karel Kilián | 113

Karel Kilián
KomunikaceWhatsAppInstant Messaging
CZ.NIC bezplatně naděluje USB/NFC klíče. Jak jej získat?
Lukáš Václavík
CZ.NICeGovernment
Finanční správa tento měsíc spustí Moje Daně. Přiznání má být hračka
Lukáš Václavík
eIdentitaČeskoeGovernment