Projekt, snažící se vytvořit volně použitelný česko-anglický elektronický slovník krytý licencí svobodné dokumentace GNU FDL, se již pomalu stává použitelným. Co ale lidé asi uvítají nejvíce, je úplně zdarma.
Na adrese
slovnik.zcu.cz se pod vedením pana Milana Svobody rodí svobodný česko-anglický slovník. V současnosti obsahuje 21 847 záznamů, což jistě není mnoho, když uvážíme, že dobré slovníky jich obsahují několik set tisíc. Na druhou stranu je to jen o něco méně než hloubka běžného kapesního slovníku. Když to vezmeme takto, jistě se již dá pro jednodušší účely využít. Dokonce nyní obsahuje i americkou výslovnost v plném přepisu pro zhruba 100 000 anglických slov.
Když říkám svobodný, myslím tím, že máte právo jej prohlížet, studovat, modifikovat a redistribuovat. Jedním z velkých kladů tak může být, pokud byste databázi chtěli dále nějak využít; třeba ve výukových programech nebo pro nějaké soukromé účely.
Já osobně si myslím, že copyright na slovník či podobné dílo je krásným příkladem toho, jak to nemělo vypadat. Vždyť kdo vlastní právo na záznam ve slovníku? Ten, kdo jej zapsal? Jazykovědci? Stát? Příroda? Jazyk je něco, co je všude kolem, jak se můžeme pokoušet dávat na něj některým lidem právo a některým ne? Otázka se v mnoha ohledech podobá otázce, zda by právo [ve smyslu souhrnu zákonů] mělo být v public domain nebo zda by mělo být copyrightováno.
Právě kvůli těmto nejasnostem a zdánlivé absurditě stávajícího pojetí copyrightu, ale i ze snahy poskytnout lidem zdarma výukovou pomůcku, se svobodné nekomerční slovníky tvoří. Je to cesta, jak vložit tyto cenné databáze do rukou veřejnosti. Copyleft (GFDL je podobně jako GPL copyleftová licence) pak má zajistit, aby i navždy v rukou veřejnosti zůstala.
Jako základ slovníku byla využita databáze anglických slov ze systému aspell (svobodný systém pro kontrolu pravopisu) a ty pak dobrovolníci překládají do češtiny. Pokud se rozhodnete nějakými slovy přispět, vaše pomoc bude jistě autory projektu vítána. Celá kolektivní práce pak probíhá jednak prostřednictvím příležitostného přidávání slov přes webové rozhraní, tak prostřednictvím zasílání patchů v případě větších příspěvků.
„Opravdu nepřipustím, aby kdokoliv vložil do tohoto slovníku i jenom nějakou část slovíček, které byly v komerčním [proprietárním] elektronickém slovníku. Cokoliv se mi nebude jenom trochu zdát (třeba patch obsahující 5000 slovíček jdoucích za sebou od třeba ba- do bb- ), mažu!“ dočteme se na domovské stránce projektu.
Samotný slovník je uložen v lehce editovatelném textovém souboru. Pro zpracování dalšími programy se však využívá v databázi MySQL či jako datový soubor pro systém DICT. Klientské programy k databázi pak existují jak pro GNU/Linux, tak pro MS Windows. Dokonce je možné přistupovat k datům uloženým na serveru a to jak pomocí klientských programů, tak i přes www rozhraní. Co se ale týče této možnosti, zde jsem poměrně skeptický a radím uživatelům, aby raději využili on-line slovníků nabízených českými portály.
Velkým přínosem však může dle mého názoru být projekt pro ty, kteří nejsou stále připojeni k Internetu a i přesto by rádi nějaký ten slovník měli. Jak pro Windows tak pro GNU/Linux sice existují komerční proprietární slovníky, nicméně pokud nemáte moc peněz nebo máte nějaké etické výhrady, možná vám může tento přijít vhod. Samozřejmě, není problém sehnat nějakou nelegálně vyextrahovanou databázi, ale ... (V tomto směru je jakýmsi veřejným tajemstvím, že data jednoho poměrně uznávaného slovníku byla uložena ve formátu „kódovaném“ pouhým přičtením určité hodnoty. Lidé jsou nepoučitelní, nicméně to je již o něčem jiném.)
Podobně jako u svobodné encyklopedie Wikipedia zde vyvstává problém, jak zajistit správnost výkladů. Ze slov pana Svobody ale můžeme lehce vystopovat podobnost se systémem, na kterém fungují WikiWiky weby:
„Jak zajistím správnost překladů? Doufám, že správci dané sekce si budou schopni udržet pořádek. Nevím jak moc dobře to bude fungovat, ale jinou možnost nevidím. Má-li někdo nápady, nechť se mi bez obav svěří :-) Jinak nikdo nemůže očekávat 100% bezchybovost. Vždyť to děláme zadarmo :-) Jestliže chcete 100% bezchybovost kupte si komerční elektronický slovník. Minulý měsíc (v srpnu 2001) byla na serveru root.cz zajímavá recenze na slovník pod [GNU/]Linuxem (samozřejmě komerční [a proprietární]).“
Co jsem měl možnost pozorovat, tento systém kontroly funguje poměrně dobře a na vážnější chyby jsem nenarazil. Otázkou však zůstává, zda nebude větším problémem než chyby obyčejná nepřesnost. Špatný odhad jemných významových nuancí mezi podobnými slovy může být později těžké odhalit.
Druhým zřejmým problémem je, jak vlastně dělat slovník? Jednotlivé databáze jsou copyrightovány, nicméně jsou copyrightovány jako celky, jednotlivou položku již copyrightovat nelze. Důvody jsou zřejmé – pokud by šlo copyrightovat i dvojici slov, nedal by se vytvořit slovník vůbec žádný. Dostáváme se tak do absurdní situace, kde vzít elektronickou databázi a stiskem dvou kláves ji zkopírovat možné není, nicméně sednout si, obklopit se slovníky a „pracovat“ je úplně v pořádku. Velmi názorný příklad, jak copyright prospívá efektivitě práce a veřejnosti. Samozřejmě by měl být slovník tvořen především znalostmi jeho autorů, zde přispěvatelů, a jeho účelem není přepisovat papírový slovník, ale každý potřebuje referenci a jaký materiál můžete u angličtiny použít, když ne opět proprietární slovníky?
Tudíž ačkoliv v žádném případě neschvaluji tvrzení, že ty svobody, o kterých mluvím, ať již se týkají software, databází či dokumentace, mají něco společného s cenou, v tomto případě vztahujícím se ke slovníkům mi opravdu připadá, že ty by měly být vlastnictvím veřejnosti. Proces „vytváření“ slovníků a jejich následného užívání či asymetrie nakládání s elektronickými vs. tištěnými slovníky tomu jednoznačně dává za pravdu. Copyright se zde projevuje jako naprosto umělé omezení.
Právě proto mohou svobodné slovníky být i něčím víc než pouhou praktickou věcí a právě proto tu máme i tento Česko-anglický.
(Autor se podílí na práci na tomto slovníku.)