Google koupil projekt reCAPTCHA – pomůže mu v digitalizaci knih?

Projekt reCAPTCHA je na první pohled celkem klasická CAPTCHA kontrola pro webové stránky a aplikace, která má zamezit automatickému vyplňování formulářů roboty, nejrůznějšími spamboty aj. ReCAPTCHA nepoužívá žádné pokročilé 3D techniky a další speciality, kterými ostatní bojují se stále dokonalejšími OCR systémy pro rozpoznávání textu.

A přesto se reCAPTCHA od své konkurence výrazně liší, při vyplňování kontrolních slov totiž nevědomky pomáháte digitalizovat knihy. ReCAPTCHA používá dvě slova, která mají podobný řez, velikost a styl. Zatímco jedno slovo systém zná, to druhé si vypůjčil z projektu digitalizace univerzitních knihoven a současný digitalizační OCR software si s ním neporadí. Pokud ovšem projdete CAPTCHA testem vy a správně vyplníte první kontrolní slovo, systém bude předpokládat, že jste správně vyplnili i ten druhý doposud neznámý výraz.

Přečtěte si: CAPTCHA aneb jak se stát otrokem podivného obrázku

recaptcha1.jpgProjekt reCAPTCHA před pár lety spustila univerzita Carnegie-Mellon, nyní se ovšem systém dostává do velké rodiny Google, internetový gigant z Mountain View si totiž originální a světu prospěšný CAPTCHA test koupil a je docela možné, že jej sám využije pro digitalizaci knih tentokráte z projektu Book Search.

Kontroverzní Book Search – pokus o digitalizaci a elektronizaci všech světových knihoven – má zatím problém především s knihkupci a nakladateli, kteří se cítí být poškozeni na svých právech a především živobytí. V zámoři se zdá být spor zažehnán mimosoudním vyrovnáním a speciálním fondem, který bude dotovat jejich ztráty, nové kolo tahanic se ale protentokrát rozjíždí v Evropě. Té sice stále chybí jednotný právní rámec pro autorské právo, iniciativy se ale přesto chopily unijní úřady.

Diskuze (20) Další článek: ChromePlus: Když jednoduchý Google Chrome nestačí

Témata článku: , , , , , , , , , , , , , , , , , , , , ,