Blíží se konec klasického CAPTCHA testu?

Diskuze čtenářů k článku

avatar
28. 01. 2009 00:20

tak vi nekdo co je na tom druhem obrazku testu IMAGINATION ? ja tam tak veprostred vidim takovou napul tvar, ale ta bohuzel v moznostech neni.. :D

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
27. 01. 2009 18:53

DIVTCHA (http://www.quicky.cz/novinky/antispamova-ochra... ... se mi v současnosti zdá lepším řešením než CAPTCHA..

Souhlasím  |  Nesouhlasím  |  Odpovědět
28. 01. 2009 05:52

Tohle je zajimave reseni, ale je uplne nanic.

Staci si uvedomit jak funguje klasicky OCR skener. Dostane obrazek ze ktereho si nacte pixely. Pro kazdou souradnici (x,y) ma ten pixel nejakou barvu. A podle toho se snazi dekodovat jake pismenko je napsane na tom obrazku.

To co tahle DIVTCHA udela, je jen to, ze "obrazek" nezobrazi jako link na nejaky ten obrazek, ale pomoci css stylu ten obrazek vykresli na monitor pixel po pixelu.

Jediny rozdil mezi DIVTCHA a "obrazkem" je to ze obrazek je ulozen v binarnim formatu (jpg, bmp, png, gif,...) a ta divtcha je obrazek ulozeny jako "css" napozicovany kod.

Takze neni tak snadne zizkat ty souradnice pixelu a jejich barvu. Takze onen robot ma jen o trochu vice prace. Musi stahnout ten kod stranky a pouzit nejaky "css renderer" aby si vyrobil souradnice (x,y) barvy pixelu. A pak uz je to klasicka technika OCR scanneru, kdy z techto dat dostane nejaky ten text (jelikoz pismenka jsou pekne ostra a nejsou deformovana) tak ma velice jednoduchou praci a hadam ze bude mit 99.99% uspesnost.

Tedy jedina neprijemnost je onen CSS renderer, ale jelikoz CSS je standart tak napsat jeho implementaci neni pro zkuseneho programatora zadny problem. A kdo nema tolik zkusenosti ze by to zvladl sam a nebo s tim nechce ztracet cas, tak existuje treba open source prohlizec Firefox, takze mu staci jiz hotovy css renderer z toho firefoxu zkopirovat, trochu upravit do sveho robota a ma hotovo. Ted muze bez problemu zadavat bezpecnostni kody.

Vysledek DIVTCHA je tedy jediny. Programator toho robota musi napsat trochu delsi kod, ale diky tomu ze je ten obrazek dobre zobrazeny tak ten ocr scanner bude mit temer 100% uspesnost dekodovani.

Souhlasím  |  Nesouhlasím  |  Odpovědět
28. 01. 2009 09:31

Problém je o něco větší. Robot sice nemá problém vygenerovat si stránku... dokonce ji nemusí ani renderovat. Stačí si vyfotit obrazovku. Musel by ale v obrazu webu najít text, který je kódem. Nemůže dekódovat něco, co nenajde

Souhlasím  |  Nesouhlasím  |  Odpovědět
28. 01. 2009 12:37

Robot nebude hledat v celem obrazu webu. Robot si nejdrive ze zdrojoveho kodu stranky vytahne tu cast, kterou se ty "pismenka" skladaji. A jen tohle musi renderovat do obrazku.

Ja jsem z te jedne vygenerovane testovaci stranky rucne vytahl jen tu cast kodu, ktera se stara o to zobrazeni. Ano udelal jsem to rucne, protoze se mi nechce psat program, ale neni zas tak tezke z toho zdrojoveho kodu vytahnout tuhle cast ikdyz "id" a "name" tech elementu je take dynamicky generovano. A to co jsem z toho vytahl jsem nahral sem: http://nargon.mysteria.cz/divtcha.htm...

A kdyz ten robot vyrenderuje tento obrazek, tak nic nemusi hledat. Ma zde jen ty pismenka ktere potrebuje a ty uz zvladne dekodovat.

Robot nebude hledat v celem vyrenderovanem obrazku webu. On si nejdrive ze zdrojoveho kodu vytahne tu cast kterou potrebuje a jen tu si vyrenderuje a pak uz OCR bez problemu precte to co potrebuje.

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 12:54

Registrace pouze Českou poštou, psané vlastní rukou, na adresu P.O. BOX XX.

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
27. 01. 2009 18:39

Nejlepsi CAPTCHA je zadna CAPTCHA.

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 08:15

To si jako autor myslí, že je autorem toho testu Alan Turing nebo co?

ROTFL.

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 08:55

Proc by si to mel autor myslet.

Puvodni turinguv test slouzil k porovnani zda je nejaka umela inteligence schopna chovat se jako clovek. V soucasnosti se ale ten system trosku obratil a test se pouziva k rozeznani cloveka a stroje, kdyz je oba nepozname (napriklad ze jsou oba ve vedlejsi mistnosti). Neco sem slysel ze udajne se to vyhodnocovalo tak ze vedle sedel clovek a poznaval jestli to je clovek vedle, nebo pocitac, to co "odpovida na otazky".

Jednim z prikladu Turingova testu muze byt i zminovana Capcha... Turing neni tvurcem Capcha testu, to ale neznamena ze nutne ani Capcha neni Turingovim testem. Konec koncu definice to rika jasne. A autor chtel rict, ze na vecine webovych sluzeb provozovany Turinguv test (ve vecine pripadu to asi bude Capcha), je pocitacem jiz prekonatelny.

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 08:06

Kdyby všechny ty velký služby nepoužívaly primitivní captcha, který rozlouskne i primitivní OCR...

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 09:18

U nekterych mozna odpovi uz ted lepe stroj nez clovek. Kdyz je pouzit spatny font, tak nejde rozeznat '0' x 'O', 'l' x '1', '2' x 'Z'...

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 22:49

Jo, u některých takových CAPTCHA si připadám jako dokonalá PITCHA, protože je prostě nepřečtu...

Souhlasím  |  Nesouhlasím  |  Odpovědět
28. 01. 2009 01:04

presne tak, uz me to i kolikrat odradilo, 5x vyplnuju vse dokola (vcetne vyplneni 20 poli formulare) a porad nic...

nekde to chtej opsat presne, nekde je jim to fuk (maly/velky)

clovek by se z toho p

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 04:42

špatně nevypadá ani 3D capcha. Víc o ní je třeba tady: http://doublethink.cleverweb.cz/22-textova-3d-captcha...

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 01:14

1) co je na tom druhem IMAGINATION CAPTCHA obrazku? :D ja na to ziral nekolik minut a asi na to nemam fantazii.. jeste ze neco takoveho nepouzivaji v internet bankingu - to by sme tu meli asi dalsi krizi

2) a co misto vymysleni novych poznavacek proste jen oblbovat roboty?

a) naraficit do formulare vice inputu, nektere schovat, a pojmenovat tak, aby si robot myslel, ze to jsou zrovna ty spravne inputy - a pokud budou vyplnene, nebrat odeslana data v potaz - skryty prvek formulare vyplni jen robot --- chapu ale, ze toto muze byt problem pri vytvareni dostupnych webu - tj kdyz by nekdo vypl CSS, najednou by mel pred sebou kupu dalsich inputu

b) kontrola pristupu na stranku s formularem a stranku se skriptem - pokud je cas mensi nez X vterin, opet je jasne, ze formular vyplnil robot a ne clovek - cloveku chvilku trva, nez neco napise --- moc nerozumim tomu, jak je vubec mozne, ze sluzby nechaji nejakeho robota zkouset vstup

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 02:48

napadlo Vas ze utok muze byt cileny ?

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 06:53

neni prece zadny problem, aby bot pozdrzel odeslani formulare. pri mnozstvi jednotlivych pocitacu, z nichz to zkousi, to nepredstavuje zasadni problem. nehlede na to, ze treba pri copy&paste dokaze byt slusne rychly i clovek (i kdyz zrovna to neni v pripade captcha pouzitelne).

"moc nerozumim tomu, jak je vubec mozne, ze sluzby nechaji nejakeho robota zkouset vstup"

asi neni zrovna trivialni rozlisit bota od cloveka. prave k tomu jsou urceny ruzne captcha a dalsi testy.

kdyby v http hlavicce bylo napsano "jsem bot, odpoj me", verte tomu, ze byste captcha potkal jen vyjimecne.

Souhlasím  |  Nesouhlasím  |  Odpovědět
27. 01. 2009 12:27

z clanku mi prislo, ze jeden z "pruniku" je zpusoben proste jen tim, ze nejaky bot zkousi posilat nejake odpovedi - tj hezky pekne metodou monte carlo zkusit vsecky mozne kombinace.

a v pripade, ze by slo udelat jeden request za 1 vterinu, hned by se to pekne protahlo - a zadruhe, kdyz by server zaznamenal vice requestu z jednoho mista, zacal by to nejak blokovat. (napriklad take nemuzu zadat 50x heslo do systemu - po 3. se to na nekolik minut uzamkne, prave kvuli zkouseni kombinaci)

Souhlasím  |  Nesouhlasím  |  Odpovědět
snake  |  27. 01. 2009 14:07

Tak ono to Monte Carlo nebude dokonale Monte, chci říct, že ta náhodnost nespočívá v generování jakéhokoli vstupu, ale že se vybere náhodně z několika variant, z nichž každá má podle OCR nenulovou pravděpodobnost, a samozřejmě čím větší pravděpodobnost, tím častěji se takový vstup vybere. Normální OCR vybere vždy tu nejpravděpodobnější variantu, což ovšem bude díky záměrné volbě špatně rozeznatelných obrázků "bez výjimky" nesprávně. No a Monte Carlo pak pomůže, protože umožní zvolit tu správnou variantu, kterou běžné OCR sice také považuje třeba za možnou, ale protože jiné řešení mu přijde pravděpodobnější, nikdy by ji nezvolilo...

No a co se týká toho zkoušení, uvědomte si, že se zkouší paralelně z tisíců až milionů počítačů najednou, a odstřihávat server sice může, ale pak odstřihne i mnoho legálních uživatelů, kteří jsou za proxy (firma s 500 usery, ale ven pouští vše přes jedinou IP pomocí NATu/PATu či pomocí proxy). A spammerům je v podstatě jedno, jestli uspějí 100x z milionu pokusů z jednoho počítače, nebo jestli uspěje 100 počítačů z milionu, přičemž každý to zkusí jen jednou. V tomhle jsou botnety v podstatě neporazitelné z principu, protože každé nastavení, které je aspoň trochu omezí, bude nepříjemně až neakceptovatelně omezovat i běžné uživatele.

Souhlasím  |  Nesouhlasím  |  Odpovědět
Zasílat názory e-mailem: Zasílat názory Můj názor