Roboti mají právo šmejdit na webech a stahovat data, rozhodl soud

Názory k článku

našinec  |  16. 08. 2017 07:05  |  Microsoft Windows 10 Chrome 60.0.3112.78

Roboti mají právo stahovat a čumět na porno.

Souhlasím  |  Nesouhlasím  |  Odpovědi (2)Zavřít odpovědi  |  Odpovědět
Nargon  |  16. 08. 2017 07:57  |  Microsoft Windows 10 Chrome 60.0.3112.90

A přitom by to šlo udělat i elegantněji. Obecné pravidlo, které z jedné IP adresy povolí za hodinu zobrazení například 50 profilů. Jakmile se limit překročí tak nedojde k zablokování, ale k umělému zpoždění. Tím myslím že běžně kliknete na stránku a ona se zobrazí. Ale tím umělým zpožděním by se počkalo například 5s a až pak by webserver klientovy poslal data. A toto zpoždění by narůstalo s počtem přístupů. Tj když si jedna IP bude zobrazovat například stý profil v dané hodině tak bude čekat třeba 5 minut apod.
Tohle je celkem elegantní způsob který by protistrana nemusela prokouknout, protože se to dá velice snadno vysvětlit vytížením serveru.

Souhlasím  |  Nesouhlasím  |  Odpovědět
m.m  |  16. 08. 2017 08:09  |  Android Chrome 59.0

Pritom by stacilo dodrzet copyright. Na vsechna dostupna data na webu jsou neci prava atd....

Souhlasím  |  Nesouhlasím  |  Odpovědi (3)Zavřít odpovědi  |  Odpovědět
16. 08. 2017 09:31 | Microsoft Windows 7 Chrome 60.0.3112.90

"Linkedin jednoduše nemůže bránit ve sběru podobných informací"
Jednoduse? MUZE. Je to jejich web, jejich sluzba, jejich data (co jim lidi dali), a za provoz plati. Muzou to mit pro sebe, pro lidi, pro roboty - jak jen uznaji za vhodne. Navic blbe napsany robot, nebo clovek kteremu si sedla kocka na F5 - oboji generuje nadmernou zatez a muze (a na cas by mel) byt odstrizen.No dobra. Jak to resit. Treba vystavit pro tyhle lidi API a patricne ho zpoplatnit. mrk.

Souhlasím  |  Nesouhlasím  |  Odpovědi (1)Zavřít odpovědi  |  Odpovědět
Vindis  |  16. 08. 2017 10:44  |  Microsoft Windows 10 Chrome 60.0.3112.78

"Podle soudce roboti sbírali pouze veřejně dostupné údaje a simulovali vlastně to, jako by si údaje z profilů opisovali ručně sami zaměstnanci HiQ prostou návštěvou veřejné dostupných adres."
No to je pravda. Robot dělá stejné úkony jako člověk. Jenže zde bych už nemluvil o simulaci. Kdyby robot simuloval člověka, tak by se muselo započítat i rychlost zpracování. Dejme tomu, že člověk by zvládl jeden profil na Linkedin tak za 30 sekund. To znamená, že robot by musel také jeden profil zpracovávat za tuto dobu. Jenže tak to není. Robot by to zvládl i za sekundu. Ale upusťme od toho porovnávání robot vs člověk.
Problém je v oné rychlosti. Když začne robot v jednom okamžiku dolovat data, tak tím výrazně zatíží server. A provozovatel služby má plné právo takovou činnost zablokovat. Ostatně je nutné to zablokovat - nelze s jistotou říci, zda doluje data nebo úmyslně zatěžuje server - útok typu DoS.V tomto případě se hodí aplikovat limity. Ostatně u různých API služeb tomu tak je.
U klasických načítání stránek - simulace člověka - ponechat tak, jak to je. Pokud server detekuje neobvyklou činnost - dolování dat = nadměrná zátěž - tak se jedná o neoprávněné využití, respektive o útok, pak má server plné právo záškodníka zablokovat.
Pokud chce někdo dolovat data ve velkém, ať přizpůsobí robota tak, aby server zbytečně nezatěžoval, aplikoval zpožďovací mechanismus, pak nemá server důvod k blokaci. Nebo se dohodnout s provozovatelem služby o poskytování dat. Robot pak může dolovat plnou rychlosti a server tuto aktivitu označí jako oprávněnou.Jednoduše. Pokud chce někdo dolovat data ve velkém, bylo by vhodné na to upozornit provozovatele a případně se s ním dohodnout. Ten pak bude vědět, že ta zátěž je oprávněná, nejedná se o útok, a nemá důvod to zablokovat. Pokud k žádnému upozornění nedojde a server detekuje nadměrnou zátěž, tak má právo to zablokovat, protože to může vyhodnotit jako útok.

Souhlasím  |  Nesouhlasím  |  Odpovědět
Zasílat názory e-mailem: Zasílat názory Můj názor
Aktuální číslo časopisu Computer

Vyplatí se ještě těžit kryptoměny?

Velký test studentských notebooků

Test pěti levných soundbarů

Nejlepší chytré hodinky