Co se děje v nitru Googlu, když něco hledáte

Proč si Google ukládá data o vašem vyhledávání, jakým způsobem je používá v reklamě a jak se na základě vašeho vyhledávání učí vaši řeč. Přesně to se dozvíte v dnešním článku.

Co se děje v okamžiku, kdy něco vyhledáte v Googlu? Jaké informace si vyhledávač uloží a k čemu je vlastně využije? Právě na tyto otázky odpoví dnešní článek, který se pokusí zbořit mýtus, že snad může Google vaše data nějakým způsobem zneužít.

Začnu pěkně od konce. Právě jste si zřídili Gmail, Picasu a další Google služby a bojíte se klasického „velkého bratra“. Ostatně něco na tom jistě bude, všechna svá data jste totiž předali Googlu, jehož zaměstnanci si teď mohou prohlížet vaše e-maily.To je ale prakticky nemožné. Firma samozřejmě musí splňovat přísná nařízení a vnitřní politiku, takže se ke konkrétním datům člověk nedostane a za druhé je tu klasický kvantitativní paradox. Služby Googlu používá tak ohromné množství lidí a jeho datová úložiště se každou sekundu nafouknou o takové množství dat, že by bylo poměrně neefektivní detailně sledovat konkrétní osobu. Při vší úctě, to je mnohem snazší zajít ke správci vaši firemní sítě, který jednoduchou analýzou datové výměny v síti zjistí, jaké stránky jste navštívili, kolik hodin pracovní doby jste si prohlíželi lechtivé obrázky, a pokud nepoužíváte SSL, bez problému vám donese i arch bílého papíru popsaného přihlašovacími jmény a hesly do všech oblíbených webových služeb. A pokud jste právě doma, to samé o vás může zjistit i poskytovatel internetového připojení.

Dobrá tedy, uvažme na chvíli, že naše data jsou díky kvantitativnímu paradoxu v bezpečí – doslova ztracená jako jehla v imaginární kupce sena. Jak je to ale s těmi drobnými informacemi, které nevědomky předáváme Googlu? Proč si vyhledávač pamatuje, co jsme naposledy vyhledávali a proč nám zobrazuje reklamy, které by se nám mohly líbit. Sleduje nás Google?

Proč Google ukládá informace o vyhledávání

Zapomeňte nyní na některé specializované služby pro přihlášené uživatele jako historie hledání nebo optimalizace výsledků podle častého vyhledávání. V obou těchto případech se nejedná o žádný neopodstatněný sběr informací o vašem používání služeb Google, ale o vámi vyžádaný. Pokud tedy používáte službu pro ukládání historie hledání, je pochopitelné, že si Google pamatuje vše, co na jeho webu ztropíte.

gogole cookies.png  google cookie.png
Hromada Google sušenek ve vašem prohlížeči

Co když ale žádný Google účet nemáte? V takovém případě se ve vašem prohlížeči vytvoří hromada cookies – dočasných identifikačních informací. Nebojte se jich, mají svůj účel, který vysvětlím. Z pohledu Google vyhledávače je nejdůležitější identifikační „sušenka“ PREF, jejíž hodnota může vypadat třeba takto:

ID=e94309e7f5ea8b6a:U=1ddeb155a8752499:TM=1270107662:LM=1270367905:
GM=1:IG=3:S=v0k9eZABOCtCRGEH

Hodnoty ID, U a S jsou jednoznačné identifikátory, které se vážou k vaší IP adrese, respektive k vašemu počítači a vyhledání pojmu. Hodnota LD a TM pak obsahuje čas vytvoření a poslední změny cookie.

Tato cookie se ve vašem počítači vytvoří pokaždé, kdy použijete vyhledávač Google. V ten samý okamžik se zároveň vytvoří záznam na serveru Googlu a to zhruba v této podobě:

123.45.67.89 – 11/Apr/2009 10:15:32 – http://www.google.com/search?q=volby
– Chrome 5.0.371.0; Windows NT 5.1 - e94309e7f5ea8b6a

Na serveru se tedy do databáze uloží čas vašeho hledání, IP adresa počítače, obsah hledání (slovo volby), identifikace prohlížeče a samozřejmě i identifikátor cookie, ve kterém mohou být uloženy další informace.

Zatímco informace o IP adrese ze serveru zmizí do devíti měsíců, hodnota cookie se při životě udrží až dva roky – pokud ji do té doby sami nesmažete třeba obnovou systému.

Google tedy dokáže rozlišit počítač pro každé vyhledávání. K čemu to ale potřebuje? K rozlišování dobrých a špatných chlapíků. Na základě vašeho používání Googlu totiž dokáže odhalit, jestli jste robot nebo člověk. Především ale na základě vašeho používání vyhledávače umí zpřesňovat relevanci výsledků. Jinými slovy, pokud počítač s identifikátorem A po vyhledání výrazu „volby“ pokaždé (opakovaně) klepne na odkaz B a stejně tak se chová tisíc dalších uživatelů. Pak je zřejmé, že odkaz B bude asi kvalitní a Google jej může bez obav zařadit o políčko výše. Pokud ale stejnou operaci uděláte pomocí robota, Google to pozná, díky identifikaci všech hledání z jednoho počítače totiž dokáže rozlišit, jestli se jedná o přirozené používání Googlu, tedy člověka, nebo mechanizované, tedy program.

good guys.png
Google se snaží bojovat se špatnými chlapíky, nejrůznějšími SEO roboty a další pakáží

Zapomeňte na učebnicové poučky o tom, že je třeba stránku zaplnit klíčovými slovy. Jistě, je to jeden z nejdůležitějších parametrů, Google se ale zároveň snaží webové stránky hodnotit na základě přirozených lidských kritérií. Základní SEO poučkou by tedy mělo být to nejjednodušší pravidlo – tvořte webové stránky, které jsou ve všech směrech kvalitní, především ale obsahově. Důraz na přirozené hodnocení kvality stránek se bude nadále zvětšovat a pro web samotný to je ta nejlepší možná zpráva.

Díky vyhledávači se Google učí jazyky

Na základě identifikace počítače a analýzy hledání si Google zároveň vylepšuje své slovníkové databáze. Platí to i o službě pro strojový překlad textů Translate. Podle toho, co hledáte a na jaké webové stránky klepáte totiž Google studuje sémantiku i syntaxi národních jazyků a slovům přiděluje třeba synonyma. Může vám to připadat poněkud složité a kostrbaté, pokud ale návštěvníci Googlu vyhledají každou sekundu několik desítek tisíc výrazů (podle oficiálních čísel Google každý den eviduje přes miliardu hledání, podle odhadů comScore je to až 34 tisíc hledání za sekundu) v několika desítkách jazyků, servery pro jazykovou analýzu mají doposud nevídaný materiál – tajný sen všech specialistů na data mining. Představte si, že byste se v jednom jediném okamžiku bavili s desítkami tisíc různých lidí různých národností, kteří používají desítky různých jazyků. Díky porovnávání a hledání společných významů slov a skladeb vět – díky sémantice a syntaxi – byste se velmi rychle naučili mluvit ve všech těchto jazycích. A právě o to se snaží jazyková analýza Googlu.

Nastavte si Google reklamu

Google je ale zároveň synonymem pro webovou reklamu. Zde se už v minulosti stal globální jedničkou a pomalu se snaží uchopit i malé národní trhy včetně toho českého, kde soupeří se zažitými službami Sklik, ETARGET a dalšími.

Na základě vašeho používání vyhledávače a dalších webových služeb Google usoudí, čemu se na webu věnujete nejčastěji, a snaží se vám optimalizovat zobrazovanou reklamu. Pokud tedy na webu nejčastěji hledáte informace o cestování, bude se vám snažit nabízet reklamu právě z této oblasti. Nutno ale podotknout, že navrch bude mít vždy kontextová reklama, tedy ta reklama, která souvisí s obsahem konkrétní stránky. Teprve tehdy, pokud žádnou adekvátní reklamu Google nenabídne, podívá se na vaše preference.

Opět by se mohli mnozí z vás ozvat, že to rozhodně není v pořádku, Google si je toho ale vědom a nabízí vám nástroj, ve kterém si jednoduše vyberete, která reklamní témata se vám mají zobrazovat. Reklamní „ego-optimalizaci“ zde ale můžete i zakázat a pro reklamní systém Gogolu budete už navždy pouze anonymní počítač bez jediné preference.

 google reklamy nastavení.png  google reklama nastavení.png
Jakou reklamu vám Google zobrazuje? Podívejte se, upravte témata nebo optimalizaci rovnou zakažte

Tento webový nástroj se jmenuje prostě Nastavení reklam a najdete v něm pouze ty „nezávadné“ kategorie. To v praxi znamená, že pokud na Googlu den co den vyhledáváte weby věnující se S/M praktikám, Google o tom taktně pomlčí. I když by tedy z vašeho počítače stránku navštívila vaše manželka, nic se rozhodně nedozví.

Google je velký – obrovský celkem logicky se tedy kolem něj vznáší desítky a možná i stovky chimér a pochyb. Vždy je samozřejmě důležité se mít na pozoru a rozhodně po hlavě neskákat do každého bezpečnostního rizika. Zároveň ale nemá smysl sázet na bláznivé konspirační teorie velkého bratra. Google je ve své podstatě vyhledávač jako každý jiný – jen trošičku větší.

Tento článek vznikl na základě rozhovoru s Almou Whittenovou, expertkou na ochranu osobních údajů z londýnské centrály Googlu.

Diskuze (31) Další článek: Další novinka v Gmailu: vnořené štítky

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,