Co se děje v nitru Googlu, když něco hledáte

Proč si Google ukládá data o vašem vyhledávání, jakým způsobem je používá v reklamě a jak se na základě vašeho vyhledávání učí vaši řeč. Přesně to se dozvíte v dnešním článku.

Co se děje v okamžiku, kdy něco vyhledáte v Googlu? Jaké informace si vyhledávač uloží a k čemu je vlastně využije? Právě na tyto otázky odpoví dnešní článek, který se pokusí zbořit mýtus, že snad může Google vaše data nějakým způsobem zneužít.

Začnu pěkně od konce. Právě jste si zřídili Gmail, Picasu a další Google služby a bojíte se klasického „velkého bratra“. Ostatně něco na tom jistě bude, všechna svá data jste totiž předali Googlu, jehož zaměstnanci si teď mohou prohlížet vaše e-maily.To je ale prakticky nemožné. Firma samozřejmě musí splňovat přísná nařízení a vnitřní politiku, takže se ke konkrétním datům člověk nedostane a za druhé je tu klasický kvantitativní paradox. Služby Googlu používá tak ohromné množství lidí a jeho datová úložiště se každou sekundu nafouknou o takové množství dat, že by bylo poměrně neefektivní detailně sledovat konkrétní osobu. Při vší úctě, to je mnohem snazší zajít ke správci vaši firemní sítě, který jednoduchou analýzou datové výměny v síti zjistí, jaké stránky jste navštívili, kolik hodin pracovní doby jste si prohlíželi lechtivé obrázky, a pokud nepoužíváte SSL, bez problému vám donese i arch bílého papíru popsaného přihlašovacími jmény a hesly do všech oblíbených webových služeb. A pokud jste právě doma, to samé o vás může zjistit i poskytovatel internetového připojení.

Dobrá tedy, uvažme na chvíli, že naše data jsou díky kvantitativnímu paradoxu v bezpečí – doslova ztracená jako jehla v imaginární kupce sena. Jak je to ale s těmi drobnými informacemi, které nevědomky předáváme Googlu? Proč si vyhledávač pamatuje, co jsme naposledy vyhledávali a proč nám zobrazuje reklamy, které by se nám mohly líbit. Sleduje nás Google?

Proč Google ukládá informace o vyhledávání

Zapomeňte nyní na některé specializované služby pro přihlášené uživatele jako historie hledání nebo optimalizace výsledků podle častého vyhledávání. V obou těchto případech se nejedná o žádný neopodstatněný sběr informací o vašem používání služeb Google, ale o vámi vyžádaný. Pokud tedy používáte službu pro ukládání historie hledání, je pochopitelné, že si Google pamatuje vše, co na jeho webu ztropíte.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Hromada Google sušenek ve vašem prohlížeči

Co když ale žádný Google účet nemáte? V takovém případě se ve vašem prohlížeči vytvoří hromada cookies – dočasných identifikačních informací. Nebojte se jich, mají svůj účel, který vysvětlím. Z pohledu Google vyhledávače je nejdůležitější identifikační „sušenka“ PREF, jejíž hodnota může vypadat třeba takto:

ID=e94309e7f5ea8b6a:U=1ddeb155a8752499:TM=1270107662:LM=1270367905:
GM=1:IG=3:S=v0k9eZABOCtCRGEH

Hodnoty ID, U a S jsou jednoznačné identifikátory, které se vážou k vaší IP adrese, respektive k vašemu počítači a vyhledání pojmu. Hodnota LD a TM pak obsahuje čas vytvoření a poslední změny cookie.

Tato cookie se ve vašem počítači vytvoří pokaždé, kdy použijete vyhledávač Google. V ten samý okamžik se zároveň vytvoří záznam na serveru Googlu a to zhruba v této podobě:

123.45.67.89 – 11/Apr/2009 10:15:32 – http://www.google.com/search?q=volby
– Chrome 5.0.371.0; Windows NT 5.1 - e94309e7f5ea8b6a

Na serveru se tedy do databáze uloží čas vašeho hledání, IP adresa počítače, obsah hledání (slovo volby), identifikace prohlížeče a samozřejmě i identifikátor cookie, ve kterém mohou být uloženy další informace.

Zatímco informace o IP adrese ze serveru zmizí do devíti měsíců, hodnota cookie se při životě udrží až dva roky – pokud ji do té doby sami nesmažete třeba obnovou systému.

Google tedy dokáže rozlišit počítač pro každé vyhledávání. K čemu to ale potřebuje? K rozlišování dobrých a špatných chlapíků. Na základě vašeho používání Googlu totiž dokáže odhalit, jestli jste robot nebo člověk. Především ale na základě vašeho používání vyhledávače umí zpřesňovat relevanci výsledků. Jinými slovy, pokud počítač s identifikátorem A po vyhledání výrazu „volby“ pokaždé (opakovaně) klepne na odkaz B a stejně tak se chová tisíc dalších uživatelů. Pak je zřejmé, že odkaz B bude asi kvalitní a Google jej může bez obav zařadit o políčko výše. Pokud ale stejnou operaci uděláte pomocí robota, Google to pozná, díky identifikaci všech hledání z jednoho počítače totiž dokáže rozlišit, jestli se jedná o přirozené používání Googlu, tedy člověka, nebo mechanizované, tedy program.

Klepněte pro větší obrázek
Google se snaží bojovat se špatnými chlapíky, nejrůznějšími SEO roboty a další pakáží

Zapomeňte na učebnicové poučky o tom, že je třeba stránku zaplnit klíčovými slovy. Jistě, je to jeden z nejdůležitějších parametrů, Google se ale zároveň snaží webové stránky hodnotit na základě přirozených lidských kritérií. Základní SEO poučkou by tedy mělo být to nejjednodušší pravidlo – tvořte webové stránky, které jsou ve všech směrech kvalitní, především ale obsahově. Důraz na přirozené hodnocení kvality stránek se bude nadále zvětšovat a pro web samotný to je ta nejlepší možná zpráva.

Díky vyhledávači se Google učí jazyky

Na základě identifikace počítače a analýzy hledání si Google zároveň vylepšuje své slovníkové databáze. Platí to i o službě pro strojový překlad textů Translate. Podle toho, co hledáte a na jaké webové stránky klepáte totiž Google studuje sémantiku i syntaxi národních jazyků a slovům přiděluje třeba synonyma. Může vám to připadat poněkud složité a kostrbaté, pokud ale návštěvníci Googlu vyhledají každou sekundu několik desítek tisíc výrazů (podle oficiálních čísel Google každý den eviduje přes miliardu hledání, podle odhadů comScore je to až 34 tisíc hledání za sekundu) v několika desítkách jazyků, servery pro jazykovou analýzu mají doposud nevídaný materiál – tajný sen všech specialistů na data mining. Představte si, že byste se v jednom jediném okamžiku bavili s desítkami tisíc různých lidí různých národností, kteří používají desítky různých jazyků. Díky porovnávání a hledání společných významů slov a skladeb vět – díky sémantice a syntaxi – byste se velmi rychle naučili mluvit ve všech těchto jazycích. A právě o to se snaží jazyková analýza Googlu.

Nastavte si Google reklamu

Google je ale zároveň synonymem pro webovou reklamu. Zde se už v minulosti stal globální jedničkou a pomalu se snaží uchopit i malé národní trhy včetně toho českého, kde soupeří se zažitými službami Sklik, ETARGET a dalšími.

Na základě vašeho používání vyhledávače a dalších webových služeb Google usoudí, čemu se na webu věnujete nejčastěji, a snaží se vám optimalizovat zobrazovanou reklamu. Pokud tedy na webu nejčastěji hledáte informace o cestování, bude se vám snažit nabízet reklamu právě z této oblasti. Nutno ale podotknout, že navrch bude mít vždy kontextová reklama, tedy ta reklama, která souvisí s obsahem konkrétní stránky. Teprve tehdy, pokud žádnou adekvátní reklamu Google nenabídne, podívá se na vaše preference.

Opět by se mohli mnozí z vás ozvat, že to rozhodně není v pořádku, Google si je toho ale vědom a nabízí vám nástroj, ve kterém si jednoduše vyberete, která reklamní témata se vám mají zobrazovat. Reklamní „ego-optimalizaci“ zde ale můžete i zakázat a pro reklamní systém Gogolu budete už navždy pouze anonymní počítač bez jediné preference.

 Klepněte pro větší obrázek  Klepněte pro větší obrázek
Jakou reklamu vám Google zobrazuje? Podívejte se, upravte témata nebo optimalizaci rovnou zakažte

Tento webový nástroj se jmenuje prostě Nastavení reklam a najdete v něm pouze ty „nezávadné“ kategorie. To v praxi znamená, že pokud na Googlu den co den vyhledáváte weby věnující se S/M praktikám, Google o tom taktně pomlčí. I když by tedy z vašeho počítače stránku navštívila vaše manželka, nic se rozhodně nedozví.

Google je velký – obrovský celkem logicky se tedy kolem něj vznáší desítky a možná i stovky chimér a pochyb. Vždy je samozřejmě důležité se mít na pozoru a rozhodně po hlavě neskákat do každého bezpečnostního rizika. Zároveň ale nemá smysl sázet na bláznivé konspirační teorie velkého bratra. Google je ve své podstatě vyhledávač jako každý jiný – jen trošičku větší.

Tento článek vznikl na základě rozhovoru s Almou Whittenovou, expertkou na ochranu osobních údajů z londýnské centrály Googlu.

Diskuze (31) Další článek: Další novinka v Gmailu: vnořené štítky

Témata článku: Technologie, Google, Web, Bezpečnost, Vyhledávače, Reklamní odkaz, Častá operace, Tajný sen, Good, Preference, Translate, LD, Syntax, Paradox, Relevance, Jehla, GM, Alma, Konspirační teorie, Mýtus, Dobrá optimalizace, Google Translate, Adresa počítače, Archon, Arch


Určitě si přečtěte

Nová americká jaderná puma změní strategii boje

Nová americká jaderná puma změní strategii boje

** Bombardér Northrop Grumman B-2 Spirit amerického letectva nedávno svrhl jadernou pumu ** Šlo o test nové varianty pumy B61-12 ** Ta by měla mít hlavice schopné explodovat se silou 0,3 až 50 kilotun

Stanislav Mihulka | 63

Tohle tak jednou zažít: Nová vzducholoď Airlander 10 s prosklenou podlahou

Tohle tak jednou zažít: Nová vzducholoď Airlander 10 s prosklenou podlahou

** Airlander 10 nabídne plavby vzduchem v interiéru s prosklenou podlahou ** Luxusní vzducholoď byla původně vyvíjena pro vojenské účely ** Počítá se s třídenními „kochacími“ výlety za poznáním

Karel Kilián | 7

České školství čeká revoluce v informatice. Děti se budou učit programovat a logicky myslet

České školství čeká revoluce v informatice. Děti se budou učit programovat a logicky myslet

** Projekt iMyšlení představil 11 nových učebnic pro výuku informatiky ** Cílem je i ty nejmenší děti naučit programovat a logicky uvažovat ** Přichází odklon od současného konceptu učení toho, jak se počítač vůbec ovládá

Karel Javůrek | 104

Velká podzimní aktualizace: Co nového teď najdete ve Windows 10

Velká podzimní aktualizace: Co nového teď najdete ve Windows 10

** Microsoft se opět snaží spojit telefony a počítače. ** Místo velkých novinek se zaměřil spíše na drobná vylepšení. ** Vyhledávání je konečně použitelné a hledá téměř všude.

Vladislav Kluska | 78

Dell XPS 13: Když vás ostatní doženou až za tři roky

Dell XPS 13: Když vás ostatní doženou až za tři roky

** XPS 13 nastartoval trend notebooků bez rámečků ** Letošní model kompletně přechází na USB-C ** Navzdory malému tělu se řadí výkon ke špičce

Tomáš Holčík | 34


Aktuální číslo časopisu Computer

Jak vytvořit a spravovat vlastní web

Velký test herních klávesnic a DVB-T2 tunerů

Vše o formátu RAW

Vybíráme nejlepší základní desku