Google Correlate: sen každého webového statistika a analytika

Google za posledních několik let sesbíral skrze svůj vyhledávač ohromné množství dat. S nimi si pak může každý hrát třeba v nástrojích Google Trends a Google Insights for Search. Nabídka statistických hraček se včera rozšířila ještě o jeden kus – Google Correlate. Zatím běží pouze na inkubátoru Google Labs a pracuje pouze s daty z anglického/univerzálního Googlu, ale umí to, co ostatní vyhledávače nenabízejí.

Koreluji, koreluješ, korelujeme

V aplikacích Trends a Insights hledáte popularitu vybraných slov a skupin slov ve vyhledávači. V Google Correlate hledáte různé výrazy se vzájemnou korelací – vztahem a podobnou strukturou zájmu o daný termín v čase a Googlu.

Může to znít složitě, je to ale v podstatě statistická „banalita“. Představte si třeba časovou křivku popularity slova „Bush“ v Googlu. G. W. Bush už není delší dobu v Bílém domě, zájem o tento termín ve vyhledávači tedy klesá a vy si jistě dokážete představit pravděpodobný tvar této křivky. Pokud „Bushe“ zadáte do aplikace Correlate, Google najde ta anglická slova na americkém Googlu, o která byl v čase podobný zájem, tedy jejichž křivka zájmu má co nejpodobnější tvar (z hlediska matematické statistiky se hodnota korelačního koeficientu blíží 1).

Klepněte pro větší obrázek 
Zájem o slovo Prague u Američanu klesá, podstatou Correlate je ale zjistit ostatní hledané termíny s co nejpodobnější křivkou a tedy možná i s nějakou faktickou/časovou souvislostí

Související výrazy podle ručně nakreslené křivky

Tím to ovšem nekončí. Vy totiž nemusíte hledat pouze podobně populární termíny vůči tomu výchozímu, ale můžete naopak hledat i ty výrazy, jejichž křivka popularity se podobá trajektorii, kterou ručně nakreslíte, případně vyjádříte tabelovanými daty (integrovaný tabulkový editor a import dat z CSV).

 

Co také zjistíte korelací podle uživatelské křivky?

  • Sezónnost – nakreslete/vygenerujte sinusoidu s amplitudou třeba v létě
  • „Mrtvoly“ – křivka s vrcholem v roce 2004 až 2006 a s minimem v roce 2008
  • „Exoty“ – křivka po celou dobu na nule a s jediným krátkým výstřelkem v roce 2008
 


A teď už to začíná být skutečně zajímavé, protože si třeba nakreslíte křivku popularity, která byla na vrcholu v roce 2004 a pak strmě klesala na pomyslnou nulu. Z takového zadání vám pak Google předhodí termíny, které Američané před sedmi lety hledali den co den a dnes už jsou v zapomnění. Zjistíte, že do této skupiny patří z těch technologických témat třeba AOL Messenger.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Hledání korelace přímou kresbou – nejprve nakreslete křivku a Googlu sám zjistí slova, jejichž křivka popularity se podobá co nejvíce (korelační koeficient blízký hodnotě 1). V tomto grafu se tedy jedná o slova, která byla v prvních letech 21. století na svém vrcholu, dnes o ně ale už nikdo nezavadí. Patří sem texty country skladeb, Pocket PC a nikoho už nezajímají ani opilí cyklisti – tedy přinejmenším v USA

Google Correlate je zajímavý statistický nástroj, který poměrně dramaticky rozšiřuje volně dostupné analytické programy Googlu. V úvahu ale bere pouze anglický vyhledávač, takže rovnou zapomeňte na české termíny (resp. na české termíny zasazené do tuzemského kontextu).

Klepněte pro větší obrázek  Klepněte pro větší obrázek
V tomto případě jsem modelovou křivku nenakreslil, ale sestrojil z tabelovaných dat. Jedná se o úplňky v roce 2010. Křivka má za běžných okolností nulové hodnoty (žádný zájem o hledané výrazy), ale o úplňcích strmě vystřelí vzhůru. Jaká slova takové křivce odpovídají? No pochopitelně ta, která Američané v obrovské míře hledali právě ve dnech, kdy byl Měsíc na obloze zcela kulatý.

 

Témata článku: Technologie, Google, Statistiky, Statistika, Bush, 500Px

5 komentářů

Nejnovější komentáře

  • V0174 27. 5. 2011 10:06:48
    Mně zaujala vysoká korelace "Czech Republic" s "map of Angola" a "jamaica...
  • dokola 26. 5. 2011 18:50:12
    Pěkný ...takovéhle článečky, které upozorní na něco zajímavého mám rád.
  • Martin Hruška 26. 5. 2011 17:07:21
    "Full moon love spells" Pomoc. Hloupé je, že to nedává žádné výsledky...
Určitě si přečtěte

Nebuďte jako Emma Watson. Poradíme, jak nepřijít o hanbaté fotky

Nebuďte jako Emma Watson. Poradíme, jak nepřijít o hanbaté fotky

** Pokud už choulostivé snímky vyfotíte, dbejte na jejich zabezpečení ** Útočníci je nejčastěji získají z cloudového úložiště ** Pozor si dejte i na phishing a řádné zabezpečení telefonu

Včera | Stanislav Janů | 44

Špičkoví hackeři útočili na prohlížeče. Chrome odolal, ale Edge je tragédie

Špičkoví hackeři útočili na prohlížeče. Chrome odolal, ale Edge je tragédie

** Do Vancouveru se sjeli hackeři ** Soutěžili v útocích na prohlížeče ** Chrome odolal, ale Edge to projel na celé čáře

22.  3.  2017 | Jakub Čížek | 79

Obří Mechroboti jsou realitou, měří čtyři metry a mají hmotnost přes 1,5 tuny

Obří Mechroboti jsou realitou, měří čtyři metry a mají hmotnost přes 1,5 tuny

** Jihokorejská společnost Hankook Mirae Technology vyrábí obří Mechroboty ** Jsou určené pro ovládání člověkem uvnitř ** V prodeji se objeví koncem tohoto roku za 200 milionů korun

20.  3.  2017 | Karel Javůrek | 18


Aktuální číslo časopisu Computer

Supertéma o počítačové bezpečnosti

AMD Ryzen přichází

Velké testy kinoprojektorů a levných sluchátek

Příslušenství do USB-C