Google Correlate: sen každého webového statistika a analytika

Google za posledních několik let sesbíral skrze svůj vyhledávač ohromné množství dat. S nimi si pak může každý hrát třeba v nástrojích Google Trends a Google Insights for Search. Nabídka statistických hraček se včera rozšířila ještě o jeden kus – Google Correlate. Zatím běží pouze na inkubátoru Google Labs a pracuje pouze s daty z anglického/univerzálního Googlu, ale umí to, co ostatní vyhledávače nenabízejí.

Koreluji, koreluješ, korelujeme

V aplikacích Trends a Insights hledáte popularitu vybraných slov a skupin slov ve vyhledávači. V Google Correlate hledáte různé výrazy se vzájemnou korelací – vztahem a podobnou strukturou zájmu o daný termín v čase a Googlu.

Může to znít složitě, je to ale v podstatě statistická „banalita“. Představte si třeba časovou křivku popularity slova „Bush“ v Googlu. G. W. Bush už není delší dobu v Bílém domě, zájem o tento termín ve vyhledávači tedy klesá a vy si jistě dokážete představit pravděpodobný tvar této křivky. Pokud „Bushe“ zadáte do aplikace Correlate, Google najde ta anglická slova na americkém Googlu, o která byl v čase podobný zájem, tedy jejichž křivka zájmu má co nejpodobnější tvar (z hlediska matematické statistiky se hodnota korelačního koeficientu blíží 1).

Klepněte pro větší obrázek 
Zájem o slovo Prague u Američanu klesá, podstatou Correlate je ale zjistit ostatní hledané termíny s co nejpodobnější křivkou a tedy možná i s nějakou faktickou/časovou souvislostí

Související výrazy podle ručně nakreslené křivky

Tím to ovšem nekončí. Vy totiž nemusíte hledat pouze podobně populární termíny vůči tomu výchozímu, ale můžete naopak hledat i ty výrazy, jejichž křivka popularity se podobá trajektorii, kterou ručně nakreslíte, případně vyjádříte tabelovanými daty (integrovaný tabulkový editor a import dat z CSV).

 

Co také zjistíte korelací podle uživatelské křivky?

  • Sezónnost – nakreslete/vygenerujte sinusoidu s amplitudou třeba v létě
  • „Mrtvoly“ – křivka s vrcholem v roce 2004 až 2006 a s minimem v roce 2008
  • „Exoty“ – křivka po celou dobu na nule a s jediným krátkým výstřelkem v roce 2008
 


A teď už to začíná být skutečně zajímavé, protože si třeba nakreslíte křivku popularity, která byla na vrcholu v roce 2004 a pak strmě klesala na pomyslnou nulu. Z takového zadání vám pak Google předhodí termíny, které Američané před sedmi lety hledali den co den a dnes už jsou v zapomnění. Zjistíte, že do této skupiny patří z těch technologických témat třeba AOL Messenger.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Hledání korelace přímou kresbou – nejprve nakreslete křivku a Googlu sám zjistí slova, jejichž křivka popularity se podobá co nejvíce (korelační koeficient blízký hodnotě 1). V tomto grafu se tedy jedná o slova, která byla v prvních letech 21. století na svém vrcholu, dnes o ně ale už nikdo nezavadí. Patří sem texty country skladeb, Pocket PC a nikoho už nezajímají ani opilí cyklisti – tedy přinejmenším v USA

Google Correlate je zajímavý statistický nástroj, který poměrně dramaticky rozšiřuje volně dostupné analytické programy Googlu. V úvahu ale bere pouze anglický vyhledávač, takže rovnou zapomeňte na české termíny (resp. na české termíny zasazené do tuzemského kontextu).

Klepněte pro větší obrázek  Klepněte pro větší obrázek
V tomto případě jsem modelovou křivku nenakreslil, ale sestrojil z tabelovaných dat. Jedná se o úplňky v roce 2010. Křivka má za běžných okolností nulové hodnoty (žádný zájem o hledané výrazy), ale o úplňcích strmě vystřelí vzhůru. Jaká slova takové křivce odpovídají? No pochopitelně ta, která Američané v obrovské míře hledali právě ve dnech, kdy byl Měsíc na obloze zcela kulatý.

 

Témata článku: Google, Technologie, Statistiky, Statistika, Bush, 500Px

5 komentářů

Nejnovější komentáře

  • V0174 27. 5. 2011 10:06:48
    Mně zaujala vysoká korelace "Czech Republic" s "map of Angola" a "jamaica...
  • dokola 26. 5. 2011 18:50:12
    Pěkný ...takovéhle článečky, které upozorní na něco zajímavého mám rád.
  • Martin Hruška 26. 5. 2011 17:07:21
    "Full moon love spells" Pomoc. Hloupé je, že to nedává žádné výsledky...
Určitě si přečtěte

Sbíječky vyměnili za klávesnice. Nový projekt má za cíl přeučit horníky na programátory

Sbíječky vyměnili za klávesnice. Nový projekt má za cíl přeučit horníky na programátory

** Programátorů je málo a horníků bez práce po uzavření dolu Paskov bude moc ** Problém řeší unikátní projekt ** Pilotní kurz dává naději, že by z horníků mohli být použitelní kodéři

28.  11.  2016 | David Polesný | 78

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

** Novinka od Asusu míří přímo proti MacBooku od Applu ** Nabídne daleko více výkonu za stejné peníze

2.  12.  2016 | David Polesný | 120