reklama

Google Correlate: sen každého webového statistika a analytika

Google za posledních několik let sesbíral skrze svůj vyhledávač ohromné množství dat. S nimi si pak může každý hrát třeba v nástrojích Google Trends a Google Insights for Search. Nabídka statistických hraček se včera rozšířila ještě o jeden kus – Google Correlate. Zatím běží pouze na inkubátoru Google Labs a pracuje pouze s daty z anglického/univerzálního Googlu, ale umí to, co ostatní vyhledávače nenabízejí.

Koreluji, koreluješ, korelujeme

V aplikacích Trends a Insights hledáte popularitu vybraných slov a skupin slov ve vyhledávači. V Google Correlate hledáte různé výrazy se vzájemnou korelací – vztahem a podobnou strukturou zájmu o daný termín v čase a Googlu.

Může to znít složitě, je to ale v podstatě statistická „banalita“. Představte si třeba časovou křivku popularity slova „Bush“ v Googlu. G. W. Bush už není delší dobu v Bílém domě, zájem o tento termín ve vyhledávači tedy klesá a vy si jistě dokážete představit pravděpodobný tvar této křivky. Pokud „Bushe“ zadáte do aplikace Correlate, Google najde ta anglická slova na americkém Googlu, o která byl v čase podobný zájem, tedy jejichž křivka zájmu má co nejpodobnější tvar (z hlediska matematické statistiky se hodnota korelačního koeficientu blíží 1).

Klepněte pro větší obrázek 
Zájem o slovo Prague u Američanu klesá, podstatou Correlate je ale zjistit ostatní hledané termíny s co nejpodobnější křivkou a tedy možná i s nějakou faktickou/časovou souvislostí

Související výrazy podle ručně nakreslené křivky

Tím to ovšem nekončí. Vy totiž nemusíte hledat pouze podobně populární termíny vůči tomu výchozímu, ale můžete naopak hledat i ty výrazy, jejichž křivka popularity se podobá trajektorii, kterou ručně nakreslíte, případně vyjádříte tabelovanými daty (integrovaný tabulkový editor a import dat z CSV).

 

Co také zjistíte korelací podle uživatelské křivky?

  • Sezónnost – nakreslete/vygenerujte sinusoidu s amplitudou třeba v létě
  • „Mrtvoly“ – křivka s vrcholem v roce 2004 až 2006 a s minimem v roce 2008
  • „Exoty“ – křivka po celou dobu na nule a s jediným krátkým výstřelkem v roce 2008
 


A teď už to začíná být skutečně zajímavé, protože si třeba nakreslíte křivku popularity, která byla na vrcholu v roce 2004 a pak strmě klesala na pomyslnou nulu. Z takového zadání vám pak Google předhodí termíny, které Američané před sedmi lety hledali den co den a dnes už jsou v zapomnění. Zjistíte, že do této skupiny patří z těch technologických témat třeba AOL Messenger.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Hledání korelace přímou kresbou – nejprve nakreslete křivku a Googlu sám zjistí slova, jejichž křivka popularity se podobá co nejvíce (korelační koeficient blízký hodnotě 1). V tomto grafu se tedy jedná o slova, která byla v prvních letech 21. století na svém vrcholu, dnes o ně ale už nikdo nezavadí. Patří sem texty country skladeb, Pocket PC a nikoho už nezajímají ani opilí cyklisti – tedy přinejmenším v USA

Google Correlate je zajímavý statistický nástroj, který poměrně dramaticky rozšiřuje volně dostupné analytické programy Googlu. V úvahu ale bere pouze anglický vyhledávač, takže rovnou zapomeňte na české termíny (resp. na české termíny zasazené do tuzemského kontextu).

Klepněte pro větší obrázek  Klepněte pro větší obrázek
V tomto případě jsem modelovou křivku nenakreslil, ale sestrojil z tabelovaných dat. Jedná se o úplňky v roce 2010. Křivka má za běžných okolností nulové hodnoty (žádný zájem o hledané výrazy), ale o úplňcích strmě vystřelí vzhůru. Jaká slova takové křivce odpovídají? No pochopitelně ta, která Američané v obrovské míře hledali právě ve dnech, kdy byl Měsíc na obloze zcela kulatý.

 

Témata článku: Technologie, Google, Statistiky, Statistika, Bush, 500Px

5 komentářů

Nejnovější komentáře

  • V0174 27. 5. 2011 10:06:48
    Mně zaujala vysoká korelace "Czech Republic" s "map of Angola" a "jamaica...
  • dokola 26. 5. 2011 18:50:12
    Pěkný ...takovéhle článečky, které upozorní na něco zajímavého mám rád.
  • Martin Hruška 26. 5. 2011 17:07:21
    "Full moon love spells" Pomoc. Hloupé je, že to nedává žádné výsledky...
reklama
Určitě si přečtěte

Microsoft: Zbavte se už konečně zastaralých a děravých Windows 7

Microsoft: Zbavte se už konečně zastaralých a děravých Windows 7

** Microsoft pomalu začíná kritizovat svůj nejpopulárnější OS ** Chce konečně dostat podniky na Desítky ** Bezpečnostní podpora Sedmiček vydrží ještě necelé tři roky

17.  1.  2017 | Jakub Čížek | 406

Český státní blacklist už funguje. Ministerstvo financí se pochlubilo s detaily

Český státní blacklist už funguje. Ministerstvo financí se pochlubilo s detaily

** Dva týdny po Novém roce zajím zeje prázdnotou ** Ministerstvo vydalo metodický pokyn ** Takhle to bude fungovat v praxi

16.  1.  2017 | Jakub Čížek | 49

8 produktů, o kterých byste neřekli, že nesou značku Apple

8 produktů, o kterých byste neřekli, že nesou značku Apple

** Věděli jste, že Apple vyvinul celkem 45 modelů tiskáren? ** ** Monitor na výšku, plotter nebo herní konzole - to vše měl Apple ve své nabídce ** Většinu z těchto produktů pohřbil Steve Jobs

19.  1.  2017 | Stanislav Janů | 42

Umělá inteligence dokáže ze snímků srdce předpovědět, kdy zemřete

Umělá inteligence dokáže ze snímků srdce předpovědět, kdy zemřete

** Strojové učení lze skvěle použít pro vylepšení modelů pro předpověď srdečních komplikací ** Nová technologie umožňuje přesněji určit rizikové pacienty ** Dřívější diagnostika může díky včasně léčbě do budoucna zachránit životy

Včera | Karel Javůrek | 6


Aktuální číslo časopisu Computer

99 nejlepších programů pro váš počítač

Zvykejte si na umělou inteligenci

Velké testy PC zdrojů a gamepadů

Alternativní zdroje energie

reklama
reklama