Google Correlate: sen každého webového statistika a analytika

Google za posledních několik let sesbíral skrze svůj vyhledávač ohromné množství dat. S nimi si pak může každý hrát třeba v nástrojích Google Trends a Google Insights for Search. Nabídka statistických hraček se včera rozšířila ještě o jeden kus – Google Correlate. Zatím běží pouze na inkubátoru Google Labs a pracuje pouze s daty z anglického/univerzálního Googlu, ale umí to, co ostatní vyhledávače nenabízejí.

Koreluji, koreluješ, korelujeme

V aplikacích Trends a Insights hledáte popularitu vybraných slov a skupin slov ve vyhledávači. V Google Correlate hledáte různé výrazy se vzájemnou korelací – vztahem a podobnou strukturou zájmu o daný termín v čase a Googlu.

Může to znít složitě, je to ale v podstatě statistická „banalita“. Představte si třeba časovou křivku popularity slova „Bush“ v Googlu. G. W. Bush už není delší dobu v Bílém domě, zájem o tento termín ve vyhledávači tedy klesá a vy si jistě dokážete představit pravděpodobný tvar této křivky. Pokud „Bushe“ zadáte do aplikace Correlate, Google najde ta anglická slova na americkém Googlu, o která byl v čase podobný zájem, tedy jejichž křivka zájmu má co nejpodobnější tvar (z hlediska matematické statistiky se hodnota korelačního koeficientu blíží 1).

Klepněte pro větší obrázek 
Zájem o slovo Prague u Američanu klesá, podstatou Correlate je ale zjistit ostatní hledané termíny s co nejpodobnější křivkou a tedy možná i s nějakou faktickou/časovou souvislostí

Související výrazy podle ručně nakreslené křivky

Tím to ovšem nekončí. Vy totiž nemusíte hledat pouze podobně populární termíny vůči tomu výchozímu, ale můžete naopak hledat i ty výrazy, jejichž křivka popularity se podobá trajektorii, kterou ručně nakreslíte, případně vyjádříte tabelovanými daty (integrovaný tabulkový editor a import dat z CSV).

 

Co také zjistíte korelací podle uživatelské křivky?

  • Sezónnost – nakreslete/vygenerujte sinusoidu s amplitudou třeba v létě
  • „Mrtvoly“ – křivka s vrcholem v roce 2004 až 2006 a s minimem v roce 2008
  • „Exoty“ – křivka po celou dobu na nule a s jediným krátkým výstřelkem v roce 2008
 


A teď už to začíná být skutečně zajímavé, protože si třeba nakreslíte křivku popularity, která byla na vrcholu v roce 2004 a pak strmě klesala na pomyslnou nulu. Z takového zadání vám pak Google předhodí termíny, které Američané před sedmi lety hledali den co den a dnes už jsou v zapomnění. Zjistíte, že do této skupiny patří z těch technologických témat třeba AOL Messenger.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Hledání korelace přímou kresbou – nejprve nakreslete křivku a Googlu sám zjistí slova, jejichž křivka popularity se podobá co nejvíce (korelační koeficient blízký hodnotě 1). V tomto grafu se tedy jedná o slova, která byla v prvních letech 21. století na svém vrcholu, dnes o ně ale už nikdo nezavadí. Patří sem texty country skladeb, Pocket PC a nikoho už nezajímají ani opilí cyklisti – tedy přinejmenším v USA

Google Correlate je zajímavý statistický nástroj, který poměrně dramaticky rozšiřuje volně dostupné analytické programy Googlu. V úvahu ale bere pouze anglický vyhledávač, takže rovnou zapomeňte na české termíny (resp. na české termíny zasazené do tuzemského kontextu).

Klepněte pro větší obrázek  Klepněte pro větší obrázek
V tomto případě jsem modelovou křivku nenakreslil, ale sestrojil z tabelovaných dat. Jedná se o úplňky v roce 2010. Křivka má za běžných okolností nulové hodnoty (žádný zájem o hledané výrazy), ale o úplňcích strmě vystřelí vzhůru. Jaká slova takové křivce odpovídají? No pochopitelně ta, která Američané v obrovské míře hledali právě ve dnech, kdy byl Měsíc na obloze zcela kulatý.

 

Témata článku: Google, Technologie, Statistiky, Statistika, Sen, Google+, Search for, Křivka, Bílý dům, Podobná hodnota, Cyklista, Bush, 500Px

Určitě si přečtěte

Dnes je Black Friday: Přehled slev na elektroniku a počítače

Dnes je Black Friday: Přehled slev na elektroniku a počítače

** Začala slevová mánie zvaná Black Friday ** Pozor, ne všechny slevy jsou opravdu výhodné ** Průběžně sledujeme slevové akce v počítačových e-shopech

22.  11.  2017 | David Polesný | 37

Google Mapy mají nový design. Líbí se vám víc než předchozí? Tady je srovnání

Google Mapy mají nový design. Líbí se vám víc než předchozí? Tady je srovnání

** Nový design Google Map přijde na počítače i mobilní telefony. ** Zaměřuje se na zvýraznění konkrétních míst, mapové podklady jsou mnohdy upozaděné. ** Lépe pracuje s chráněnými oblastmi a parky.

20.  11.  2017 | Vladislav Kluska | 30

Microsoftu se invaze na Android daří, jeho launcher aktivně používá přes milion lidí

Microsoftu se invaze na Android daří, jeho launcher aktivně používá přes milion lidí

** Microsoft se zabydluje na platformě Android ** Nedávno představený launcher už používá milion uživatelů ** Je to stále jen zanedbatelný zlomek uživatelů Androidu, ale slibný růst

22.  11.  2017 | Vladislav Kluska | 35

Co je to láska? Milujeme se pouze kvůli chemickým látkám, nebo je v tom něco víc?

Co je to láska? Milujeme se pouze kvůli chemickým látkám, nebo je v tom něco víc?

** Co je to vlastně láska? Dá se vysvětlit vědecky? ** Výzkum ukázal, že zamilovaní jedinci mají mj. zvýšenou hladinu fenyletylaminu a množství testosteronu ** Je ale rozdíl mezi zamilovaností a láskou

21.  11.  2017 | Vojtěch Malý | 23


Aktuální číslo časopisu Computer

Otestovali jsme 5 HDR 4K televizorů

Jak natáčet video zrcadlovkou

Vytvořte si chytrou domácnost

Radíme s koupí počítačového zdroje