Google Correlate: sen každého webového statistika a analytika

Google za posledních několik let sesbíral skrze svůj vyhledávač ohromné množství dat. S nimi si pak může každý hrát třeba v nástrojích Google Trends a Google Insights for Search. Nabídka statistických hraček se včera rozšířila ještě o jeden kus – Google Correlate. Zatím běží pouze na inkubátoru Google Labs a pracuje pouze s daty z anglického/univerzálního Googlu, ale umí to, co ostatní vyhledávače nenabízejí.

Koreluji, koreluješ, korelujeme

V aplikacích Trends a Insights hledáte popularitu vybraných slov a skupin slov ve vyhledávači. V Google Correlate hledáte různé výrazy se vzájemnou korelací – vztahem a podobnou strukturou zájmu o daný termín v čase a Googlu.

Může to znít složitě, je to ale v podstatě statistická „banalita“. Představte si třeba časovou křivku popularity slova „Bush“ v Googlu. G. W. Bush už není delší dobu v Bílém domě, zájem o tento termín ve vyhledávači tedy klesá a vy si jistě dokážete představit pravděpodobný tvar této křivky. Pokud „Bushe“ zadáte do aplikace Correlate, Google najde ta anglická slova na americkém Googlu, o která byl v čase podobný zájem, tedy jejichž křivka zájmu má co nejpodobnější tvar (z hlediska matematické statistiky se hodnota korelačního koeficientu blíží 1).

Klepněte pro větší obrázek 
Zájem o slovo Prague u Američanu klesá, podstatou Correlate je ale zjistit ostatní hledané termíny s co nejpodobnější křivkou a tedy možná i s nějakou faktickou/časovou souvislostí

Související výrazy podle ručně nakreslené křivky

Tím to ovšem nekončí. Vy totiž nemusíte hledat pouze podobně populární termíny vůči tomu výchozímu, ale můžete naopak hledat i ty výrazy, jejichž křivka popularity se podobá trajektorii, kterou ručně nakreslíte, případně vyjádříte tabelovanými daty (integrovaný tabulkový editor a import dat z CSV).

 

Co také zjistíte korelací podle uživatelské křivky?

  • Sezónnost – nakreslete/vygenerujte sinusoidu s amplitudou třeba v létě
  • „Mrtvoly“ – křivka s vrcholem v roce 2004 až 2006 a s minimem v roce 2008
  • „Exoty“ – křivka po celou dobu na nule a s jediným krátkým výstřelkem v roce 2008
 


A teď už to začíná být skutečně zajímavé, protože si třeba nakreslíte křivku popularity, která byla na vrcholu v roce 2004 a pak strmě klesala na pomyslnou nulu. Z takového zadání vám pak Google předhodí termíny, které Američané před sedmi lety hledali den co den a dnes už jsou v zapomnění. Zjistíte, že do této skupiny patří z těch technologických témat třeba AOL Messenger.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Hledání korelace přímou kresbou – nejprve nakreslete křivku a Googlu sám zjistí slova, jejichž křivka popularity se podobá co nejvíce (korelační koeficient blízký hodnotě 1). V tomto grafu se tedy jedná o slova, která byla v prvních letech 21. století na svém vrcholu, dnes o ně ale už nikdo nezavadí. Patří sem texty country skladeb, Pocket PC a nikoho už nezajímají ani opilí cyklisti – tedy přinejmenším v USA

Google Correlate je zajímavý statistický nástroj, který poměrně dramaticky rozšiřuje volně dostupné analytické programy Googlu. V úvahu ale bere pouze anglický vyhledávač, takže rovnou zapomeňte na české termíny (resp. na české termíny zasazené do tuzemského kontextu).

Klepněte pro větší obrázek  Klepněte pro větší obrázek
V tomto případě jsem modelovou křivku nenakreslil, ale sestrojil z tabelovaných dat. Jedná se o úplňky v roce 2010. Křivka má za běžných okolností nulové hodnoty (žádný zájem o hledané výrazy), ale o úplňcích strmě vystřelí vzhůru. Jaká slova takové křivce odpovídají? No pochopitelně ta, která Američané v obrovské míře hledali právě ve dnech, kdy byl Měsíc na obloze zcela kulatý.

 

Témata článku: Technologie, Google, Statistiky, Statistika, Bush, 500Px, Search for

5 komentářů

Nejnovější komentáře

  • V0174 27. 5. 2011 10:06:48
    Mně zaujala vysoká korelace "Czech Republic" s "map of Angola" a "jamaica...
  • dokola 26. 5. 2011 18:50:12
    Pěkný ...takovéhle článečky, které upozorní na něco zajímavého mám rád.
  • Martin Hruška 26. 5. 2011 17:07:21
    "Full moon love spells" Pomoc. Hloupé je, že to nedává žádné výsledky...
Určitě si přečtěte

Jak vybrat monitor k počítači: nenechte se zlákat nepodstatnými parametry

Jak vybrat monitor k počítači: nenechte se zlákat nepodstatnými parametry

** Na jaké parametry se zaměřit a kde vás výrobci chtějí nachytat ** Monitory se stále více specifikují pro konkrétní určení ** Náročný hráč nebo profesionální grafik mají různé požadavky

20.  6.  2017 | Tomáš Holčík | 32

Dlouhodobý test HTC Vive: co vám recenze o virtuální realitě neřeknou

Dlouhodobý test HTC Vive: co vám recenze o virtuální realitě neřeknou

** Ani hry se sebelepší grafikou vás nevtáhnou tolik, jako ve virtuální realitě ** Pro sledování filmů není VR ani zdaleka ideální ** I první generace je skvělá, stále však působí jako prototyp

20.  6.  2017 | Stanislav Janů | 22

Pojďme programovat elektroniku: Postavíme si titěrnou Wi-Fi meteostanici s lepším teploměrem než Netatmo

Pojďme programovat elektroniku: Postavíme si titěrnou Wi-Fi meteostanici s lepším teploměrem než Netatmo

** Dnes se podíváme na maličkou Wi-Fi destičku Wemos D1 mini ** A připojíme k ní barometrický a teplotní shield ** Poběží na ní web a nabídne i JSON API

18.  6.  2017 | Jakub Čížek | 28

Jak unikají informace o nových iPhonech? Třeba podprsenkami čínských pracovnic

Jak unikají informace o nových iPhonech? Třeba podprsenkami čínských pracovnic

** Na černém trhu mohou zaměstnanci továren za kradené součástky inkasovat částku ve výši ročního platu ** Velké množství informací je vyneseno i z centrály Applu ** Díly jsou pašovány v botách, podprsenkách i odpadem

21.  6.  2017 | Stanislav Janů | 24

11 tipů, jak efektivně a přesně sledovat počasí pomocí internetu

11 tipů, jak efektivně a přesně sledovat počasí pomocí internetu

** Sledujte počasí z více zdrojů a podrobněji, přesněji tak určíte, jaké počasí vás potká na dovolené ** Na webu najdete hromadu pokročilých předpovědí počasí, ale i specializované meteorologické služby ** Vybrali jsme 14 služeb na počasí, které se vám můžou hodit

23.  6.  2017 | Jakub Čížek | 18


Aktuální číslo časopisu Computer

Bojujeme proti Fake News

Dva velké testy: fotoaparáty a NASy

Co musíte vědět o změně evropského roamingu

Radíme s výběrem základní desky