Trends a Insights for Search podávají přehled o tom, co se zrovna hledá na Googlu. Co když by ale nabídly i prognózu dalšího vývoje a lze tato data projektovat do skutečného světa?
Pokud vezmete v úvahu všechny přípojné body do internetu včetně mamutích asijských kaváren a mobilních telefonů, surfuje dnes na internetu a webu více než jeden a půl miliardy obyvatel planety. To je obrovské číslo už samo o sobě. A teď si představte, že každý šestý z nich má svůj účet na Facebooku a pak je tu ještě obrovská armáda mikrobloggerů, kteří používají Twitter, FriendFeed, píší blogy, žurnály, prostě se realizují. Když je ve středu Evropy noc, bloguje se v Asii a Americe a když odbije dvanáctá tam, probouzí se do kybersvěta pro změnu starý kontinent.
Nedávné průzkumy sice ukázaly, že to s tou sociální interakcí zase tak horké není a na takovém Twitteru je především obrovské množství tichých posluchačů, jisté je ovšem to, že se web každý den rozroste o tři miliardy nových webových stránek (správně řečeno webových adres) a terabajty stavových zpráviček, fotek a videí.
To je obrovská suma informací o nás samých ale také o naší společnosti. Ten, kdo by to kvantum vědění dokázal v reálném čase analyzovat a interpretovat, by se tedy možná cítil jako filmový Connor MacLeod z kultovního snímku Highlander. Věděl by, co si lidstvo myslí.
Více k tématu:
Trends a Insights to ví
V reálném světě naštěstí nemusíte nikomu sekat hlavy, je tu totiž Google a jeho nástroje Trends a především Insights for Search, který se nedávno dočkal několika zajímavých vylepšení. Obě služby analyzují aktivitu na stejnojmenném vyhledávači. Pokud tedy zadáte do Googlu termín „pivo“ a společně s vámi tak třeba v srpnu učiní další milion Čechů, na časové ose Trends vystřelí trendová křivka k výšinám a vy se dozvíte, že byl v srpnu v Česku zájem o pivo.
Trends a Insights jsou aplikace, které analyzují chování návštěvníků vyhledávače, neřeknou vám tedy nic o tom, co se nehledá na Googlu. Google je ale globální a společně s dalšími světovými vyhledávači se pomalu stává novým standardem na poli přístupu k informacím. Musím se přiznat, že i já už Google používám jako „adresní řádek“, čemuž mě ostatně učí i prohlížeč Chrome, jehož autoři chytře integrovali adresní řádek s vyhledávacím polem, které je dnes součástí snad každého populárního prohlížeče. Když ale máte vše pohromadě, brzy přestanete rozlišovat mezi výrazem pro vyhledávač a webovou adresou a velmi rychle si zvyknete přestat používat URL adresy a začnete zadávat rovnou názvy webů nebo klíčová slova. Už tedy nenapíšu URL www.hradkarlstejn.cz, protože tuto adresu beztak neznám, ale napíšu rovnou to, co mě skutečně zajímá, tedy „hrad Karlštejn“.
Jistě, to přeci není nic nového, jde tu ale o to, že jsem tím pádem použil Google a ten si rázem může započítat nový úlovek do svých statistik. Stal se pro mě skutečnou a absolutní branou do World Wide Webu a já ke všemu nevědomky zpřesnil relevanci jeho trendových analýz.
Lze výsledky z Trends aplikovat na skutečný svět?
Vraťme se ale nyní zpět ke Connorovi MacLeodovi a výstupům z Trends a Insights. Skutečně má Trends nebo Insights nějakou relevanci? Dá se vlastně to, že se něco něco vyhledává častěji, interpretovat tak, že to je v něčem lepší nebo že se to lépe prodává? Vzhledem k obrovským počtům vyhledávání na Googlu by tomu tak být mělo, protože statistický vzorek je obrovský – statisticky reprezentativní. Bez skutečného porovnání by to ale i tak byla jen hypotéza. Hyunyoung Choi a Hal Varian, dva statistici z Googlu, se tedy rozhodli proměnit hypotézu v teorii a tu snad jednou v praktický matematický model. Prošli si podrobné výsledky z Google Trends, tedy analýzu toho, co lidé na Googlu hledají, a pokusili se nalézt nějakou smysluplnou korelaci se statistikami skutečných prodejů.
Jejich výpočty zde nemá smysl rekapitulovat, najdete je totiž v několikastránkové studii, kterou zveřejnili na webu (PDF), za ukázku ale stojí některé grafy, které vypovídají o tom, na co vlastně mladí matematikové přišli. Nebudu vás napínat, přišli na to, že výsledky Trends v několika exemplárních případech skutečně odpovídají ekonomické realitě a docela přesně.
Skutečné prodeje automobilů v USA a čísla z Google Trends (červeně)
Na obrázku výše se můžete podívat na prodeje Chevroletů a Toyot v USA v letech 2004 až 2009. V levém sloupci červená linka odpovídá zájmu návštěvníků Googlu o termín Chevrolet a Toyota. Je patrné, že zájem ve vyhledávači odpovídá i několika skutečným prodejním špičkám vždy v létě.
Zajímavější je ale pravý sloupec, ve kterém Choi a Varian přepočítali zájem na skutečný prodej a ejhle, obě trajektorie se k sobě rázem přiblížily a v případě prodeje Chevroletů v roce 2006 modelovaná čísla Trends, tedy pouhý záznam popularity vyhledávaných slov na Googlu, téměř dokonale odpovídají realitě.
Turisté v Hongkongu z několika zemí a čísla matematického modelu (červeně)
Dalším příkladem matematického modelu je statistika příslušného turistického úřadu v Hongkongu. Ten eviduje příchozí turisty podle země původu. Choi a Varian tedy protentokrát tato čísla srovnali s vyhledáváním Hongkongu jako turistické destinace v několika zemích za posledních pět let a opět tento vyhledávací zájem převedli na reálnou návštěvu. Výsledek na obrázku výše mluví za vše.
Budeme umět předvídat body zlomu?
Podobné matematické modely jsou samozřejmě teprve na začátku a Choi s Varianem v závěrečné zprávě konstatují, že bude třeba teprve prozkoumat, jestli lze pomocí Google Trends odhadnout třeba bod zlomu, kdy křivka rázem změní směr, což by samozřejmě mohlo mít v případě úspěchu docela zajímavé ekonomické důsledky – představte si například, že by podobný vylepšený model postavený nad Trends daty dokázal odhadnout, že příští měsíc s určitou mírou pravděpodobnosti klesne poptávka po automobilech značky Toyota. To je ale zatím pouhé sci-fi a několik výpočtů na papíře.
Insights „předvídá“ už dnes
Praxe je tedy zatím diametrálně odlišná, přesto však Google před několika dny začal skutečně předvídat. Nejedná se ovšem o nějaký skvělý matematický model ale o pouhou extrapolaci na základě historických čísel. V případě našeho „piva“ se tedy pouze dozvíte, že o něj u nás s největší pravděpodobností klesne zájem na podzim a v zimě, příští horké léto roku 2010 však podle Googlu opět slibuje skvělé tržby.
Google tedy jak vidno zatím odmítá živou analýzu indexovaného obsahu a spoléhá ve svůj vyhledávač, který každý den zaznamená stovky milionů přístupů (podle Alexy 510 mil. návštěvníků a 4,5 miliardy zobrazení na celé doméně google.com). Ostatně jiné cesty v současné době ani není, web samotný je totiž natolik rozsáhlý a natolik dynamický, že je prakticky nemožné analyzovat jeho aktuální obraz. Tuto nemožnost dokládá i fakt, že dodnes nevíme, jak je vlastně World Wide Web veliký, pouze odhadujeme a to včetně Googlu samotného.
Bude se zítra číst Živě.cz?
Na internetu je ale naštěstí tolik lidí, že nemusíte odhadovat na základě přesných čísel. Nemusíte znát názor několika miliard lidí. Stačí znát náladu několika desítek milionů z nich, stačí prozkoumat jejich blogy, Twittery, Facebooky a fráze, které hledají na Googlu a rázem se dozvíte, jaká bude zítra nálada na trhu.
Možná se to dozvíme za deset let, možná se tak daleko v matematických modelech nedostaneme nikdy. Otázkou zůstává, jestli to vlastně vůbec chceme vědět.