Bude umět Google předvídat budoucnost?

Trends a Insights for Search podávají přehled o tom, co se zrovna hledá na Googlu. Co když by ale nabídly i prognózu dalšího vývoje a lze tato data projektovat do skutečného světa?
Bude umět Google předvídat budoucnost?

Pokud vezmete v úvahu všechny přípojné body do internetu včetně mamutích asijských kaváren a mobilních telefonů, surfuje dnes na internetu a webu více než jeden a půl miliardy obyvatel planety. To je obrovské číslo už samo o sobě. A teď si představte, že každý šestý z nich má svůj účet na Facebooku a pak je tu ještě obrovská armáda mikrobloggerů, kteří používají Twitter, FriendFeed, píší blogy, žurnály, prostě se realizují. Když je ve středu Evropy noc, bloguje se v Asii a Americe a když odbije dvanáctá tam, probouzí se do kybersvěta pro změnu starý kontinent.

Nedávné průzkumy sice ukázaly, že to s tou sociální interakcí zase tak horké není a na takovém Twitteru je především obrovské množství tichých posluchačů, jisté je ovšem to, že se web každý den rozroste o tři miliardy nových webových stránek (správně řečeno webových adres) a terabajty stavových zpráviček, fotek a videí.

To je obrovská suma informací o nás samých ale také o naší společnosti. Ten, kdo by to kvantum vědění dokázal v reálném čase analyzovat a interpretovat, by se tedy možná cítil jako filmový Connor MacLeod z kultovního snímku Highlander. Věděl by, co si lidstvo myslí.

Více k tématu:

Trends a Insights to ví

V reálném světě naštěstí nemusíte nikomu sekat hlavy, je tu totiž Google a jeho nástroje Trends a především Insights for Search, který se nedávno dočkal několika zajímavých vylepšení. Obě služby analyzují aktivitu na stejnojmenném vyhledávači. Pokud tedy zadáte do Googlu termín „pivo“ a společně s vámi tak třeba v srpnu učiní další milion Čechů, na časové ose Trends vystřelí trendová křivka k výšinám a vy se dozvíte, že byl v srpnu v Česku zájem o pivo.

Trends a Insights jsou aplikace, které analyzují chování návštěvníků vyhledávače, neřeknou vám tedy nic o tom, co se nehledá na Googlu. Google je ale globální a společně s dalšími světovými vyhledávači se pomalu stává novým standardem na poli přístupu k informacím. Musím se přiznat, že i já už Google používám jako „adresní řádek“, čemuž mě ostatně učí i prohlížeč Chrome, jehož autoři chytře integrovali adresní řádek s vyhledávacím polem, které je dnes součástí snad každého populárního prohlížeče. Když ale máte vše pohromadě, brzy přestanete rozlišovat mezi výrazem pro vyhledávač a webovou adresou a velmi rychle si zvyknete přestat používat URL adresy a začnete zadávat rovnou názvy webů nebo klíčová slova. Už tedy nenapíšu URL www.hradkarlstejn.cz, protože tuto adresu beztak neznám, ale napíšu rovnou to, co mě skutečně zajímá, tedy „hrad Karlštejn“.

Jistě, to přeci není nic nového, jde tu ale o to, že jsem tím pádem použil Google a ten si rázem může započítat nový úlovek do svých statistik. Stal se pro mě skutečnou a absolutní branou do World Wide Webu a já ke všemu nevědomky zpřesnil relevanci jeho trendových analýz.

Lze výsledky z Trends aplikovat na skutečný svět?

Vraťme se ale nyní zpět ke Connorovi MacLeodovi a výstupům z Trends a Insights. Skutečně má Trends nebo Insights nějakou relevanci? Dá se vlastně to, že se něco něco vyhledává častěji, interpretovat tak, že to je v něčem lepší nebo že se to lépe prodává? Vzhledem k obrovským počtům vyhledávání na Googlu by tomu tak být mělo, protože statistický vzorek je obrovský – statisticky reprezentativní. Bez skutečného porovnání by to ale i tak byla jen hypotéza. Hyunyoung Choi a Hal Varian, dva statistici z Googlu, se tedy rozhodli proměnit hypotézu v teorii a tu snad jednou v praktický matematický model. Prošli si podrobné výsledky z Google Trends, tedy analýzu toho, co lidé na Googlu hledají, a pokusili se nalézt nějakou smysluplnou korelaci se statistikami skutečných prodejů.

Jejich výpočty zde nemá smysl rekapitulovat, najdete je totiž v několikastránkové studii, kterou zveřejnili na webu (PDF), za ukázku ale stojí některé grafy, které vypovídají o tom, na co vlastně mladí matematikové přišli. Nebudu vás napínat, přišli na to, že výsledky Trends v několika exemplárních případech skutečně odpovídají ekonomické realitě a docela přesně.

Klepněte pro větší obrázek
Skutečné prodeje automobilů v USA a čísla z Google Trends (červeně)

Na obrázku výše se můžete podívat na prodeje Chevroletů a Toyot v USA v letech 2004 až 2009. V levém sloupci červená linka odpovídá zájmu návštěvníků Googlu o termín Chevrolet a Toyota. Je patrné, že zájem ve vyhledávači odpovídá i několika skutečným prodejním špičkám vždy v létě.

Zajímavější je ale pravý sloupec, ve kterém Choi a Varian přepočítali zájem na skutečný prodej a ejhle, obě trajektorie se k sobě rázem přiblížily a v případě prodeje Chevroletů v roce 2006 modelovaná čísla Trends, tedy pouhý záznam popularity vyhledávaných slov na Googlu, téměř dokonale odpovídají realitě.

Klepněte pro větší obrázek
Turisté v Hongkongu z několika zemí a čísla matematického modelu (červeně)

Dalším příkladem matematického modelu je statistika příslušného turistického úřadu v Hongkongu. Ten eviduje příchozí turisty podle země původu. Choi a Varian tedy protentokrát tato čísla srovnali s vyhledáváním Hongkongu jako turistické destinace v několika zemích za posledních pět let a opět tento vyhledávací zájem převedli na reálnou návštěvu. Výsledek na obrázku výše mluví za vše.

Budeme umět předvídat body zlomu?

Podobné matematické modely jsou samozřejmě teprve na začátku a Choi s Varianem v závěrečné zprávě konstatují, že bude třeba teprve prozkoumat, jestli lze pomocí Google Trends odhadnout třeba bod zlomu, kdy křivka rázem změní směr, což by samozřejmě mohlo mít v případě úspěchu docela zajímavé ekonomické důsledky – představte si například, že by podobný vylepšený model postavený nad Trends daty dokázal odhadnout, že příští měsíc s určitou mírou pravděpodobnosti klesne poptávka po automobilech značky Toyota. To je ale zatím pouhé sci-fi a několik výpočtů na papíře.

Insights „předvídá“ už dnes

Praxe je tedy zatím diametrálně odlišná, přesto však Google před několika dny začal skutečně předvídat. Nejedná se ovšem o nějaký skvělý matematický model ale o pouhou extrapolaci na základě historických čísel. V případě našeho „piva“ se tedy pouze dozvíte, že o něj u nás s největší pravděpodobností klesne zájem na podzim a v zimě, příští horké léto roku 2010 však podle Googlu opět slibuje skvělé tržby.

Klepněte pro větší obrázek
Insights for Search a prognóza pro popularitu piva na českém Googlu

Google tedy jak vidno zatím odmítá živou analýzu indexovaného obsahu a spoléhá ve svůj vyhledávač, který každý den zaznamená stovky milionů přístupů (podle Alexy 510 mil. návštěvníků a 4,5 miliardy zobrazení na celé doméně google.com). Ostatně jiné cesty v současné době ani není, web samotný je totiž natolik rozsáhlý a natolik dynamický, že je prakticky nemožné analyzovat jeho aktuální obraz. Tuto nemožnost dokládá i fakt, že dodnes nevíme, jak je vlastně World Wide Web veliký, pouze odhadujeme a to včetně Googlu samotného.

Bude se zítra číst Živě.cz?

Na internetu je ale naštěstí tolik lidí, že nemusíte odhadovat na základě přesných čísel. Nemusíte znát názor několika miliard lidí. Stačí znát náladu několika desítek milionů z nich, stačí prozkoumat jejich blogy, Twittery, Facebooky a fráze, které hledají na Googlu a rázem se dozvíte, jaká bude zítra nálada na trhu.

Možná se to dozvíme za deset let, možná se tak daleko v matematických modelech nedostaneme nikdy. Otázkou zůstává, jestli to vlastně vůbec chceme vědět.

Diskuze (27) Další článek: Nová Opera 10.1 s webovým serverem Opera Unite

Témata článku: Google, Internet, Budoucnost, Web, Vyhledávače, Hypotéza, Statistický vzorek, Toyota, Vyhledávaný text, Absolutní špička, Google+, Chevrolet, Horké léto, Pravý sloupec, Relevance, Nový úlovek, Bude, Skutečný svět, Živý snímek, Search for, Highlander, Hongkong, Matematický model, Skvělý výsledek, Obrovská suma



Lék proti depresi za stokorunu snižuje riziko těžkého průběhu i úmrtí na onemocnění covid-19

Lék proti depresi za stokorunu snižuje riziko těžkého průběhu i úmrtí na onemocnění covid-19

** Klinická studie zkoumala vliv antidepresiva fluvoxamin na covid-19 ** Počet úmrtí souvisejících s covidem-19 klesl zhruba o 90 % ** Potřeba intenzivní lékařské péče se snížila zhruba o 65 %

Karel Kilián
COVID-19LékyDepreseMedicína
Švýcaři legalizovali sebevražednou kapsli Sarco vytištěnou na 3D tiskárně

Švýcaři legalizovali sebevražednou kapsli Sarco vytištěnou na 3D tiskárně

** Firma Exit International chce usnadnit proces asistované sebevraždy ** Jako řešení nabízí „kapsli“ Sarco vytištěnou na 3D tiskárně ** S důstojným odchodem pomůže dusík a umělá inteligence

Karel Kilián
ŠvýcarskoSebevraždaTechnologie
Jak rozmazat dům, aby vás sousedi nemohli šmírovat. Jde to v Mapách Google i na Mapy.cz

Jak rozmazat dům, aby vás sousedi nemohli šmírovat. Jde to v Mapách Google i na Mapy.cz

** Nelibí se vám, když cizí lidé okukují váš dům? ** Všechny mapové aplikace nabízejí možnost rozmazání snímku ** Máme návod pro Apple Maps, Bing Maps, Mapy Google a Mapy.cz

Karel Kilián
SoukromíNávodyMapy
Nad 3,5mm jackem se smráká. Sluchátkový konektor příští rok nejspíš zmizí i z levných telefonů

Nad 3,5mm jackem se smráká. Sluchátkový konektor příští rok nejspíš zmizí i z levných telefonů

** Před pár lety byl 3,5mm konektor nepsaným základem každého telefonu ** Od premiéry iPhonu 7 to však jde s jackem strmě z kopce ** U drahých telefonů chybí úplně a začíná mizet i z modelů střední třídy

Martin Chroust
Střední třída3,5mm jack
Nejpirátěnější filmy: Co se teď nejvíc stahuje (aktualizace prosinec 2021)

Nejpirátěnější filmy: Co se teď nejvíc stahuje (aktualizace prosinec 2021)

Vzali jsme týdenní přehledy nejstahovanějších filmů, které se objevují na torrentech, a spojili je do jednoho žebříčku. Tohle jsou aktuálně filmy, o které je na světě největší zájem, které se nejvíc pirátí.

Ondřej Králík
Filmy a seriály
Tohle nejsou Jedenáctky, ale Linux. Windowsfx 11 opisuje opravdu důkladně
Lukáš Václavík
Windows 11Operační systémyLinux
Recenze Windows 11. Microsoft nás opíjí rohlíkem a omezuje použitelnost

Recenze Windows 11. Microsoft nás opíjí rohlíkem a omezuje použitelnost

** Oproti Desítkám významně stouply hardwarové požadavky ** Windows 11 mají nový vzhled, ale výrazně narušují workflow. ** Potěší vyhledávání, multitasking i rychlejší aktualizace

Petr Urban
Windows 11Testy