Víme, co bude. Známe totiž budoucnost

Predikční analýza – tedy předpovídání na základě velkého množství dat, nejčastěji z vyhledávačů a sociálních sítí – brzy vstoupí do fáze masového použití. Možnosti jsou úžasné.
Víme, co bude. Známe totiž budoucnost

Letos v květnu se pro investory otevřel první investiční fond, založený na analýze dat ze sociálních sítí. Konkrétně: analýze emocí v milionech zpráv na Twitteru. V ideálním případě dovede předpovědět vývoj na trhu na několik dní dopředu s téměř devadesátiprocentní přesností. V praxi? Uvidíme brzy.

V srpnu se v kalifornském městečku Santa Cruz policii podařilo zadržet dvě zlodějky přímo při vloupačce. Na první pohled banalita. Policejní hlášení ale tentokrát není vůbec nuda: strážníci byli na místě zločinu dřív, než k němu došlo. Díky sofistikovanému predikčnímu modelu dokázali odhadnout, že tohle je pro vykrádání ten správný den a ideální místo. Jak? Matematický model nakrmili obrovským množstvím dat, získaným z monitoringu rabování po velkých katastrofách. Podobný model používá třeba Los Angeles, v Chicagu dokonce vznikla policejní jednotka predikční analýzy. Výsledek? V Santa Cruz se meziročně snížil počet loupeží o 27 procent.

A teď v září se objevila odvážná teorie, která prý dovede předpovědět nepokoje nebo přímo revoluci. Statistický model tentokrát krmí několik milionů článků o daném regionu, posbíraných po celém světě. Z nich pak analytici shromažďují emoce a srovnávají je v čase. Když dojde k výraznému a dlouhodobému poklesu nálady, hrozí divokosti. Podle autorů teorie došlo v případě Egypta v posledních třiceti letech na tři blbé nálady – v roce 1991 při americkém bombardování Iráku, o dvanáct let později při začátku americké invaze do – překvapivě – opět Iráku, a naposled letos na jaře. Poslední krize přitom byla dlouhodobá, v grafu je zřetelná někdy od roku 2005.

Teorie je přitom v kontrastu s tvrzeními amerických expertů, kteří nepokoje, tím méně revoluci, nepředvídali. Nikoho z nich nenapadlo, že by se mohlo podařit svrhnout egyptského prezidenta Mubaraka. Proč? Protože za posledních třicet let se to nepodařilo nikomu. Logika, chycená v kruhu.

Klepněte pro větší obrázek
Gartner Hype Cycle: Které technologie jsou v očekávání?
Predikční analýza se ze Svahu osvícení blíží k Plošině produktivity

Jste statistický vrah

Připravenost technologií pro trh pomáhá od poloviny devadesátých let monitorovat společnost Gartner. Každý rok kreslí křivku, na které se technologie posunují od počátečního nekritického nadšení, přes následné zklamání z nesplněných očekávání, až po realistické zhodnocení a praxi. Gartner předchozí příklady jen potvrzuje – predikční analýza se už několik let rychle posunuje po křivce ke konci celého cyklu. Doba, kdy bude analýza dat masově využívaná k predikci, se odhaduje na méně než dva roky.

Technologicky je predikční analýza na spadnutí. Praktická omezení jsou dvě: je třeba shromáždit statisticky významné množství dat, které mají ke zkoumanému jevu příčinný vztah, a zbastlit superpočítač, který je dokáže dostatečně rychle zpracovat. S oběma komponentami zbývá najít dostatečně bláznivého investora, který věří na předpovídání budoucnosti a dokáže výsledky zpeněžit.

S tím souvisí i největší potenciální průšvih. Technologie vždy předbíhají etické a zákonné normy a predikční analýza není žádná výjimka. Vedle úžasných příležitostí skrývá i úžasná nebezpečí: stejně jako lze odhadnout, kdy a kde se odehraje zločin, lze také s vysokou pravděpodobností tipnout, kdo ho udělá. Stejně jako lze odhadnout, kdy dojde v určitém regionu k nepokojům, lze také odhadnout, kdo je povede a kdo se zúčastní. Teoreticky je to nesmírně jednoduché: do statistického modelu se nalijí data nebezpečných živlů ze sociálních sítí, v nich se najdou opakující se vzorce, ty se vzápětí srovnají s daty všech uživatelů sociálních sítí. Pokud se shodují vzorce ve vašich facebookových updatech a vzkazy masového vraha, co pak? Zatím jste sice žádný zločin nespáchali, ale je solidní šance, že byste mohli?

Technologická neutralita a pohádka o mašince

Praxe není o nic milosrdnější – sortování uživatelů Facebooku do skupin podle jejich online chování už loni vyzkoušela americká pojišťovna Aviva. Uživatelská data jí pomáhají určovat, zda není žadatel příliš riskantní a nepojistitelný. Bez velké pozornosti médií tak probíhá zajímavý experiment, podle pojišťovny velmi úspěšný: „model konzistentně vrací výsledky velmi blízké výsledkům tradičních metod“ a stojí dvacetinu standardních (fyzických) testů.

Co brání v masovém rozšíření podobných postupů? Jejich zneužití by měla zabránit rovnováha mocí, s respektovanými soudy, se spoustou závaží a pojistek, které systém udržují v rovnováze – krásný naleštěný stroj, který v pravidelném rytmu vypouští smysluplné zákony, jednou za čtyři roky ho naolejují voliči a případné závady mezitím opravuje veřejná kontrola. Tak vypadá politický ideál, tedy životaschopná liberální demokracie s politickou tradicí. Ve skutečnosti se po celém světě prohánějí prorezlé mašiny, ze kterých několika otvory uniká pára; pohromadě drží jen díky tomu, že mechanika je milosrdná. Postupující krize ekonomiky, médií a přemýšlení bohužel kvalitě demokracií napříč planetou dost ubližuje. Takže si raději nastavte ochranu soukromí na Facebooku na maximum.

Tento článek vyšel v časopisu Computer 18/11

Témata článku: Technologie, Budoucnost, Web, Sociální sítě, Statistiky, Santa Cruz, Chicago

23 komentářů

Nejnovější komentáře

  • portapro 28. 9. 2011 10:09:09
    Když jsem četl o tom jak byli dřív někde,než se tam někdo vloupal,nedíval...
  • Nargon 28. 9. 2011 0:48:01
    Takze zase mi to nerekne jaka cisla budou tazena v loterii. To je pro me...
  • Petr Rezek 28. 9. 2011 0:46:18
    Hariho Seldona s jeho psychohystorií asi ještě dlouho nikdo nedožene,...
Určitě si přečtěte

Nové úlovky kamer Googlu: Šmírovačka na Street View nepřestává bavit

Nové úlovky kamer Googlu: Šmírovačka na Street View nepřestává bavit

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

19.  5.  2017 | redakce | 38

To tu ještě nebylo. Specialisté ukázali, že zavirované mohou být i titulky SRT

To tu ještě nebylo. Specialisté ukázali, že zavirované mohou být i titulky SRT

** Stáhnete si film a titulky třeba z OpenSubtitles.org ** A osud vás za ten warez záhy potrestá ** Specialisté totiž ukázali, že i v titulcích může být schovaný virus

Včera | Jakub Čížek | 55

WannaCry se neměl vůbec rozšířit. Stačilo, abychom používali Windows Update

WannaCry se neměl vůbec rozšířit. Stačilo, abychom používali Windows Update

** WannaCry se masivně rozšířil kvůli zranitelnosti ve Windows ** Ta mu umožnila, aby se pokusil sám napadnout další počítače ** Jenže ta chyba už je dva měsíce opravená!

22.  5.  2017 | Jakub Čížek | 95

Nastal čas znovu vynalézt klávesnici. Anebo vám ta současná opravdu vyhovuje?

Nastal čas znovu vynalézt klávesnici. Anebo vám ta současná opravdu vyhovuje?

**Měli bychom provést revoluci klávesnice? ** Anebo je její dnes už hodně zastaralý koncept prostě nejlepší? ** Budeme na klávesnici odkázaní už navždy?

20.  5.  2017 | Jakub Čížek | 59


Aktuální číslo časopisu Computer

Bojujeme proti Fake News

Dva velké testy: fotoaparáty a NASy

Co musíte vědět o změně evropského roamingu

Radíme s výběrem základní desky