Šéf výzkumu IBM: čeká nás život pod dohledem strojů?

Šéf výzkumu IBM: čeká nás život pod dohledem strojů?

Prahu navštívil Jeff Jonas, šéf výzkumu a analýzy dat v IBM. Popovídali jsme si s ním o třídění dat a následných možností jejich využití, podnikové amnézii a geosociálních datech.

Lidstvo každý den generuje ohromné množství více méně netříděných dat, které po složení dokážou poskytnout ucelené informace využitelné v mnoha ohledech. Podle bývalého šéfa Googlu Erica Schmidta každé dva dny přibude více digitálních dat, než celkový počet zachovaných informací v do roku 2006.

Tato data se ukládají všude možně po celém světě, má k nim přístup odlišená sorta uživatelů a sama o sobě nemusí mít žádnou odzbrojující sílu. Pokud by se ale někomu podařilo veškerá zaznamenaná data poskládat do jednoho logického celku, získal by neuvěřitelně cenný a efektivní zdroj informací.

A právě touto problematikou se zabývá šéf výzkumu v oblasti dat ve společnosti IBM Jeff Jonas. Jonas, který se proslavil především vývojem inteligentního systému pro odhlalování podvodníků v kasinech, před několika dny navštívil Prahu a v rozhovorech a přednáškách se rozpovídal o možnostech analýzy a třídění dat a tzv. podnikové amnézii.

Tuny nevyužitých dat

Jeff Jonas, IBM

Šéf výzkumu IBM v oblasti analýzy dat. V roce 1984 založil společnost SRD, která se zabývala vývojem technologií na rozpoznávání obličejů nebo systémy na hledání teroristů. Firmu v roce 2005 prodal společnosti IBM.

Jeho nejužší tým je osmičlenný a a jde o vysoce kvalifikovanou partu inženýrů. Jeff veškerou práci řídí především v letadle a v hotelových pokojích a salóncích přes laptop a své BlackBerry. Žije sice v Las Vegas, ale podle jeho vlastních slov ve své posteli stráví pouhých 10 dní v roce, zbytek pak na cestách, přednáškách a rozhovorech.

Jonas je veliký sportovec, účastní se například náročné soutěže Ironman. I když se zabývá moderními technologiemi, při sportu prý žádné technické hračky nepoužívá. Žádné Nike + iPod, žádný RunKeeper ani nic podobného. Pouze při běhu občas vytáhne své BlackBerry a vyřizuje e-maily.

To znamená, že společnosti generují ohromné množství dat, ale efektivně dokážou využít pouze 7 % z nich. Vzniká tak efekt rozevřených nůžek, kdy se sice pracuje s daty, ale většina z nich zůstává nevyužita. Jonas a jeho osmičlenný tým pracují na systémech, které pomáhají firmám a organizacím tato nevyužitá data dávat do kontextu a těžit z nich v byznysu. Energický padesátník svoji práci bere vážně a chlubí se zejména konkrétními výsledky. Poukazuje na skutečné společnosti, které jeho systém analýzy dat používají a od jeho nasazení vykazují buďto ohromné úspory v milionech dolarů, nebo nárůsty zisků díky efektivní práci se získanými informacemi.

Jonas při vysvětlování svého systému nezabíhá do detailních technických podrobností a spíše se snaží ukazovat, proč je kompletování dat důležité a k čemu ho lze využít. Data a informace si lze podle jeho slov představit jako mnoho a mnoho dílků skládačky puzzle. Vysypete na jednu hromadu několik různých skládaček a následně je nutné poskládat tak, aby do sebe zapadaly a přinesly výsledek.

K tomu slouží algoritmus, jehož fungování mi přesně vysvětleno nebylo, údajně ale funguje na naprosto odlišené bázi, než například indexovací systém vyhledávače Google, který se rovněž snaží hledat data a nějakým způsobem je zpřistupňovat ve srozumitelné podobě.

Jonasův tým pracuje s širokým spektrem technologií a své zák

azníky neomezuje pouze na jednu platformu. Různě veliké implementace systémů lze nasadit stejně dobře na serverových Windows, jako na Linuxu a dalších platformách. Také hardwarové specifikace se liší podle velikosti a objemu zpracovávaných dat. Člen vývojového týmu musí umět pracovat s mnoha programovacími jazyky, databázemi a serverovými technologiemi, a navíc musí mít brilantní analytické, logické a matematické myšlení.

Čím více dat, tím lépe

I když je dat stále více a více, je to údajně lepší stav, než kdyby jich bylo méně. Algoritmus totiž díky více různým datům dokáže lépe poskládat jednotlivé celky dokupy a odstraní například duplicity. Jenom v České republice může například existovat několik stovek Pavlů Pudilů. Pokud by každý Pavel Pudil měl záznam pouze se svým jménem, nebylo by možné zjistit, jestli to je pouze jeden Pavel Pudil, nebo tisíce Pavlů Pudilů. Proto je dobré, když se dá dostat k dalším datům jako je e-mail, telefon, adresa, datum narození, cookies a vlastně všechno, co si dokážete představit. Potom se mnohem lépe vše třídí.

306888166.jpg
Jeff Jonas z Prahy zamířil přednášet do Londýna, Paříže, Austrálie, Afriky, ... ve své posteli tráví 10 dnů v roce. Jeho blog čtěte na adrese jeffjonas.typepad.com.

Takové kolektování data do jisté míry může nahánět husí kůži z Velkého bratra a dalších dílků utopie George Orwella. Nadaný analytik Jonas však odmítá, že by se kdokoliv mohl dostat ke všem datům. Svůj systém prodává jednotlivým firmám a organizacím, které chtějí pracovat s vlastními daty. Nemají například přístup do policejní databáze, databáze pojišťoven atp.

Jeff Jonas ale zároveň tvrdí, že těmi nejcennějšími daty mohou do budoucna být tzv. geosociální data, kterých se začíná objevovat díky chytrým telefonům a novým službám stále více. Čtenáři Živě.cz určitě patří mezi ty, kteří právě takové služby používají. Foursquare, Google Latitude, GPS navigace, cookies, personalizované vyhledávání, Facebook Places, Twitter a mnohé další služby generují personalizovaná geosociální data, která mohou být při dobrém zpracování naprostou bombou pro marketingové a obchodní účely. Jen ve Spojených státech proběhne každý den přes 600 miliard transakcí dat s osobními informacemi a toto číslo každoročně zásadně poroste, protože lidé chtějí moderní technologie používat.

Právě tento do jisté míry strašák byl důvodem nedávného mediálního humbuku okolo ukládání geolokačních informací v telefonech iPhone. Firmy mohou okamžitě zjistit, kde se daný uživatel nachází, kudy chodí z práce domů, kde se nejčastěji vyskytuje a mnoho dalších informací. Sestavit na základě toho obchodní nebo marketingovou akci už je hračka.

Zdá se, že data a informace skutečně znamenají mnoho a inteligentní systémy poháněné počítači a stroji budou důležitým klíčem k jejich zvládnutí a organizaci. Jonas na chvilku dokáže skutečně vystrašit, když říká, že “budoucnost pod dohledem strojů je nevyhnutelná a především neodolatelná.”

IBM se ostatně o různé inteligentní systémy, které v určité míře dokáží nahradit člověka, snaží už delší dobu. Důkazem budiž například projekt Smarter Planet (Chytřejší planeta), nebo poslední zprávy o "centrálním mozku lidstva" v podobě superpočítače IBM Watson.

Určitě si přečtěte

Články odjinud