Google se naučil chápat význam slov

Google představil svůj vylepšený vyhledávač. Rozumí významům slov, takže by mohl brzy nabídnout to, co umí třeba Siri od Applu. Zatím to ale bude fungovat jen v zámoří.
Google se naučil chápat význam slov

Google spouští svůj Knowledge Graph, který by měl být začátkem nové vlny inovací ve vyhledávačích. Oč se jedná? O technologii jsme psali už v únoru a v podstatě nejde o nic jiného než o obří databázi souvislostí mezi slovy a jejich významy.

Technologie Knowledge Graph podle Googlu (anglické titulky)

Pokud to zní složitě, tak si pod tím představte třeba souvislosti mezi slovy Václav a Havel a záznamem Václava Havla ve Wikipedii. A to je vlastně podstata celého „grafu“. Zatímco doposud drtivá většina vyhledávačů pracovala primárně na systému statistické analýzy výskytu slov, znalostní graf se snaží odhalit jejich skutečný význam.

Slova Václav a Havel už pro něj tedy nejsou pouze shluky písmenek, kterým na základě výskytu těchto slov na cílových stránkách přiděluje nějakou váhu, ale slova, ke kterým umí přidělit informaci, že se jednalo o prvního českého prezidenta. No a to jsou další klíčové informace, ke kterým se větví další a další popisná fakta a souvislosti s jinými tématy a vyhledávač najednou pracuje trošku jinak – sémanticky. Pohrává si se skutečnými významy slov namísto těch ryze statistických a může zpracovávat diametrálně odlišné výsledky.

500 milionů slov, 3 miliardy souvislostí

Další příklad zmiňuje přímo Google. Tak třeba takový Tádž Mahal. Jistě, je to indické královské mauzoleum, jenže stejně tak je to jméno jistého umělce. Google tento rozdíl pochopí a nabídne možnost zobrazení pouze výsledků pro indický palác a naopak pro umělce.

Toto všechno vyhledávač ví díky analýze nepřeberného množství zdrojů, kam patří jak Wikipedie, tak FBI World Factbook a další veřejné databáze a zdroje včetně chování uživatelů v základním vyhledávači. V současné době Google „chápe“ 500 milionů objektů, které jsou vzájemně propojené 3,5 miliardami vazeb a faktografických informací.

V únoru se Google pochlubil, že tuto technologii bude postupně nasazovat do praxe v příštích týdnech a měsících. Ta doba nastává právě v těchto dnech, i když zpočátku hlavně pro surfaře ve Spojených státech. My si na svůj český graf souvislostí ještě musíme nějaký ten pátek počkat.

Knowledge Graph v praxi

Knowledge Graph je obrovská databáze souvislostí, o jejím úspěchu a přijetí uživateli ale nakonec rozhoduje něco úplně jiného – jak tato data dokáže Google skutečně využít. V tuto chvíli pracuje s několika scénáři, které si už mohou otestovat surfaři ze zámoří.

1. Google chápe význam slova

O tom jsem psal o několik odstavců výše. Je to přesně ten problém s Tádž Mahalem. Pokud tedy Google odhalí skutečný význam slov, může nabídnout vícero alternativních výsledků.

Klepněte pro větší obrázek
Google pochopil, že jeden Tádž Mahal je stavba a ten druhý umělec

2. Google jako WolframAlpha

Díky novým databázím dokáže Google sám syntetizovat základní faktografii. Pokud tedy budete hledat třeba právě toho Václava Havla, Google pochopí význam těchto dvou slov, bude vědět, že se jedná o historickou osobnost a sestrojí základní faktografický přehled podobně jako třeba WolframAlpha.

Klepněte pro větší obrázek
Google pochopil, že Marie Curie je žena a zjistil pro ni adekvátní faktografické informace, které o Marii lidé hledají na Googlu nejčastěji

3. Google jako detektiv

Při konstruování základního faktografického přehledu může Google zároveň objevit některé doposud netušené informace. Na blogu firmy tak jako příklad použili syntetický přehled pro Matta Groeninga, který je autorem komiksové série The SImpsons. Jeho rodiče se jmenují Margaret a Homer, sestra je pak Lisa. Jistě, toto je chabá ukázka, toto se totiž obecně ví, nicméně je v tom skrytý určitý potenciál pro jiné situace.

Klepněte pro větší obrázek
Díky souvislostem rychle zjistíte, proč se postavičky v The Simpsons jmenují právě Homer, Lisa a další¨.

Aktuální implementace znalostního vyhledávače do toho současného slovníkového je pochopitelně pouze začátek a vyhledávač mohou Američané i nadále používat klasickým způsobem. Podstatné je ale ještě něco jiného. Pokud Google zná 500 milionů slov a disponuje vlastním rozpoznáváním mluveného slova včetně podpory češtiny, v podstatě by mohl v relativně brzké době nabídnout svou vlastní verzi tolik diskutované technologie Siri z jablečných kapesních počítačů.

Diskuze (40) Další článek: E15.cz: Nejlepší místo pro sledování aktuálních zpráv

Témata článku: Technologie, Google, Vyhledávače, The Simpsons, Základní vyhledávač, Marie, Mluvené slovo, Česká Wikipedie, Homer, Curie, Lisa, Určitý potenciál, Obrovská databáze, Veřejné data, Diskutované téma, Mario, Matt, Alternativní zdroj, Google+, Význam


Určitě si přečtěte

Pojďme programovat elektroniku: Když už vás ten chumel součástek prostě nebaví

Pojďme programovat elektroniku: Když už vás ten chumel součástek prostě nebaví

** Levné cetky z Asie stojí dolar ** Postavíte s nimi skoro vše od teploměru po spínač zavlažování ** Má to ale jeden háček. Bude to ošklivé a povětšinou nekvalitní

Jakub Čížek | 22

Modelářský zázrak: Maketa raketoplánu Columbia, která létá jako skutečná raketa

Modelářský zázrak: Maketa raketoplánu Columbia, která létá jako skutečná raketa

** Model raketoplánu Columbia od českého konstruktéra umí i létat ** Obdivuhodný model si vzal 1600 hodin práce ** Podívejte se na fotografie ze stavby a prvního letu

Karel Jeřábek | 20

Astronomové objevili daleko za Plutem objekt s extrémní dráhou. Může ukazovat na existenci planety Devět

Astronomové objevili daleko za Plutem objekt s extrémní dráhou. Může ukazovat na existenci planety Devět

** Astronomové objevili daleko za Neptunem těleso 2015 TG387 ** Okolo Slunce se pohybuje po extrémně protáhlé dráze ** Jeho dráha může ukazovat na existenci planety Devět

Petr Kubala | 10

Photolemur 3: Prostě do něj přetáhnete fotky a začne se dít magie. Tedy údajně...

Photolemur 3: Prostě do něj přetáhnete fotky a začne se dít magie. Tedy údajně...

** Je lepší nabušený Photoshop, nebo program s jedním tlačítkem? ** Photolemur si myslí to druhé ** Tento fotoeditor neumí skoro nic, a přitom (skoro) všechno

Jakub Čížek | 19

Velká podzimní aktualizace: Co nového teď najdete ve Windows 10

Velká podzimní aktualizace: Co nového teď najdete ve Windows 10

** Microsoft se opět snaží spojit telefony a počítače. ** Místo velkých novinek se zaměřil spíše na drobná vylepšení. ** Vyhledávání je konečně použitelné a hledá téměř všude.

Vladislav Kluska | 78

Podívejte se, co se stane, když dron DJI Phantom narazí do křídla letadla

Podívejte se, co se stane, když dron DJI Phantom narazí do křídla letadla

** Co se může stát, když relativně maličký dron narazí do křídla letadla? ** Tuto otázku zodpověděli odborníci laboratorním pokusem ** Kvadrokoptéra způsobila významné poškození křídla

Karel Kilián | 14


Aktuální číslo časopisu Computer

Jak vytvořit a spravovat vlastní web

Velký test herních klávesnic a DVB-T2 tunerů

Vše o formátu RAW

Vybíráme nejlepší základní desku