Google se naučil chápat význam slov

Google představil svůj vylepšený vyhledávač. Rozumí významům slov, takže by mohl brzy nabídnout to, co umí třeba Siri od Applu. Zatím to ale bude fungovat jen v zámoří.
Google se naučil chápat význam slov

Google spouští svůj Knowledge Graph, který by měl být začátkem nové vlny inovací ve vyhledávačích. Oč se jedná? O technologii jsme psali už v únoru a v podstatě nejde o nic jiného než o obří databázi souvislostí mezi slovy a jejich významy.

Technologie Knowledge Graph podle Googlu (anglické titulky)

Pokud to zní složitě, tak si pod tím představte třeba souvislosti mezi slovy Václav a Havel a záznamem Václava Havla ve Wikipedii. A to je vlastně podstata celého „grafu“. Zatímco doposud drtivá většina vyhledávačů pracovala primárně na systému statistické analýzy výskytu slov, znalostní graf se snaží odhalit jejich skutečný význam.

Slova Václav a Havel už pro něj tedy nejsou pouze shluky písmenek, kterým na základě výskytu těchto slov na cílových stránkách přiděluje nějakou váhu, ale slova, ke kterým umí přidělit informaci, že se jednalo o prvního českého prezidenta. No a to jsou další klíčové informace, ke kterým se větví další a další popisná fakta a souvislosti s jinými tématy a vyhledávač najednou pracuje trošku jinak – sémanticky. Pohrává si se skutečnými významy slov namísto těch ryze statistických a může zpracovávat diametrálně odlišné výsledky.

500 milionů slov, 3 miliardy souvislostí

Další příklad zmiňuje přímo Google. Tak třeba takový Tádž Mahal. Jistě, je to indické královské mauzoleum, jenže stejně tak je to jméno jistého umělce. Google tento rozdíl pochopí a nabídne možnost zobrazení pouze výsledků pro indický palác a naopak pro umělce.

Toto všechno vyhledávač ví díky analýze nepřeberného množství zdrojů, kam patří jak Wikipedie, tak FBI World Factbook a další veřejné databáze a zdroje včetně chování uživatelů v základním vyhledávači. V současné době Google „chápe“ 500 milionů objektů, které jsou vzájemně propojené 3,5 miliardami vazeb a faktografických informací.

V únoru se Google pochlubil, že tuto technologii bude postupně nasazovat do praxe v příštích týdnech a měsících. Ta doba nastává právě v těchto dnech, i když zpočátku hlavně pro surfaře ve Spojených státech. My si na svůj český graf souvislostí ještě musíme nějaký ten pátek počkat.

Knowledge Graph v praxi

Knowledge Graph je obrovská databáze souvislostí, o jejím úspěchu a přijetí uživateli ale nakonec rozhoduje něco úplně jiného – jak tato data dokáže Google skutečně využít. V tuto chvíli pracuje s několika scénáři, které si už mohou otestovat surfaři ze zámoří.

1. Google chápe význam slova

O tom jsem psal o několik odstavců výše. Je to přesně ten problém s Tádž Mahalem. Pokud tedy Google odhalí skutečný význam slov, může nabídnout vícero alternativních výsledků.

Klepněte pro větší obrázek
Google pochopil, že jeden Tádž Mahal je stavba a ten druhý umělec

2. Google jako WolframAlpha

Díky novým databázím dokáže Google sám syntetizovat základní faktografii. Pokud tedy budete hledat třeba právě toho Václava Havla, Google pochopí význam těchto dvou slov, bude vědět, že se jedná o historickou osobnost a sestrojí základní faktografický přehled podobně jako třeba WolframAlpha.

Klepněte pro větší obrázek
Google pochopil, že Marie Curie je žena a zjistil pro ni adekvátní faktografické informace, které o Marii lidé hledají na Googlu nejčastěji

3. Google jako detektiv

Při konstruování základního faktografického přehledu může Google zároveň objevit některé doposud netušené informace. Na blogu firmy tak jako příklad použili syntetický přehled pro Matta Groeninga, který je autorem komiksové série The SImpsons. Jeho rodiče se jmenují Margaret a Homer, sestra je pak Lisa. Jistě, toto je chabá ukázka, toto se totiž obecně ví, nicméně je v tom skrytý určitý potenciál pro jiné situace.

Klepněte pro větší obrázek
Díky souvislostem rychle zjistíte, proč se postavičky v The Simpsons jmenují právě Homer, Lisa a další¨.

Aktuální implementace znalostního vyhledávače do toho současného slovníkového je pochopitelně pouze začátek a vyhledávač mohou Američané i nadále používat klasickým způsobem. Podstatné je ale ještě něco jiného. Pokud Google zná 500 milionů slov a disponuje vlastním rozpoznáváním mluveného slova včetně podpory češtiny, v podstatě by mohl v relativně brzké době nabídnout svou vlastní verzi tolik diskutované technologie Siri z jablečných kapesních počítačů.

Diskuze (40) Další článek: E15.cz: Nejlepší místo pro sledování aktuálních zpráv

Témata článku: Technologie, Google, Vyhledávače, Marie, Matta, Google+, Mario, Veřejné data, Homer, Mluvené slovo, Určitý potenciál, Význam, Základní vyhledávač, Curie, Alternativní zdroj, Lisa, Matt, The Simpsons, Diskutované téma, Obrovská databáze, Česká Wikipedie


Určitě si přečtěte

Jak funguje největší akumulátor v Česku: podívejte se do elektrárny Dlouhé Stráně

Jak funguje největší akumulátor v Česku: podívejte se do elektrárny Dlouhé Stráně

** Přečerpávací vodní elektrárna Dlouhé stráně je obdivuhodné technické dílo ** Stejná turbína vyrábí elektřinu i tlačí vodu zpět do horního jezera ** Strojovna elektrárny je zabudována v podzemí

David Polesný | 38

Neuronová síť WaveNet už mluví i slovensky. Google se bojí falšování reality

Neuronová síť WaveNet už mluví i slovensky. Google se bojí falšování reality

** Brzy nerozpoznáme hlasovou syntézu od skutečnosti ** Ruku v ruce s tím se objeví i pokusy o manipulaci reality ** Google před tím nyní varuje

Jakub Čížek | 19

Miliardový večírek končí. Rusko nemůže být z Crew Dragonu nadšené

Miliardový večírek končí. Rusko nemůže být z Crew Dragonu nadšené

** USA platí Rusku stamiliony dolarů za dopravu astronautů na ISS ** Dopravu amerických astronautů mají nyní převzít soukromé lodě ** Rusko je vytlačováno ze hry, mohou ho spasit vesmírní turisté

Petr Kubala | 70

Dubnové aktualizace Windows se nepovedly. Způsobují zamrzání systému

Dubnové aktualizace Windows se nepovedly. Způsobují zamrzání systému

** V úterý začal Microsoft uvolňovat dubnové kumulativní aktualizace ** Netrvalo dlouho a uživatelé začali hlásit první potíže ** Nejčastěji jde o zpomalení a zamrzání systému

Karel Kilián | 130

Ve Windows se občas něco rozbije, načež vyskočí deprimující chybový dialog

Ve Windows se občas něco rozbije, načež vyskočí deprimující chybový dialog

** Jistě je zná každý z vás: chybové hlášky Windows ** Informují o chybě, ale často vlastně vůbec nic neřeknou ** Po 30 letech si toho v Redmondu konečně všimli

Jakub Čížek | 124

Ověřte si, jak je na tom váš disk nebo SSD: 8 tipů na aplikace, které vám to řeknou

Ověřte si, jak je na tom váš disk nebo SSD: 8 tipů na aplikace, které vám to řeknou

** Na pevných discích bývá uloženo to nejcennější – naše data ** Sledujte jejich „zdravotní stav“ pomocí jednoho z nástrojů ** Případné problémy díky nim odhalíte dříve než nastanou

Karel Kilián | 22



Aktuální číslo časopisu Computer

Test 9 levných notebooků

Jak na digitalizaci fotek

Otestovali jsme chytré osobní váhy

Ohebné displeje: budoucnost či slepá cesta?