Google se naučil chápat význam slov

Google představil svůj vylepšený vyhledávač. Rozumí významům slov, takže by mohl brzy nabídnout to, co umí třeba Siri od Applu. Zatím to ale bude fungovat jen v zámoří.
Google se naučil chápat význam slov

Google spouští svůj Knowledge Graph, který by měl být začátkem nové vlny inovací ve vyhledávačích. Oč se jedná? O technologii jsme psali už v únoru a v podstatě nejde o nic jiného než o obří databázi souvislostí mezi slovy a jejich významy.

Technologie Knowledge Graph podle Googlu (anglické titulky)

Pokud to zní složitě, tak si pod tím představte třeba souvislosti mezi slovy Václav a Havel a záznamem Václava Havla ve Wikipedii. A to je vlastně podstata celého „grafu“. Zatímco doposud drtivá většina vyhledávačů pracovala primárně na systému statistické analýzy výskytu slov, znalostní graf se snaží odhalit jejich skutečný význam.

Slova Václav a Havel už pro něj tedy nejsou pouze shluky písmenek, kterým na základě výskytu těchto slov na cílových stránkách přiděluje nějakou váhu, ale slova, ke kterým umí přidělit informaci, že se jednalo o prvního českého prezidenta. No a to jsou další klíčové informace, ke kterým se větví další a další popisná fakta a souvislosti s jinými tématy a vyhledávač najednou pracuje trošku jinak – sémanticky. Pohrává si se skutečnými významy slov namísto těch ryze statistických a může zpracovávat diametrálně odlišné výsledky.

500 milionů slov, 3 miliardy souvislostí

Další příklad zmiňuje přímo Google. Tak třeba takový Tádž Mahal. Jistě, je to indické královské mauzoleum, jenže stejně tak je to jméno jistého umělce. Google tento rozdíl pochopí a nabídne možnost zobrazení pouze výsledků pro indický palác a naopak pro umělce.

Toto všechno vyhledávač ví díky analýze nepřeberného množství zdrojů, kam patří jak Wikipedie, tak FBI World Factbook a další veřejné databáze a zdroje včetně chování uživatelů v základním vyhledávači. V současné době Google „chápe“ 500 milionů objektů, které jsou vzájemně propojené 3,5 miliardami vazeb a faktografických informací.

V únoru se Google pochlubil, že tuto technologii bude postupně nasazovat do praxe v příštích týdnech a měsících. Ta doba nastává právě v těchto dnech, i když zpočátku hlavně pro surfaře ve Spojených státech. My si na svůj český graf souvislostí ještě musíme nějaký ten pátek počkat.

Knowledge Graph v praxi

Knowledge Graph je obrovská databáze souvislostí, o jejím úspěchu a přijetí uživateli ale nakonec rozhoduje něco úplně jiného – jak tato data dokáže Google skutečně využít. V tuto chvíli pracuje s několika scénáři, které si už mohou otestovat surfaři ze zámoří.

1. Google chápe význam slova

O tom jsem psal o několik odstavců výše. Je to přesně ten problém s Tádž Mahalem. Pokud tedy Google odhalí skutečný význam slov, může nabídnout vícero alternativních výsledků.

Klepněte pro větší obrázek
Google pochopil, že jeden Tádž Mahal je stavba a ten druhý umělec

2. Google jako WolframAlpha

Díky novým databázím dokáže Google sám syntetizovat základní faktografii. Pokud tedy budete hledat třeba právě toho Václava Havla, Google pochopí význam těchto dvou slov, bude vědět, že se jedná o historickou osobnost a sestrojí základní faktografický přehled podobně jako třeba WolframAlpha.

Klepněte pro větší obrázek
Google pochopil, že Marie Curie je žena a zjistil pro ni adekvátní faktografické informace, které o Marii lidé hledají na Googlu nejčastěji

3. Google jako detektiv

Při konstruování základního faktografického přehledu může Google zároveň objevit některé doposud netušené informace. Na blogu firmy tak jako příklad použili syntetický přehled pro Matta Groeninga, který je autorem komiksové série The SImpsons. Jeho rodiče se jmenují Margaret a Homer, sestra je pak Lisa. Jistě, toto je chabá ukázka, toto se totiž obecně ví, nicméně je v tom skrytý určitý potenciál pro jiné situace.

Klepněte pro větší obrázek
Díky souvislostem rychle zjistíte, proč se postavičky v The Simpsons jmenují právě Homer, Lisa a další¨.

Aktuální implementace znalostního vyhledávače do toho současného slovníkového je pochopitelně pouze začátek a vyhledávač mohou Američané i nadále používat klasickým způsobem. Podstatné je ale ještě něco jiného. Pokud Google zná 500 milionů slov a disponuje vlastním rozpoznáváním mluveného slova včetně podpory češtiny, v podstatě by mohl v relativně brzké době nabídnout svou vlastní verzi tolik diskutované technologie Siri z jablečných kapesních počítačů.

Diskuze (40) Další článek: E15.cz: Nejlepší místo pro sledování aktuálních zpráv

Témata článku: Technologie, Google, Vyhledávače, Marie, Veřejné data, Alternativní zdroj, Určitý potenciál, Česká Wikipedie, Mario, Curie, Matt, Homer, Lisa, Diskutované téma, The Simpsons, Matta, Mluvené slovo, Význam, Základní vyhledávač, Obrovská databáze, Google+


Určitě si přečtěte

Jak nahradit webkameru: jde to telefonem, zadarmo a s lepším obrazem

Jak nahradit webkameru: jde to telefonem, zadarmo a s lepším obrazem

** Koronavirus donutil mnohé zaměstnance pracovat z domova ** V souvislosti s tím vzrostla poptávka po webových kamerách ** Webkameru ale nemusíte kupovat – stačí mobil a aplikace!

Karel Kilián | 15

Deset kotev, které i v roce 2020 táhnou Android ke dnu

Deset kotev, které i v roce 2020 táhnou Android ke dnu

** Android existuje skoro 12 let a za tu dobu v mnoha směrech dospěl ** Dnes běží na sedmi z deseti telefonů, ale čemu za to vděčí? ** Našli jsme 10 kotev, které táhnou tento operační systém ke dnu

Karel Kilián | 165

12 netradičních map České republiky, které jste ještě nikdy neviděli

12 netradičních map České republiky, které jste ještě nikdy neviděli

** Tušíte, kolik je u nás hřbitovů a jak jsou velké? ** Dokážete si představit mapu českých řek a potoků? ** Udělali jsme to všechno za vás nad daty ČÚZK

Jakub Čížek | 10

Na měsíc jsem opustil Google a potupně se zase vrátil zpět (komentář)

Na měsíc jsem opustil Google a potupně se zase vrátil zpět (komentář)

** Zkusil jsem se zbavit závislosti na vyhledávači od Googlu ** Jako alternativy posloužily Bing, Seznam a DuckDuckGo ** Mají své silné stránky, ale i nepřekonatelná negativa

Lukáš Václavík | 53


Aktuální číslo časopisu Computer

Megatest SSD s kapacitou 1 TB

Srovnávací test robotických vysavačů

Vybíráme nejlepší telefony na trhu

Jak zlepšit zvuk televize