reklama

Google se naučil chápat význam slov

Google představil svůj vylepšený vyhledávač. Rozumí významům slov, takže by mohl brzy nabídnout to, co umí třeba Siri od Applu. Zatím to ale bude fungovat jen v zámoří.

Google spouští svůj Knowledge Graph, který by měl být začátkem nové vlny inovací ve vyhledávačích. Oč se jedná? O technologii jsme psali už v únoru a v podstatě nejde o nic jiného než o obří databázi souvislostí mezi slovy a jejich významy.

Technologie Knowledge Graph podle Googlu (anglické titulky)

Pokud to zní složitě, tak si pod tím představte třeba souvislosti mezi slovy Václav a Havel a záznamem Václava Havla ve Wikipedii. A to je vlastně podstata celého „grafu“. Zatímco doposud drtivá většina vyhledávačů pracovala primárně na systému statistické analýzy výskytu slov, znalostní graf se snaží odhalit jejich skutečný význam.

Slova Václav a Havel už pro něj tedy nejsou pouze shluky písmenek, kterým na základě výskytu těchto slov na cílových stránkách přiděluje nějakou váhu, ale slova, ke kterým umí přidělit informaci, že se jednalo o prvního českého prezidenta. No a to jsou další klíčové informace, ke kterým se větví další a další popisná fakta a souvislosti s jinými tématy a vyhledávač najednou pracuje trošku jinak – sémanticky. Pohrává si se skutečnými významy slov namísto těch ryze statistických a může zpracovávat diametrálně odlišné výsledky.

500 milionů slov, 3 miliardy souvislostí

Další příklad zmiňuje přímo Google. Tak třeba takový Tádž Mahal. Jistě, je to indické královské mauzoleum, jenže stejně tak je to jméno jistého umělce. Google tento rozdíl pochopí a nabídne možnost zobrazení pouze výsledků pro indický palác a naopak pro umělce.

Toto všechno vyhledávač ví díky analýze nepřeberného množství zdrojů, kam patří jak Wikipedie, tak FBI World Factbook a další veřejné databáze a zdroje včetně chování uživatelů v základním vyhledávači. V současné době Google „chápe“ 500 milionů objektů, které jsou vzájemně propojené 3,5 miliardami vazeb a faktografických informací.

V únoru se Google pochlubil, že tuto technologii bude postupně nasazovat do praxe v příštích týdnech a měsících. Ta doba nastává právě v těchto dnech, i když zpočátku hlavně pro surfaře ve Spojených státech. My si na svůj český graf souvislostí ještě musíme nějaký ten pátek počkat.

Knowledge Graph v praxi

Knowledge Graph je obrovská databáze souvislostí, o jejím úspěchu a přijetí uživateli ale nakonec rozhoduje něco úplně jiného – jak tato data dokáže Google skutečně využít. V tuto chvíli pracuje s několika scénáři, které si už mohou otestovat surfaři ze zámoří.

1. Google chápe význam slova

O tom jsem psal o několik odstavců výše. Je to přesně ten problém s Tádž Mahalem. Pokud tedy Google odhalí skutečný význam slov, může nabídnout vícero alternativních výsledků.

Klepněte pro větší obrázek
Google pochopil, že jeden Tádž Mahal je stavba a ten druhý umělec

2. Google jako WolframAlpha

Díky novým databázím dokáže Google sám syntetizovat základní faktografii. Pokud tedy budete hledat třeba právě toho Václava Havla, Google pochopí význam těchto dvou slov, bude vědět, že se jedná o historickou osobnost a sestrojí základní faktografický přehled podobně jako třeba WolframAlpha.

Klepněte pro větší obrázek
Google pochopil, že Marie Curie je žena a zjistil pro ni adekvátní faktografické informace, které o Marii lidé hledají na Googlu nejčastěji

3. Google jako detektiv

Při konstruování základního faktografického přehledu může Google zároveň objevit některé doposud netušené informace. Na blogu firmy tak jako příklad použili syntetický přehled pro Matta Groeninga, který je autorem komiksové série The SImpsons. Jeho rodiče se jmenují Margaret a Homer, sestra je pak Lisa. Jistě, toto je chabá ukázka, toto se totiž obecně ví, nicméně je v tom skrytý určitý potenciál pro jiné situace.

Klepněte pro větší obrázek
Díky souvislostem rychle zjistíte, proč se postavičky v The Simpsons jmenují právě Homer, Lisa a další¨.

Aktuální implementace znalostního vyhledávače do toho současného slovníkového je pochopitelně pouze začátek a vyhledávač mohou Američané i nadále používat klasickým způsobem. Podstatné je ale ještě něco jiného. Pokud Google zná 500 milionů slov a disponuje vlastním rozpoznáváním mluveného slova včetně podpory češtiny, v podstatě by mohl v relativně brzké době nabídnout svou vlastní verzi tolik diskutované technologie Siri z jablečných kapesních počítačů.

Témata článku: Technologie, Google, Vyhledávače, Marie, Mario, Matt, Homer, Lisa, The Simpsons

40 komentářů

Nejnovější komentáře

  • Disdainful 20. 5. 2012 12:46:08
    Bojim se až si Google uvědomí sám sebe :-D
  • honza0118 19. 5. 2012 23:15:20
    Kdo si po přečtení nadpisu vzpoměl na Hlodače?? :-D
  • aaaa_ 18. 5. 2012 16:14:06
    som zvedavy kto prvy pride s realnou umelou inteligenciou.. google, ci...
reklama
Určitě si přečtěte

AMD oficiálně představilo procesory Ryzen. Známe i jejich české ceny

AMD oficiálně představilo procesory Ryzen. Známe i jejich české ceny

** AMD uvedlo první tři procesory Ryzen 7 ** Všechny budou pracovat s osmi jádry a šestnácti vlákny ** Na pulty obchodů se dostanou už za týden

22.  2.  2017 | Stanislav Janů | 134

5 specialit, které budou v příštím Firefoxu. Ale musí vás nejprve nadchnout

5 specialit, které budou v příštím Firefoxu. Ale musí vás nejprve nadchnout

** Vyzkoušejte si speciality, na kterých pracuje Mozilla ** Vývojáři se podle vás rozhodnou, jestli to má smysl ** Nově přibyl skvělý experiment Snooze Tabs

26.  2.  2017 | Jakub Čížek | 47

Remix Singularity: Microsoft si na tom vylámal zuby. Jak dopadne Android?

Remix Singularity: Microsoft si na tom vylámal zuby. Jak dopadne Android?

** Microsoft do svých telefonů integroval desktopové prostředí ** Moc to ale nevyšlo, chyběl pořádný výkon ** Teď to zkoušejí ex-googleři s Remix Singularity

23.  2.  2017 | Jakub Čížek | 74

4 aplikace, které vám pomohou z hardwaru vyždímat maximum

4 aplikace, které vám pomohou z hardwaru vyždímat maximum

** Taktování je nejsnadnější cestou k vyššímu výkonu ** S dnešními nástroji jej zvládne i méně zkušený uživatel ** Poradíme, v čem přetaktovat procesor i grafiku

25.  2.  2017 | Stanislav Janů | 33


Aktuální číslo časopisu Computer

Supertéma o počítačové bezpečnosti

AMD Ryzen přichází

Velké testy kinoprojektorů a levných sluchátek

Příslušenství do USB-C

reklama
reklama