Google se naučil chápat význam slov

Google představil svůj vylepšený vyhledávač. Rozumí významům slov, takže by mohl brzy nabídnout to, co umí třeba Siri od Applu. Zatím to ale bude fungovat jen v zámoří.

Google spouští svůj Knowledge Graph, který by měl být začátkem nové vlny inovací ve vyhledávačích. Oč se jedná? O technologii jsme psali už v únoru a v podstatě nejde o nic jiného než o obří databázi souvislostí mezi slovy a jejich významy.

Technologie Knowledge Graph podle Googlu (anglické titulky)

Pokud to zní složitě, tak si pod tím představte třeba souvislosti mezi slovy Václav a Havel a záznamem Václava Havla ve Wikipedii. A to je vlastně podstata celého „grafu“. Zatímco doposud drtivá většina vyhledávačů pracovala primárně na systému statistické analýzy výskytu slov, znalostní graf se snaží odhalit jejich skutečný význam.

Slova Václav a Havel už pro něj tedy nejsou pouze shluky písmenek, kterým na základě výskytu těchto slov na cílových stránkách přiděluje nějakou váhu, ale slova, ke kterým umí přidělit informaci, že se jednalo o prvního českého prezidenta. No a to jsou další klíčové informace, ke kterým se větví další a další popisná fakta a souvislosti s jinými tématy a vyhledávač najednou pracuje trošku jinak – sémanticky. Pohrává si se skutečnými významy slov namísto těch ryze statistických a může zpracovávat diametrálně odlišné výsledky.

500 milionů slov, 3 miliardy souvislostí

Další příklad zmiňuje přímo Google. Tak třeba takový Tádž Mahal. Jistě, je to indické královské mauzoleum, jenže stejně tak je to jméno jistého umělce. Google tento rozdíl pochopí a nabídne možnost zobrazení pouze výsledků pro indický palác a naopak pro umělce.

Toto všechno vyhledávač ví díky analýze nepřeberného množství zdrojů, kam patří jak Wikipedie, tak FBI World Factbook a další veřejné databáze a zdroje včetně chování uživatelů v základním vyhledávači. V současné době Google „chápe“ 500 milionů objektů, které jsou vzájemně propojené 3,5 miliardami vazeb a faktografických informací.

V únoru se Google pochlubil, že tuto technologii bude postupně nasazovat do praxe v příštích týdnech a měsících. Ta doba nastává právě v těchto dnech, i když zpočátku hlavně pro surfaře ve Spojených státech. My si na svůj český graf souvislostí ještě musíme nějaký ten pátek počkat.

Knowledge Graph v praxi

Knowledge Graph je obrovská databáze souvislostí, o jejím úspěchu a přijetí uživateli ale nakonec rozhoduje něco úplně jiného – jak tato data dokáže Google skutečně využít. V tuto chvíli pracuje s několika scénáři, které si už mohou otestovat surfaři ze zámoří.

1. Google chápe význam slova

O tom jsem psal o několik odstavců výše. Je to přesně ten problém s Tádž Mahalem. Pokud tedy Google odhalí skutečný význam slov, může nabídnout vícero alternativních výsledků.

Klepněte pro větší obrázek
Google pochopil, že jeden Tádž Mahal je stavba a ten druhý umělec

2. Google jako WolframAlpha

Díky novým databázím dokáže Google sám syntetizovat základní faktografii. Pokud tedy budete hledat třeba právě toho Václava Havla, Google pochopí význam těchto dvou slov, bude vědět, že se jedná o historickou osobnost a sestrojí základní faktografický přehled podobně jako třeba WolframAlpha.

Klepněte pro větší obrázek
Google pochopil, že Marie Curie je žena a zjistil pro ni adekvátní faktografické informace, které o Marii lidé hledají na Googlu nejčastěji

3. Google jako detektiv

Při konstruování základního faktografického přehledu může Google zároveň objevit některé doposud netušené informace. Na blogu firmy tak jako příklad použili syntetický přehled pro Matta Groeninga, který je autorem komiksové série The SImpsons. Jeho rodiče se jmenují Margaret a Homer, sestra je pak Lisa. Jistě, toto je chabá ukázka, toto se totiž obecně ví, nicméně je v tom skrytý určitý potenciál pro jiné situace.

Klepněte pro větší obrázek
Díky souvislostem rychle zjistíte, proč se postavičky v The Simpsons jmenují právě Homer, Lisa a další¨.

Aktuální implementace znalostního vyhledávače do toho současného slovníkového je pochopitelně pouze začátek a vyhledávač mohou Američané i nadále používat klasickým způsobem. Podstatné je ale ještě něco jiného. Pokud Google zná 500 milionů slov a disponuje vlastním rozpoznáváním mluveného slova včetně podpory češtiny, v podstatě by mohl v relativně brzké době nabídnout svou vlastní verzi tolik diskutované technologie Siri z jablečných kapesních počítačů.

Témata článku: Google, Technologie, Vyhledávače, Marie, Matt, The Simpsons, Homer, Lisa

40 komentářů

Nejnovější komentáře

  • Disdainful 20. 5. 2012 12:46:08
    Bojim se až si Google uvědomí sám sebe :-D
  • honza0118 19. 5. 2012 23:15:20
    Kdo si po přečtení nadpisu vzpoměl na Hlodače?? :-D
  • aaaa_ 18. 5. 2012 16:14:06
    som zvedavy kto prvy pride s realnou umelou inteligenciou.. google, ci...
Určitě si přečtěte

Monitory do 10 tisíc: poradíme, jaké jsou teď nejlepší

Monitory do 10 tisíc: poradíme, jaké jsou teď nejlepší

** Dobrý monitor s kvalitním panelem lze pořídit pod tři tisíce korun ** Pod deset tisíc si můžete koupit pracovní 27" monitor nebo nejlevnější použitelné 4K ** Vybrali jsme také ideální model pro vícemonitorovou konfiguraci

27.  11.  2016 | Stanislav Janů | 13

Sbíječky vyměnili za klávesnice. Nový projekt má za cíl přeučit horníky na programátory

Sbíječky vyměnili za klávesnice. Nový projekt má za cíl přeučit horníky na programátory

** Programátorů je málo a horníků bez práce po uzavření dolu Paskov bude moc ** Problém řeší unikátní projekt ** Pilotní kurz dává naději, že by z horníků mohli být použitelní kodéři

28.  11.  2016 | David Polesný | 76