Proč Google Instant nerozumí bosenské Prdeljici

Google je v mnohém velmi otevřený a přístupný vyhledávač. Přesto ale existují mantinely, za které očividně nejde. Obětí se stal i jeho instantní vyhledávač a našeptávač.
Proč Google Instant nerozumí bosenské Prdeljici

Je to už nějaký týden, co můžete v Googlu zkoušet instantní vyhledávání. V anglickém originálu se funkce jmenuje prostě Google Instant, česká varianta pak zní Dynamické vyhledávání. Jak už dobře víte, celá podstata služby spočívá v tom, že se ve vyhledávači zobrazují výsledky dynamicky už ve chvíli, kdy píšete hledanou frázi.

Krátce po spuštění vyhledávače se nicméně na webu objevila i černá listina hesel, se kterými si Instant nerozumí – které bude ignorovat. Seznam se zvesela rozšiřuje, tvoří ho totiž komunita, a jak se zdá, takovou listinu bychom mohli začít tvořit i u nás nebo v sousedním Slovensku. I náš Google totiž všechna slova nezná. Není to přitom omyl nebo nedostatek indexovacího robota, ale zásah člověka.

Slovíčka, o kterých se nemluví

Google se odjakživa nechlubí tím, v jaké míře jeho uživatelé vyhledávají nejrůznější citlivá slovíčka. Ve výročním Zeitgeistu (nejhledanější slova a největší skokani) se tedy nikdy neobjeví „sex“ nebo nedej bože něco skutečně vulgárního. Naštěstí ale stačí zavítat na web Statistiky vyhledávání (Google Insights for Search) a zjistíte, že zájem o sex mezi českými surfaři objektivně klesá. Termínu se naopak nejlépe daří v Pákistánu, Vietnamu a Indii. Anglosaské země pro změnu používají jiné termíny pro tentýž význam slova.

Po malé odbočce ovšem k tomu nejdůležitějšímu – československé černé listině. Skutečně najdete slovíčka, na která Instant mlčí a také našeptávač se chová, jako by nic neslyšel, ačkoliv se samotnou indexací Googlebot nemá ani nejmenší problém (Google zná nějaké dva miliony českých stránek, které mají co do činění se slovíčkem „sex“).

Zakázaná slovíčka v českém vyhledávači Google Instant

 

K filtrování výsledků našeptávače (a tedy i na něj navázaného dynamického hledání) dochází jak při zapnutém bezpečném vyhledávání (rodičovský filtr), což by bylo v podstatě v nejlepším pořádku, tak ovšem i při tom zcela svobodném. Ani to sice není nikterak velká rána, protože po klepnutí na ENTER se zobrazí klasické nedynamické výsledky, nicméně do hromady zakázaných slov se bohužel dostanou i zcela běžná slova.

Politicky nekorektní našeptávač

Našeptávač Googlu má sice nařízeno nenašeptávat různá (potenciálně nebezpečná) slovíčka, se slovními spojeními ale v mnoha případech problém nemá. Pokud tedy v anglické verzi vyhledávače zadáte spojení „suicide is th“, našeptávač vám napoví „suicide is the solution“ (sebevražda je řešení). Jak vidno, našeptávač je dalším adeptem na to, aby na něj zaútočil nějaký schopný autor SEO bomby.

Klepněte pro větší obrázek

Některé další příklady „politicky nekorektního“ našeptávače najdete na webu lazydesis.com.

Problém totiž spočívá v tom, že Google v našeptávači blokuje nikoliv celá inkriminovaná slova, ale i jejich základy nebo dokonce jen první písmena. A z toho plyne, že se na seznam zakázaných slov logicky dostanou i výrazy každodenního použití. Google Instant a našeptávač tedy neví zhola nic o slovenské Seredi (17 000 obyvatel), o českém Pičíně nebo o bosenském vrchu Prdeljica. Ze stejného důvodu se nakonec o našeptávače nedostalo ani estonské přístavní město Kunda. Našeptávač v Google Mapách vám přitom Prdeljici, Kundu nebo i pražský klub Prdel bez problému nabídne.

Klepněte pro větší obrázek
Obec Kunda, Estonsko (Zdroj: Mapy Google)

Samozřejmě můžete namítnout, že je to dáno velikostí těchto obcí, nicméně s takovými Orličkami na úpatí Suchého vrchu, které návštěvníkům nabízí leda místní Konzum a několik málo chalupářů, toho ví Google poměrně dost včetně kompletního mapového a adresního pokrytí.

Cenzurovaný Pablo Picasso

Jistě, doposud jsem psal pouze o obcích s věru expresivními názvy, pokud ale nasadím vážnější notu, je třeba konstatovat, že do našeptávače se ze zcela identického důvodu nedostal ani Pablo Picasso. Ironií osudu v našeptávači přirozeně chybí i Picasa, správce fotografií od Googlu.

Snad je to ale vše jenom výjimka, takové hlasové vyhledávání pomocí Googlu v Androidu, nebo iPhonu totiž naopak funguje excelentně i u těch nejošklivějších slov, které jste se v životě opovážili vyslovit a ke všemu bravurně funguje i našeptávač. Ne, nesmějte se, anglické hlasové vyhledávání s tímto mělo na Androidu dlouhé roky převeliké problémy, autocenzura byla totiž nastavena natolik přísně, že jste si nemohli v telefonu hlasem vyhledat ani to, co je předmětem studia přírodovědy na středoevropských základních školách.

Pro inspiraci se podívejte také na bleskovku o černé listině anglických slovíček v Google Instantu.

Diskuze (29) Další článek: Hugin: Poslepujte fotky v panorama

Témata článku: Google, Web, Bezpečnost, Vyhledávače, Bulvár a vtípky, Screencast, Černá listina, Instant, Instantní vyhledávání, Indexovacího robot, Google+, Běžný obyvatel, Každodenní použití, Picasso, Listina, Kompletní pokrytí, Pablo, Search for, Nejmenší problém, Úpatí, Iphone 10 na Mall.cz


Určitě si přečtěte

20 tipů a triků pro Gmail: Užitečné maličkosti, které zefektivní práci s e-maily

20 tipů a triků pro Gmail: Užitečné maličkosti, které zefektivní práci s e-maily

** V Gmailu je řada užitečných funkcí, které možná všechny neznáte ** Odeslání mailu můžete například pozdržet či naplánovat na později ** Nad Gmailem můžete mít s několika triky daleko lepší kontrolu

Karel Kilián | 25

Kdyby měli železničáři tento superpočítač za 99 dolarů, nepotřebovali by lasery

Kdyby měli železničáři tento superpočítač za 99 dolarů, nepotřebovali by lasery

** Nejmodernější český železniční tunel je prošpikovaný technologiemi ** Za tři tisíce koupíte počítač, který je překoná ** Seznamte se s Nvidia Jetson Nano

Jakub Čížek | 50

Jak doma vylepšit signál Wi-Fi: Pomůže repeater, více routerů, ale nejlépe systémy mesh

Jak doma vylepšit signál Wi-Fi: Pomůže repeater, více routerů, ale nejlépe systémy mesh

** Máte špatný signál Wi-Fi? Mesh systémy to vyřeší ** Už vás nezruinují, meziročně ceny příjemně spadly ** Jak systém funguje a čím je výjimečný?

Jiří Kuruc | 106

Google Coral: Raspberry Pi s čipem, který zpracuje 4 biliony operací za sekundu

Google Coral: Raspberry Pi s čipem, který zpracuje 4 biliony operací za sekundu

** Je to velké jako Raspberry Pi ** Ale je to až o několik řádů rychlejší ** Dorazil nám exotický Google Coral s akcelerátorem Edge TPU

Jakub Čížek | 18


Aktuální číslo časopisu Computer

Megatest 20 procesorů

Srovnání 15 True Wireless sluchátek

Vyplatí se tisknout fotografie doma?

Vybíráme nejlepší základní desky