Proč Google Instant nerozumí bosenské Prdeljici

Google je v mnohém velmi otevřený a přístupný vyhledávač. Přesto ale existují mantinely, za které očividně nejde. Obětí se stal i jeho instantní vyhledávač a našeptávač.
Proč Google Instant nerozumí bosenské Prdeljici

Je to už nějaký týden, co můžete v Googlu zkoušet instantní vyhledávání. V anglickém originálu se funkce jmenuje prostě Google Instant, česká varianta pak zní Dynamické vyhledávání. Jak už dobře víte, celá podstata služby spočívá v tom, že se ve vyhledávači zobrazují výsledky dynamicky už ve chvíli, kdy píšete hledanou frázi.

Krátce po spuštění vyhledávače se nicméně na webu objevila i černá listina hesel, se kterými si Instant nerozumí – které bude ignorovat. Seznam se zvesela rozšiřuje, tvoří ho totiž komunita, a jak se zdá, takovou listinu bychom mohli začít tvořit i u nás nebo v sousedním Slovensku. I náš Google totiž všechna slova nezná. Není to přitom omyl nebo nedostatek indexovacího robota, ale zásah člověka.

Slovíčka, o kterých se nemluví

Google se odjakživa nechlubí tím, v jaké míře jeho uživatelé vyhledávají nejrůznější citlivá slovíčka. Ve výročním Zeitgeistu (nejhledanější slova a největší skokani) se tedy nikdy neobjeví „sex“ nebo nedej bože něco skutečně vulgárního. Naštěstí ale stačí zavítat na web Statistiky vyhledávání (Google Insights for Search) a zjistíte, že zájem o sex mezi českými surfaři objektivně klesá. Termínu se naopak nejlépe daří v Pákistánu, Vietnamu a Indii. Anglosaské země pro změnu používají jiné termíny pro tentýž význam slova.

Po malé odbočce ovšem k tomu nejdůležitějšímu – československé černé listině. Skutečně najdete slovíčka, na která Instant mlčí a také našeptávač se chová, jako by nic neslyšel, ačkoliv se samotnou indexací Googlebot nemá ani nejmenší problém (Google zná nějaké dva miliony českých stránek, které mají co do činění se slovíčkem „sex“).

Zakázaná slovíčka v českém vyhledávači Google Instant

 

K filtrování výsledků našeptávače (a tedy i na něj navázaného dynamického hledání) dochází jak při zapnutém bezpečném vyhledávání (rodičovský filtr), což by bylo v podstatě v nejlepším pořádku, tak ovšem i při tom zcela svobodném. Ani to sice není nikterak velká rána, protože po klepnutí na ENTER se zobrazí klasické nedynamické výsledky, nicméně do hromady zakázaných slov se bohužel dostanou i zcela běžná slova.

Politicky nekorektní našeptávač

Našeptávač Googlu má sice nařízeno nenašeptávat různá (potenciálně nebezpečná) slovíčka, se slovními spojeními ale v mnoha případech problém nemá. Pokud tedy v anglické verzi vyhledávače zadáte spojení „suicide is th“, našeptávač vám napoví „suicide is the solution“ (sebevražda je řešení). Jak vidno, našeptávač je dalším adeptem na to, aby na něj zaútočil nějaký schopný autor SEO bomby.

Klepněte pro větší obrázek

Některé další příklady „politicky nekorektního“ našeptávače najdete na webu lazydesis.com.

Problém totiž spočívá v tom, že Google v našeptávači blokuje nikoliv celá inkriminovaná slova, ale i jejich základy nebo dokonce jen první písmena. A z toho plyne, že se na seznam zakázaných slov logicky dostanou i výrazy každodenního použití. Google Instant a našeptávač tedy neví zhola nic o slovenské Seredi (17 000 obyvatel), o českém Pičíně nebo o bosenském vrchu Prdeljica. Ze stejného důvodu se nakonec o našeptávače nedostalo ani estonské přístavní město Kunda. Našeptávač v Google Mapách vám přitom Prdeljici, Kundu nebo i pražský klub Prdel bez problému nabídne.

Klepněte pro větší obrázek
Obec Kunda, Estonsko (Zdroj: Mapy Google)

Samozřejmě můžete namítnout, že je to dáno velikostí těchto obcí, nicméně s takovými Orličkami na úpatí Suchého vrchu, které návštěvníkům nabízí leda místní Konzum a několik málo chalupářů, toho ví Google poměrně dost včetně kompletního mapového a adresního pokrytí.

Cenzurovaný Pablo Picasso

Jistě, doposud jsem psal pouze o obcích s věru expresivními názvy, pokud ale nasadím vážnější notu, je třeba konstatovat, že do našeptávače se ze zcela identického důvodu nedostal ani Pablo Picasso. Ironií osudu v našeptávači přirozeně chybí i Picasa, správce fotografií od Googlu.

Snad je to ale vše jenom výjimka, takové hlasové vyhledávání pomocí Googlu v Androidu, nebo iPhonu totiž naopak funguje excelentně i u těch nejošklivějších slov, které jste se v životě opovážili vyslovit a ke všemu bravurně funguje i našeptávač. Ne, nesmějte se, anglické hlasové vyhledávání s tímto mělo na Androidu dlouhé roky převeliké problémy, autocenzura byla totiž nastavena natolik přísně, že jste si nemohli v telefonu hlasem vyhledat ani to, co je předmětem studia přírodovědy na středoevropských základních školách.

Pro inspiraci se podívejte také na bleskovku o černé listině anglických slovíček v Google Instantu.

Diskuze (29) Další článek: Hugin: Poslepujte fotky v panorama

Témata článku: Google, Bezpečnost, Web, Vyhledávače, Screencast, Bulvár a vtípky, INS, Chalupa, Indexovacího robot, Google+, Pablo Picasso, Search for, Nejmenší problém, Picasso, Úpatí, Každodenní použití, Chalupář, Listina, Černá listina, Instant, Pablo, Kompletní pokrytí, Nero, Instantní vyhledávání, Běžný obyvatel



Kouzlo jménem Opinion Rewards. Google vám za vaše odpovědi dá pár korun měsíčně na přilepšenou

Kouzlo jménem Opinion Rewards. Google vám za vaše odpovědi dá pár korun měsíčně na přilepšenou

** Už žádné VPN a pokoutné fingování vaši přesné polohy ** Vv Česku již funguje aplikace Odměny za průzkumy Google ** Za několik průzkumů týdně dostanete pár korun do Google Play

Martin Chroust
Google Opinion RewardsGoogle PlayPrůzkum
Rusko obviňuje astronautku NASA ze sabotáže Mezinárodní vesmírné stanice
Jiří Černý
Mezinárodní vesmírná staniceNASARusko
Izrael díky speciální kamufláži zařídil pro své vojáky „neviditelnost“

Izrael díky speciální kamufláži zařídil pro své vojáky „neviditelnost“

** Materiál „Kit 300“ představuje vizuální i termální kamufláž ** Dokáže zablokovat tepelné vyzařování maskovaného vojáka či třeba stroje ** Velký kus materiálu Kit 300 může ukrýt vozidlo až do velikosti Hummeru

Stanislav Mihulka
IzraelMateriálArmáda
Lék proti depresi za stokorunu snižuje riziko těžkého průběhu i úmrtí na onemocnění covid-19

Lék proti depresi za stokorunu snižuje riziko těžkého průběhu i úmrtí na onemocnění covid-19

** Klinická studie zkoumala vliv antidepresiva fluvoxamin na covid-19 ** Počet úmrtí souvisejících s covidem-19 klesl zhruba o 90 % ** Potřeba intenzivní lékařské péče se snížila zhruba o 65 %

Karel Kilián
COVID-19LékyDepreseMedicína
Nejlepší filmy na Netflixu v roce 2021. Všechny mají český dabing nebo titulky

Nejlepší filmy na Netflixu v roce 2021. Všechny mají český dabing nebo titulky

Tyto filmy byly v roce 2021 na českém Netflixu nejoblíbenější. Nerozlišujeme žánr, stáří ani hodnocení na filmových webech. Jde o oblíbenost, kterou sleduje web FlixPatrol a počítá z ní souhrnné žebříčky.

Ondřej Králík
Netflix
QR kódy jsou skvělý pomocník, ale i zlý pán. Tohle jsou nejčastější podvody, které vás mohou připravit o peníze

QR kódy jsou skvělý pomocník, ale i zlý pán. Tohle jsou nejčastější podvody, které vás mohou připravit o peníze

** Čtvercový grafický kód usnadňuje život už mnoho let ** S rostoucí oblibou a využitím přibývá i podvodů ** Nejčastěji jsou podvody zaměřeny na podstrčení falešného kódu

Martin Miksa
PodvodQR kódBezpečnost