Kam kráčejí internetové vyhledávače?

České systémy se zlepšily, ale stále jsou značně pozadu za světovými lídry.
Kam kráčejí internetové vyhledávače?

Vlivný americký website zabývající se pouze vyhledávacími systémy s názvem Searchenginewatch před pár týdny vyhlásil vítěze mezi fulltexty a indexéry (publikováno zde na ClickZ). Autoři výstižně poznamenávají, že kdyby to byla Olympiáda, vítězný Google by stěží unesl tíhu zlatých medailí. Zvítězil totiž, kde se dalo: jako nejlepší vyhledávač celkově, jako nejlepší vyhledávač obrázků, jako vyhledávač s nejlepším designem, jako vyhledávač, který je nejpřátelštější k webmasterům (zařazování odkazů je mimořádně snadné a je zdarma), a získal i cenu pro nejlepší „udělátko“ za svůj Google Toolbar.

Ostatní sbírali ceny v kategoriích vedlejších či v těch, kde Google nepůsobí: Vivísimo je nejlepší metavyhledávač, Yahoo! News má nejlépe udělané zpravodajství, Overture (bývalý GoTo.com) a Inktomi nejlepší systémy placených odkazů, v technologii Paid Placement, resp. Paid Inclusion, Scirus zase nejlépe indexuje vědecké weby. Jsou to ale, řečí filmových Oscarů, ceny, které se rozdávají ráno na vedlejším pódiu – hvězdou večera je Google. Ze zhruba šesti set hlasů získal 66 %, druhý Alltheweb.com 12 %, Altavista 7 %, Yahoo 2 %.

Loni udělala tato služba zase grandiózní skok kupředu – což je o to zajímavější, protože rozšířený názor veřejnosti je, že „se tady nedá už moc vymyslet“. Prohledávání ne-HTML dokumentů je geniální tah a ukázalo se, jak obrovské a zajímavé informační bohatství leží na webu například v PDF souborech. Google ukázal, že indexovat obrázky tak, aby bylo možné něco zajímavého najít, skutečně jde a opět zvýšil úroveň relevantnosti výsledků. Malým zázrakem v dnešní době je také to, že Google je bez reklam, které jinde výrazně zpomalují načítání stránek (asi nejhorší je v tom MSN Search); musíme zde ovšem uvést čestnou zmínku o českém WebFastu od Centra, který je také „čistý“.

Ve vývoji vyhledávačů můžeme zpozorovat několik zajímavých trendů – bohužel takových, které jejich čeští kolegové zatím moc nezachytili.

  • Sdružení vyhledávání v katalogu a vyhledávači. Google dnes při vyhledávání sáhne též do katalogu (který přebírá z vynikajícího dmoz.org), a pokud najde při vyhledávání ve fulltextu shodu s katalogem, zobrazí ve výsledcích i odkaz na katalog. To je důležité zvýšení přístupnosti zejména pro laické uživatele, neboť ti by vůbec neměli být obtěžováni nějakým rozlišováním „hledej v katalogu… nenalezeno v katalogu, hledej ve fulltextu…“. Uživatel zkrátka zadá příkaz k hledání a chce výsledek, odkaz na stránku, nic víc.
  • České fulltexty takřka neobsahují nic z množství operátorů a modifikátorů, kterými oplývá nejen Google, ale i jeho souputníci (Inktomi, Fast, AltaVista) – jediné, co nabízejí, jsou už dnes poněkud „trapné“ základní booleovské operátory. Nejde o věci, bez kterých se nedá žít, ale čas od času jsou to ideální vyhledávací pomůcky nebo funkce nenahraditelné při speciálních požadavcích (např. cache:, link:, related:, intitle:, inurl: atd.). Navíc i Boole či hledání fráze v uvozovkách nefunguje dobře – nebo je možná špatně implementováno, to je z hlediska uživatele samozřejmě jedno.
  • Neprohledávání binárních souborů (.PDF, .DOC, ale i obrázků, zvuků, videosekvencí) je silně na škodu, stejně jako chybějící specializovaný univerzitní vyhledávač. Vyhledávání obrázků je velice populární činností a jeho podíl na celkovém množství vyhledávacích dotazů stále roste; přitom český vyhledávač by měl co nabídnout proti zahraničnímu, neboť obrázky jsou jak „mezinárodní“, tak i silně lokální – domácí celebrity, města, česká krajina a podobně.
  • Schopnost vybavovat cacheovaný obsah stránky je také funkce, kterou člověk u Google využívá často a s chutí a která mu u domácích indexérů chybí.

Mimo „vinu“ tvůrců českých indexérů je pak neexistence české obdoby open directory, jako je zmíněný dmoz.org. Existuje samozřejmě opendir.cz, ale není kvalitní, za což samozřejmě nemůže jeho autor (Marek Schoř), ale nezájem našinců o to, stát se dobrovolnými editory tohoto projektu. (Což je mimochodem pro český Internet poměrně příznačné: každý chce brát, dávat nikdo).

Nechci tvůrce českých vyhledávačů (první příčku má Empyreum, stříbro WebFast, další místa neurčena) nijak hanět, protože dnešní stav je ve srovnání s hrůzou, která panovala před rokem, velkým pokrokem k lepšímu. Uvedené zaostávání za světem má jednoduchou příčinu – více peněz, lepší produkt, méně peněz, horší produkt, a hrstička českých portálů zaplatí hrstičku programátorů. Kdo ví, má dávno nainstalovaný Google Toolbar a nebrodí se ničím, co končí na .cz. S půvabným kouzlem nechtěného to nejlépe vystihuje nápověda k vyhledávání na Atlasu, kde se zmiňuje přísloví Trpělivost přináší růže. Skutečně – vhodný námět pro slogan domácích vyhledávacích serverů.

Diskuze (6) Další článek: Společnost Diderot v konkursu

Témata článku: Google, Nejhorší stav, Zaostávání, Vedlejší produkt, Nejlepší design, Zařazování, Google Toolbar, Vhodná reklama, Oscar, Rozšířený názor, Nejlepší vyhledávač, Nejlepší systém, Vyhledávač, Zlatá medaile


Určitě si přečtěte

Podívejte se na Windows z roku 1990. Před 30 lety přišly Windows 3.0 a líbily se nám

Podívejte se na Windows z roku 1990. Před 30 lety přišly Windows 3.0 a líbily se nám

** 22. května 1990 uvedl Microsoft Windows 3.0 ** Systém z Microsoftu definitivně udělal lídra na desktopu ** Tehdejší Windows byly vlastně grafickou nadstavbou nad MS-DOS

Jakub Čížek | 74

Galerie: Podívejte se na čínský Linux, se kterým to na svých PC zkusil i Huawei

Galerie: Podívejte se na čínský Linux, se kterým to na svých PC zkusil i Huawei

** Huawei se loni dostal do křížku s USA ** Začal to proto zkoušet s konkurenčním operačním systémem ** Jmenuje se Deepin a před pár dny se dočkal nové verze

Jakub Čížek | 36


Aktuální číslo časopisu Computer

Megatest 24 PC zdrojů

Jak využít umělou inteligenci

10 špičkových sluchátek s ANC

Playstation 5 vs Xbox Series X