WebFast, stejná politika jako Google

Na českém Internetu se objevil nový internetový vyhledávač Webfast.cz. Jediný český vyhledávač bez grafické reklamy slibující vyhledávat podle kvality stránky.
Vyhledávač používá fulltextovou technologii z mateřského portálu Centrum.cz, ovšem bez jakýchkoli grafických reklam. Má poskytovat rychlé a účinné vyhledávání a v prostředí českého internetu nabízet vynikající výsledky. Podíváme se tedy, jak tomu je.

Svým zaměřením je podobný Googlu, který má také maximálně úsporné provedení a podobný způsob prohledávání. NetCentrum chce na Webfast vydělávat stejně jako Google pronajímáním vyhledávacího enginu.

Na Webfastu jsou výsledky řazeny podle tzv. QUALITY FACTORU (Q) vyjadřujícím míru důležitosti vzhledem k dotazu. Vložíte-li například do vyhledávače dvě slova, každé slovo má standardně hodnotu 10 000 bodů. Výsledný Q faktor nejlepší stránky může v tomto případě být pouze něco málo nad 20 000 Q. Další výhodou pro pokročilejší uživatele je možnost definovat vlastní podmínky pro hledaný výraz dle akcentu, kategorií a vah slov.

Na Webfastu se Q dokumentu počítá tak, aby alespoň přibližně odpovídalo významu dokumentu. Zahrnuje jednak body za samotné výskyty slov nebo celých frází a navíc zavádí bodování vlastních stránek (např. podle polohy v hierarchii), pak také zvýhodňuje podle kontextu (nadpisy, tučné písmo, ...) a konečně zvýhodnění podle blízkých výskytů (tj. když jdou zadaná slova po sobě).

Q můžeme považovat za funkci přiřazující dvojici (stránka, dotaz) jakousi míru „kvality“ stránky vzhledem k zadanému dotazu. Funkce pro výpočet „kvality“ stránky je složena z:

  • Bonusů za výskyt slov, každé slovo v dotazu je ohodnoceno standardně 10 000 body. Hledanému slovu se dá nastavit i jiná hodnota než 10 000, tím se změní váha hledaného slova, tj. jeho důležitost mezi ostatními hledanými slovy.
  • Bonusů za blízké výskyty, pokud jsou slova napsaná v dotazu za sebou a ve stejném pořadí se vyskytnou i na stránce, připočtou se další body.
  • Bonusů za důležitá slova, například slova v nadpisech či keywords jsou hodnocena jinak.
  • „Malus“ (opak „bonusu“) u dlouhých dokumentů, kde nemá vyhledávač kompletní informace o pozici slov. V tomto případě vyhledávač fráze jen odhaduje a započte se pouze polovina bodů.
  • Statické ohodnocení stránky za polohu v URL plus manuálně konfigurovatelné body pro různé servery, o kterých je známo, že poskytují výrazně relevantní nebo naopak výrazně irelevantní informace.
  • Dynamické ohodnocení stránky. Něco jako na Googlu, u kterého se hodnotí jak často na stránky ukazují různé weby, ty nejvíce linkované se vyskytnou jako autoritativní na čelných místech.
Nyní k vlastnímu testu. Pokoušel jsem se vyhledat informace o procesoru Duron od AMD. Na Googlu jsem pomocí dotazu „duron informace site:.cz“ našel první informace v šestém odkazu. Na Webfastu po zadání dotazu „duron informace“ jsem našel nějaké informace až na 20 místě (byly nalezeny dokonce i informace o kvalitě ovzduší). Zatím nic moc, nevzdám se, nový pokus. Při dalším dotazu „ACCENTS 2 "duron" and "informace"“ se požadovaná informace posunula na šestnácté místo. Při pokusu vyhledat „deCSS soud“ jsou na tom oba vyhledávače skoro stejně.

Webfast na rozdíl od Googlu nabízí lepší práci s diakritikou, vyhledávání s diakritikou, bez či bez ohledu na diakritiku. Na Webfastu mně trochu vadilo, že je nutné přepínat mezi normálním a prostým vyhledáváním a taky složitější zadávání dotazů oproti Googlu. Na Googlu zadám a už hledám.

Webfast je to samé, co fulltext na Centrum.cz, pokud se vám něco (ne)líbí tam, (ne)bude se vám to líbit také zde. Pro běžné návštěvníky je ale podstatné, že Webfast je českým prohledávačem s nejúspornější stránkou. Nezdržují vás žádné reklamy a boxíky pro uživatele. To je třeba jeden z důvodů, proč i u nás je mimořádně oblíbený Google. Webfast na tom možná něco změní, ale z hlediska návštěvnosti to pro Centrum.cz nebude výrazný přínos. Hlavní těžiště leží v licencování vyhledávače pro jiné firmy. Google je s tím úspěšný, tak proč by nemělo být i NetCentrum.

Diskuze (9) Další článek: Jak se zbavit červa BadTrans?

Témata článku: , , , , , , , , , , , ,