Seznam.cz spouští novou verzi fulltextového vyhledávání

V průběhu dnešního dne dochází k další zlomové změně algoritmu fulltextového vyhledávače Seznam.cz, který v naší zemi stále dominuje v žebříčku nejpoužívanějších vyhledávačů.

Implementace nové verze technologie započala po desáté hodině dopoledne a pokud vše půjde hladce, dokončení změn by mělo být provedeno okolo šesté hodiny večerní. Informační zprávu o průběhu celé akce Seznam publikoval na stránce s přehledem služeb.

Hlavní technologickou změnou je jiný způsob uložení slov v databázi hledání (indexu). Vyhledávač Seznamu do dnešního dne do indexové databáze ukládal tzv. "lemmata", tedy základní tvar každého zaindexovaného slova. Tento způsob přinášel jednodušší vyhodnocení uživatelského dotazu - algoritmus hledal jedno lemma a ne množství různých tvarů daného slova. Jednoduchost ale s sebou přinášela i nevýhodu - špatné rozlišení dotazů, u nichž některé tvary slov kolidovaly s jiným dotazem.
 
Nová verze vyhledávání ukládá do databáze slova přesně ve tvaru, v jakém se na stránce vyskytují a následně pak rozšiřuje slova dotazu o možné tvary. Celý princip je už na první pohled podstatně náročnější na zpracování, výkon i databázi, ale zajisté může poskytnout podstatně přesnější výsledky.
 

Zdroj: Seznam.cz

Diskuze (31) Další článek: Efektivní metoda, jak zvýšit profit v E-shopu

Témata článku: , , , , , , , , , , , ,