V průběhu dnešního dne dochází k další zlomové změně algoritmu fulltextového vyhledávače Seznam.cz, který v naší zemi stále dominuje v žebříčku nejpoužívanějších vyhledávačů.
Implementace nové verze technologie započala po desáté hodině dopoledne a pokud vše půjde hladce, dokončení změn by mělo být provedeno okolo šesté hodiny večerní. Informační zprávu o průběhu celé akce Seznam publikoval na stránce s přehledem služeb.
Hlavní technologickou změnou je jiný způsob uložení slov v databázi hledání (indexu). Vyhledávač Seznamu do dnešního dne do indexové databáze ukládal tzv. "lemmata", tedy základní tvar každého zaindexovaného slova. Tento způsob přinášel jednodušší vyhodnocení uživatelského dotazu - algoritmus hledal jedno lemma a ne množství různých tvarů daného slova. Jednoduchost ale s sebou přinášela i nevýhodu - špatné rozlišení dotazů, u nichž některé tvary slov kolidovaly s jiným dotazem.
Nová verze vyhledávání ukládá do databáze slova přesně ve tvaru, v jakém se na stránce vyskytují a následně pak rozšiřuje slova dotazu o možné tvary. Celý princip je už na první pohled podstatně náročnější na zpracování, výkon i databázi, ale zajisté může poskytnout podstatně přesnější výsledky.
Zdroj: Seznam.cz