Jak se stát českou portálovou jedničkou: recept á la Centrum.cz

Uplynulý týden byl poměrně nabitý na informace přicházející z našich „portálových“ firem. Minulou středu jsem pod podobným názvem přinesl novinky o aktuálních plánech Seznamu, dnes si představíme plány, kterými si svou pozici na trhu chce udržet (a patrně ještě vylepšit) společnost NetCentrum, provozovatel portálu Centrum.cz.

Když jsem ve středečním článku hodnotil Seznam jako velmi konzervativní portál, který se jen pomalu pouští do něčeho nového, Centrum je jeho pravý opak. Snad každý si pamatuje jeho agresivní reklamní kampaň, pro kterou před několika málo lety využil i TV spoty, což na internetovou firmu bylo velmi odvážné (a především drahé). Od té doby uplynulo již mnoho vody a portálové firmy si uvědomují, že pokud si své pozice mají udržet, musí přijít s něčím novým. Již dávno neplatí, že vyhledávač = seznam stránek na Internetu s možností prohledávání. Dnešní portál nabízí řadu doplňkových služeb jako jsou emaily, mapy, kulturní přehledy a nově se přidávají i seznamy firem, odkazy na firmy bez vlastních www stránek, databáze často používaných služeb a další méně či více využívané webové produkty.

Analýza uživatelů - co zjistilo Centrum

Podobně jako v případu Seznamu, i v NetCentru předcházela změnám důsledná analýza dostupných dat – jakým způsobem nejčastěji uživatelé hledají, jaké pro hledání používají prostředky a podobně. Z této analýzy mj. vyplynulo, že počet hledání jednoslovných a víceslovných výrazů je v poměru cca 60:40 ve prospěch jednoslovných. Tento poměr se ale postupně vyrovnává. Ještě před několika lety byl počet vyhledávání jednoslovných výrazů vysoce nad 80 %. Zajímavou informací také je, že 90 % uživatelů neprohlíží 2. a další stránky výsledků vyhledávání – pohybují se pouze na první stránce, přičemž na první tři odkazy se kliká ve zhruba 30 % případů. To lze přeložit poměrně jednoznačně: umístění na nejvyšších pozicích v rámci 1. stránky výsledků se vyplácí.

Na scénu přichází Morfeo

Pod tímto lehce sci-fi názvem se skrývá nová vlastní vyhledávací technologie Centra. Sympatický je přístup této firmy k šíření vyhledávací technologie mezi další zájemce z řad programátorů. Starší verze projektu jsou totiž průběžně uvolňovány pro volné použití bez poplatků. Podle vyjádření zástupců společnosti napomáhá bezplatné šíření zdrojového kódu v konečném důsledku k rychlejšímu vývoji nových verzí vyhledávacího systému.

Jedním z hlavních atributů Morfea je specializace na češtinu, se kterou by měl být schopen pracovat na velmi vysoké úrovni. Skloňování či překlepy by pro tento systém neměly být žádnou překážkou. Stejně tak se do budoucna počítá s tím, že systém půjde ve šlépějích „inteligentních“ vyhledávačů typu AskJeeves a jemu podobných, kteří se dokáží vypořádat přímo s otázkami. Pro Morfeo by tedy neměl být problém zodpovědět kupříkladu dotaz typu „Kdo vyhrál běh na 100 metrů na olympiádě v roce 1980?“. Podle představitelů NetCentra se takové dotazy ve vyhledávači již dnes běžně objevují a proto považují za důležité, aby se jim tuto technologii podařilo bezchybně zvládnout.

Komentář: To mi přijde logické, prohledávač prostě musí být inteligentní a musí být schopen pochopit, co po něm uživatel přesně chce. Na Internet se stále více dostávají noví uživatelé s jen malými zkušenostmi, kteří zadání dotazu ve formě otázky považují za něco normálního. Je možné, že takových uživatelů bude brzy většina a v jejich případě nepřipadá v úvahu, že by se zaobírali logickými operátory, závorkami a složitou stavbou svého dotazu.

Už nyní ale Morfeo běžně zvládá pracovat se skloňováním, časováním, hovorovými výrazy a jednotným a množným číslem hledaného výrazu. Navíc nabízí kontrolu překlepů, kde vyhledavač upozorní na špatné zadání a nabídne hledání správného. Pro co nejpodrobnější vyhledávání je k dispozici i vyhledávání synonym. Na vývoji se spolupodílel Ústav formální a aplikované lingvistiky MFF Univerzity Karlovy.

Jednodušeji, jednodušeji, jednodušeji…

Stejně jako v dnešní době pomalu ztrácí smysl logické operátory, stírá se i rozdíl mezi vyhledáváním v katalogu a fulltextu. Morfeo tedy bude nabízet obě varianty. Pokud určitý web bude splňovat podmínky vašeho hledání, zobrazí se jeho krátká anotace získaná pomocí fulltextového prohledávání i katalogový popisek. Práce na zkvalitňování katalogu je možná trochu překvapivě velmi náročná na množství potřebné lidské pracovní síly, ale pokud má být katalog skutečně kvalitní, musí se zpracovávat ručně.

Podobně jako Seznam, i Centrum má v plánu integrovat do svého vyhledávání rozsáhlý katalog firem, databázi realit, prodejců automobilů apod.

Závěrem

Podle všeho vstupují portály do další etapy svého dlouhého běhu. Určitě bude zajímavé sledovat, s čím přijde poslední z velké české trojky – Atlas.cz. Je nepravděpodobné, že by se na poli objevil další významný hráč, ale přesto je tu několik dalších zajímavých technologií, např. Jyxo.cz, jehož technologie je použitá v portálu Quick.cz.

Diskuze (23) Další článek: Nová verze Mozilly Firebird 0.6 (Glendale)

Témata článku: Internet, Česko, Odvážný plán, Špatná podmínka, Portál, Bezplatná varianta, Jed, Vyhledávání, Víceslovný výraz, Recept, Stát, Anotace, Zajímavý případ, Vývoj automobilu, Jednotná mapa


Určitě si přečtěte

15 věcí, které umí Windows 10, ale možná o nich vůbec nevíte

15 věcí, které umí Windows 10, ale možná o nich vůbec nevíte

** Systém Windows 10 umí spoustu užitečných drobností ** O mnoha praktických funkcích pravděpodobně ani nevíte ** Poznejte užitečné tipy, které se vám mohou hodit každý den

Vladislav Kluska | 36

Apple: naše mapy budou nejlepší na světě. Tajně jsme na nich pracovali několik let

Apple: naše mapy budou nejlepší na světě. Tajně jsme na nich pracovali několik let

** Apple odhalil své plány na zcela nové mapy ** Několik let pracuje na nových mapách, které by měly předběhnout konkurenci ** Objeví se s příchodem iOS 12 pro vybrané státy

Karel Javůrek | 50

Google ADT-2: Miniaturní krabička s Android TV 8.0, kterou si nikdy nekoupíte

Google ADT-2: Miniaturní krabička s Android TV 8.0, kterou si nikdy nekoupíte

** Dlouho se nevědělo, co to přesně má být ** Pak se s krabičkou Google pochlubil na I/O ** Do „Chromecastu“ vtěsnal celý Android TV

Jakub Čížek | 24

Alan Turing: Genius, který matematicky stvořil počítač

Alan Turing: Genius, který matematicky stvořil počítač

Řešením matematického problému se dostal k modelu teoretického stroje, který nese jeho jméno a je základem logiky univerzálních počítačů.

Pavel Tronner | 57


Aktuální číslo časopisu Computer

Velký test 18 bezdrátových sluchátek

Vše o přechodu na DVB-T2

Procesory AMD opět porážejí Intel

7 NVMe M.2 SSD v přímém souboji