Seznam zpřístupní vyhledávacího robota vývojářům

Seznam nabídne svého vyhledávacího robota a desítky milionů datových záznamů vývojářům a startupům. Prozatím v rámci programu StartupYard, v budoucnu možná i dalším.

Největší tuzemská internetová firma zpřístupní svého vyhledávacího robota vývojářům a startupům z celé Evropy, včetně České republiky. K technologiím budou mít v prvé řadě přístup účastníci nadcházejícího třetího ročníku smíchovského akcelerátoru StartupYard, jehož chod a reformu se rozhodl Seznam pro následující rok zaštítit. Do budoucna není vyloučeno, že k robotovi získají přístup také další zájemci či univerzity.

Seznam jádro svého vyhledávání zpřístupňuje v rámci aktivit pro podporu startupů. Společnost navázala úzkou spolupráci se StartupYardem a nový ročník bude zaměřen na oblast práce s daty (big data, analytika a podobně), tedy na to, o co v internetovém vyhledávání ve velké míře jde.

Zdejší internetová jednička podporovala i prozatím poslední ročník pražského akceleračního programu, obecně ale byla s kvalitou týmu nespokojena. „Dříve se hlásilo poměrně málo projektů, navíc často nesmyslných,“ tvrdí generální ředitel Seznamu Pavel Zima. „Tentokrát se zaměříme čistě na technologie, protože věříme, že v Česku má smysl dělat především skutečně technologické projekty,“ říká. „Je to reakce na stav české startupové scény, chceme jí dát směr,“ doplňuje šéf oddělení rozvoje obchodu Marek Nový.

Vlastní cluster „na hraní“

Zástupci Seznamu tento týden v Paříži na konferenci Le Web oslovují kontakty s tím, aby zprávu o poskytnutí technologie vyhledávacího robota „roznesli“ po Evropě. „Očekáváme, že by se do programu mohlo přihlásit kolem 200 zájemců,“ navazuje Zima s tím, že do finálního programu má být vybráno asi 6 projektů. Šance zaujmout starý kontinent česká společnost rozhodně patří. V regionu je to jedna z mála společností, která dokáže takovou technologii a hlavně nasbíraná data dát k dispozici.

Klepněte pro větší obrázek
Data máte některá naše data. Zleva: generální ředitel Seznamu Pavel Zima a šéf fulltextu Marek Gizela.

Ty pak budou moci pracovat se „seznamáckou“ vyhledávací technologií. Firma jim každopádně nedá přístup úplně ke všemu. „K dispozici poskytneme vše, co nás nemůže nějakým způsobem poškodit,“ vysvětluje šéf vyhledávacího týmu Marek Gizela. V podstatě má jít o samotnou technologii robota, jehož databáze bude naplněna daty, se kterými si bude možné „hrát“. „Budou tam třeba nasbírané a analyzované webové stránky,“ říká Gizela. Ve výsledku by mělo jít o desítky milionů záznamů. „Navíc si tam samozřejmě týmy budou moci umístit data vlastní.“

Seznam pro tyto účely vyčlení nový serverový cluster. Jeho přesné specifikace ale ještě neví, bude záležet na specifických požadavcích přihlášených projektů. Společnost zároveň s tím poskytne různé mentory a oborníky, kteří s touto technologií pracují a počítají s tím, že řady rádců hodně rozšíří, například o inženýry ze spřáteleného ruského Yandexu. „Máme teď poměrně dlouhý seznam kandidátů, ze kterých vybíráme,“ konstatuje Nový.

Tyto aktivity Seznamu by měly zajímat především ty projekty, které se nějakým způsobem snaží pracovat s velkými daty. Seznam přitom upozorňuje na to, že nemusí jít čistě o nástroje, které by pak v budoucnu rozšířily jeho byznys a funkce. „Typicky z toho mohou vzniknout věci na predikci v podstatě všeho možného, analýzu dat a podobně,“ vysvětluje Marek Nový. Seznam už údajně několik zájemců samo oslovilo.

A nemusí jít pouze o teprve začínající projekty nebo služby ve fázi pouhé myšlenky a nápadu. Zapojit se mohou i technologie v pokročilejší fázi. Seznam totiž nabízí v reálu používanou technologii naplněnou velkým objemem dat, ke kterému se není možné jen tak jednoduše dostat. Pokročilé projekty si tak například mohou ověřit své modely, získat provozní zkušenost a podobně.

Námluvy s ČVUT

Technologie Seznamu pracuje s Hadoopem, HBase a vývojáři zřejmě budou moci využít také Apache Giraph. Veškeré náležitosti bude možné konzultovat přímo s tvůrci a odborníky.

Tento pilotní projekt svádí k myšlenkám, zda jednou Seznam ze své vyhledávací datové technologie a chystaného cloudu nehodlá vytvořit platformu – službu, kterou si budou moci vývojáři a datoví pracovníci pronajímat za poplatek, podobně jako třeba Amazon Web Services. „Je to logická myšlenka,“ usmívá se Pavel Zima s tím, že právě něco takového by jeho společnosti případně otevřelo cestu na zahraniční trhy.

V čem už každopádně jednání probíhají, je spolupráce s vysokými školami. Seznam uvažuje, že by robota a data zpřístupnil také akademické sféře pro jejich výzkum. „Jsme v kontaktu zejména s Janem Šedivým z ČVUT,“ potvrzuje Marek Gizela. Šedivý na technické škole rozjel program pro big data a ona data aktivně shání. Díky jeho snaze škola získala také grant na výuku samostatného předmětu.

Ze samostatného startupového investičního fondu Seznamu naopak sešlo. Firma provozuje oddělenou společnost pro investice, není ale primárně zaměřena na tyto aktivity. Seznam naopak jasné zaměření StartupYardu bere jako dost možná poslední šanci pro to, aby ho startupy přesvědčily. „Pokud ne, podporu zřejmě výrazně omezíme,“ vzkazuje Pavel Zima.

Váš názor Další článek: Šuškanda: Windows 8.2 by mohl vrátit nabídku Start

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,