Petr Hejl vyvinul první prototyp svého revolučního hledače

Začátkem loňského roku překvapil brněnský programátor Petr Hejl svým nápadem, který prezentoval v investorské reality show České televize Den D. Vymyslel prý unikátní algoritmus nového vyhledávače, který by předčil i současné technologie Googlu. Ten do vývoje investuje miliardy dolarů a zaměstnává tým špičkových programátorů po celém světě, Petr Hejl však žádal pouze jeden milion korun pro sebe a maximálně dva další programátory. Investici v pořadu nedostal, ale po roce se mu podařilo potřebné peníze získat od 23 menších investorů. Nyní se pochlubil, že vyvinul první funkční prototyp nového vyhledávače. Prozatím ho nazývá Hlodač.

Klepněte pro větší obrázek
Design Hlodače se inspiruje od všech tří největších konkurentů – od Googlu si bere jednoduchost, od Bingu úvodní obrázek a barevně se odkazuje na Yahoo

Bohužel, nový Hlodač si stále nevyzkoušíme, adresu testovací verze nám autor neprozradil. Spokojit se tak můžeme pouze s jedinou ukázkou vyhledání klíčového slova „Lednice“. Ta nám ale o kvalitách nového algoritmu nic neřekne, protože testovací verze hledá pouze na 22 webech Petra Hejla, převážně věnovaných Jižní Moravě a Lednici.

Klepněte pro větší obrázek
Ukázka hledání nového Hlodače.

Když už nemáme k dispozici žádné praktické ukázky v reálném provozu, můžeme se podívat na útržky informací z programátorské kuchyně Petra Hejla. Jeho projekt se aktuálně skládá z jedenácti modulů, které dohromady dávají asi deset tisíc řádků kódu. Aktuální verze by měla být schopna hledat v milionovém indexu stránek, cílem je miliarda. V té fázi už by měly být výhody Hlodače prokazatelné a prodejné.

Jeden z modulů zajišťuje tzv. unsort, Petr Hejl funkci popisuje následovně: „Bude se rychle stahovat velké množství WWW stránek, odhadem 1000 stránek za sekundu. Poběží paralelně 100 stahovacích programů, v každém poběží 10 paralelních částí. Realizoval jsem to pomocí metody AsyncCallback programovacího jazyku C#. Pokud by se stahovaly po sobě WWW stránky z jedné domény, mohla by tato rychlost příslušný WWW server shodit, nebo by mi mohl tamní webmaster zakázat přístup. Proto musím udělat unsort původního pořadí WWW adres ke stažení tak, aby v unsortovaném pořadí, podle kterého se bude stahovat, byly WWW adresy z jedné a týž domény co nejvíce rozstrkané po celém pořadí.“

Klepněte pro větší obrázek
Miniukázka zdrojového kódu, bohužel nic neříkající

K tvorbě tohoto modulu dodává: „Nezdá se to, ale je to matematicky velmi obtížná úloha, algoritmus má řadu částí. Vymyšlení a naprogramování mi trvalo cca den a noc (24 hodin, takřka v kuse).“

Steve Ballmer možná už otevírá peněženku a v Googlu se začínají chystat ne těžké časy. Na Živě ale zůstáváme v klidu, bez praktických ukázek funkčnosti kódu projekt zatím budí dojem práce středoškolského studenta. Uvidíme, co Petr Hejl předvede 21.6.2011, kdy plánuje spuštění ostré verze Hlodače, která by měla postupně naindexovat celou miliardu stránek. Zpracování prý bude trvat 10 až 100 dní.

Témata článku: Technologie, Web, Prototyp, Petr, Webmaster, Reality Show, Česká televize živě

568 komentářů

Nejnovější komentáře

  • kroniak 13. 6. 2011 5:39:02
    nechapem preco tomuto clovekovi pomahate s kodom... vidite ze do...
  • Drahoslav Stejskal 10. 6. 2011 15:07:46
    Pane Hejle, plánujete si do budoucna pořídit něajký programátorský tým,...
  • filhouse 10. 6. 2011 0:53:27
    Jen počkejte, Hlodač Vám ještě ukáže zač je toho loket. Až vyleze i Hlodač...
Určitě si přečtěte

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

** Gary Kildall pochopil, že levné výpočetní čipy mohou posloužit jako univerzální počítače pro všechny ** Připravil pro ně proto první operační systém ** Později mu systém vyfoukl Microsoft a nazval ho MS DOS

23.  4.  2017 | Pavel Tronner | 52

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

** Už je to tady, lidé přestávají chápat počítače ** Systémy neuronových sítí začínají pracovat tak, že ani jejich tvůrci přesně neví, co se uvnitř děje ** Do budoucna to může být závažný problém

24.  4.  2017 | Jakub Čížek | 111

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

** Slavný osmibitový počítač Sinclair ZX Spectrum byl uveden právě před 35 lety ** Připomeňte si tento průkopnický počítač v tematických článcích ** Podívejte se, jak funguje dnes

23.  4.  2017 | Pavel Tronner | 13

Správný počítač má alespoň dva monitory. Anebo je to jinak?

Správný počítač má alespoň dva monitory. Anebo je to jinak?

** David si nedokáže představit práci bez dvou a více monitorů ** Kubovi naopak stačí jeden a ve více displejích se ztrácí ** Jaký přístup je lepší?

23.  4.  2017 | Jakub Čížek | 59

Český Google Překladač začal používat umělou inteligenci. Konec „drahoušků zákazníků“

Český Google Překladač začal používat umělou inteligenci. Konec „drahoušků zákazníků“

** Google ve svém překladači roky používal statistickou technologii ** Nyní zavádí strojové učení a neuronové sítě ** Rozdíl by měl být zvláště na větších textech patrný už nyní

20.  4.  2017 | Jakub Čížek | 31

Brno otevřelo největší českou dílnu pro bastlíře. Kladívka, vrtačky, 3D tiskárny, laserové řezačky. Je tu vše

Brno otevřelo největší českou dílnu pro bastlíře. Kladívka, vrtačky, 3D tiskárny, laserové řezačky. Je tu vše

** Máte nápad, ale chybí vám stroje a pořádná dílna? ** Chcete postavit ptačí budku, nebo krabičku pro Arduino? ** Brno otevřelo svůj FabLab – laboratoř pro bastlíře

19.  4.  2017 | Jakub Čížek | 31


Aktuální číslo časopisu Computer

První test AMD Ryzen

Velké testy: 22 powerbank a 8 bezdrátových setů

Radíme s koupí Wi-Fi routeru

Co dokáží inteligentní domy?