Umělá inteligence | Web | Vyhledávače

Vyhledávač obrázků od Seznamu je hrozný. Pomůže mu umělá inteligence

  • Vyhledávač obrázků je technologicky zastaralý
  • Nemůže se srovnávat s Googlem a Bingem
  • Brzy by se to ale mohlo změnit

Jednou z největších slabin Seznamu je jeho vyhledávač obrázků. Zatímco s texty si poradí víceméně stejně jako konkurence, s fotografiemi to málokdy dopadlo dobře.

Na obranu české internetové jedničky bychom sice mohli napsat, že se obrázky učí hledat teprve relativně krátkou dobu, protože dlouhé roky používala švédskou technologii PicSearch, jenže co naplat; píše se rok 2017, a zatímco ostatní učí své neuronové sítě indexovat obrázky na internetu podle jejich skutečného obsahu, Seznam na prostý dotaz „Brno“ zobrazí takovouto šachovnici fotografií:

313620504
Takto to dopadne, když v Seznamu vyhledáte obrázky Brna

Pokud jste nikdy nebyli v Brně a ze zeměpisu jste propadali už na základní škole, pro srovnání ukážu, jak má dnes vypadat výstup obrázkového vyhledávače pro podobný geografický termín. Stačí navštívit konkurenční Google nebo třeba Bing:

772014233 340179748
No a takto to dopadne, když totéž „Brno“ vyhledáte na Googlu a Bingu. Rozdíl je naprosto propastný – asi tak 10-15 let vývoje.

Jak vidno, rozdíl je to naprosto propastný. Těžko říci, čím vším je dán, jistě se na tom ale podepisuje i strojové učení Googlu a Bingu, jejichž indexovací a vyhledávací mechanizmy netřídí fotografie pouze podle toho, jestli se na stránce nacházelo slovíčko „Brno“ a soubor obrázku se jmenoval třeba „brno.jpg,“ ale i na základě skutečného obsahu fotografie.

Jinými slovy, dominantou Brna je Špilberk a Petrov, oba zahraniční vyhledávače tedy nejprve zobrazily snímky s těmito a dalšími dominantami jihomoravské metropole, protože jejich strojové učení je na snímcích opravdu nalezlo.

Obrázky.cz fungují jen s přesnou frází

Vyhledávač Seznamu Obrázky.cz ovšem takto pokročilé řazení nepoužívá, a tak výsledek dopadl tak, jak dopadl. Nejen že mnohé fotografie nebyly vůbec pořízené v Brně, ale zároveň se jednalo o zcela anonymní místa.

190535711 908178912
S přesným nebo dostatečně unikátním výrazem si Obrázky.cz poradí

Abyste ve vyhledávači obrázků Seznamu nalezli nějaké relevantní, musíte zadat buď co nejkonkrétnější frázi, anebo naopak dostatečně unikátní obecný termín. Čili když vyhledáte třeba slovíčko „notebook,“ opravdu se bude ve většině případů jednat o laptopy, protože toto slovíčko v češtině žádný další význam nemá.

Seznam testuje neuronovou síť ve vyhledávači obrázků

Seznam v tomto směru trošku zaspal dobu, to ale neznamená, že by pro něj byly neuronové sítě, strojové učení a prvky umělé inteligence španělskou vesnicí. Firma již roky provádí svůj vlastní experimentální výzkum a zdá se, že konečně uzrál čas k tomu, aby jej přetavila do svých produktů.

Seznam se ve čtvrtek na svém blogu pochlubil veřejnou betaverzí nového řadícího mechanizmu ve vyhledávači obrázků, který je už konečně postavený na zpracování obrazových dat neuronovými sítěmi.

90956634 174738926
Oslo ve starém vyhledávači a v betaverzi toho nového. Ano, takto to má vypadat!

Zkušební vyhledávač běží na vlastní adrese beta.obrazky.cz, takže se samozřejmě nabízí srovnání řazení s tím stávajícím na adrese obrazky.cz. To naše najdete v galerii výše.

Seznam v blogovém zápisku jako příklad uvádí norské hlavní město Oslo. Asi nebude překvapením, že ve stávající verzi vyhledávače se mezi prvními výsledky skutečně zobrazovali oslíci, norský nábytek a další nepříliš relevantní obrázky.

Nová verze na dotaz „Oslo“ na prvních příčkách naopak zobrazí to, co má, a prohlížeč tak zaplní fotografie norské metropole.

Uměla inteligence Seznamu v praxi

Hurá! Tak že by se Seznam v tomto směru konečně pochlapil a jeho vyhledávač byl opravdu použitelný? Oslo dopadlo docela dobře, a tak se samozřejmě nabízí krutý test Brnem.

Jak to dopadlo? Opravdu krutě…

Na prvním místě se už sice zobrazila alespoň kresba zdejší Staré radnice, jinak se však jedná o stejné snímky jako ve staré verzi vyhledávače s tím, že ani tentokrát nejsou všechny z Brna, ale třeba i z Prahy!

726809739 92385120
Brno ve starém i novém vyhledávači. Tady umělá inteligence slušně řečeno selhala a výsledek je jen o píď lepší. Stále však hrozný.

Nabízí se tedy otázka, jestli má Seznam ve svém indexu vůbec nějaké reprezentativní snímky Brna. Má. Stačí vyhledat Petrov, Špilberk a další pamětihodnosti, načež jich Seznam vysype na obrazovku desítky a stovky ze všech možných úhlů.

902102835 640572239
Klobouk ve starém vyhledávači a v tom novém. Zmizela nahotinka, kterou bylo třeba rozčtverečkovat, a některé méně relevantní pokrývky hlavy.

Naštěstí se zdá, že takto špatně to dopadne jen v Brně a u jiných frází jsou již výsledky zpravidla mnohem lepší než ve stávající verzi vyhledávače.

Vyzkoušeli jsme to v praxi a dvacítku srovnávacích a komentovaných párů vždy pro stávající verzi a tu připravovanou najdete v galerii v úvodu článku.


Podívali jste se také na nové Obrázky.cz? Jak vám vyhledávaly? Bylo to na první pohled lepší, nebo stejné? Podělte se nám i ostatním v diskuzi pod článkem.

Diskuze (23) Další článek: V laboratoři se zrodily první kvasinky s umělou DNA

Témata článku: , , , , , , , , , , , , , , , , , , , , , , ,