Vyhledávač obrázků od Seznamu je hrozný. Pomůže mu umělá inteligence

  • Vyhledávač obrázků je technologicky zastaralý
  • Nemůže se srovnávat s Googlem a Bingem
  • Brzy by se to ale mohlo změnit

Jednou z největších slabin Seznamu je jeho vyhledávač obrázků. Zatímco s texty si poradí víceméně stejně jako konkurence, s fotografiemi to málokdy dopadlo dobře.

Na obranu české internetové jedničky bychom sice mohli napsat, že se obrázky učí hledat teprve relativně krátkou dobu, protože dlouhé roky používala švédskou technologii PicSearch, jenže co naplat; píše se rok 2017, a zatímco ostatní učí své neuronové sítě indexovat obrázky na internetu podle jejich skutečného obsahu, Seznam na prostý dotaz „Brno“ zobrazí takovouto šachovnici fotografií:

Klepněte pro větší obrázek
Takto to dopadne, když v Seznamu vyhledáte obrázky Brna

Pokud jste nikdy nebyli v Brně a ze zeměpisu jste propadali už na základní škole, pro srovnání ukážu, jak má dnes vypadat výstup obrázkového vyhledávače pro podobný geografický termín. Stačí navštívit konkurenční Google nebo třeba Bing:

Klepněte pro větší obrázek Klepněte pro větší obrázek
No a takto to dopadne, když totéž „Brno“ vyhledáte na Googlu a Bingu. Rozdíl je naprosto propastný – asi tak 10-15 let vývoje.

Jak vidno, rozdíl je to naprosto propastný. Těžko říci, čím vším je dán, jistě se na tom ale podepisuje i strojové učení Googlu a Bingu, jejichž indexovací a vyhledávací mechanizmy netřídí fotografie pouze podle toho, jestli se na stránce nacházelo slovíčko „Brno“ a soubor obrázku se jmenoval třeba „brno.jpg,“ ale i na základě skutečného obsahu fotografie.

Jinými slovy, dominantou Brna je Špilberk a Petrov, oba zahraniční vyhledávače tedy nejprve zobrazily snímky s těmito a dalšími dominantami jihomoravské metropole, protože jejich strojové učení je na snímcích opravdu nalezlo.

Obrázky.cz fungují jen s přesnou frází

Vyhledávač Seznamu Obrázky.cz ovšem takto pokročilé řazení nepoužívá, a tak výsledek dopadl tak, jak dopadl. Nejen že mnohé fotografie nebyly vůbec pořízené v Brně, ale zároveň se jednalo o zcela anonymní místa.

Klepněte pro větší obrázek Klepněte pro větší obrázek
S přesným nebo dostatečně unikátním výrazem si Obrázky.cz poradí

Abyste ve vyhledávači obrázků Seznamu nalezli nějaké relevantní, musíte zadat buď co nejkonkrétnější frázi, anebo naopak dostatečně unikátní obecný termín. Čili když vyhledáte třeba slovíčko „notebook,“ opravdu se bude ve většině případů jednat o laptopy, protože toto slovíčko v češtině žádný další význam nemá.

Seznam testuje neuronovou síť ve vyhledávači obrázků

Seznam v tomto směru trošku zaspal dobu, to ale neznamená, že by pro něj byly neuronové sítě, strojové učení a prvky umělé inteligence španělskou vesnicí. Firma již roky provádí svůj vlastní experimentální výzkum a zdá se, že konečně uzrál čas k tomu, aby jej přetavila do svých produktů.

Seznam se ve čtvrtek na svém blogu pochlubil veřejnou betaverzí nového řadícího mechanizmu ve vyhledávači obrázků, který je už konečně postavený na zpracování obrazových dat neuronovými sítěmi.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Oslo ve starém vyhledávači a v betaverzi toho nového. Ano, takto to má vypadat!

Zkušební vyhledávač běží na vlastní adrese beta.obrazky.cz, takže se samozřejmě nabízí srovnání řazení s tím stávajícím na adrese obrazky.cz. To naše najdete v galerii výše.

Seznam v blogovém zápisku jako příklad uvádí norské hlavní město Oslo. Asi nebude překvapením, že ve stávající verzi vyhledávače se mezi prvními výsledky skutečně zobrazovali oslíci, norský nábytek a další nepříliš relevantní obrázky.

Nová verze na dotaz „Oslo“ na prvních příčkách naopak zobrazí to, co má, a prohlížeč tak zaplní fotografie norské metropole.

Uměla inteligence Seznamu v praxi

Hurá! Tak že by se Seznam v tomto směru konečně pochlapil a jeho vyhledávač byl opravdu použitelný? Oslo dopadlo docela dobře, a tak se samozřejmě nabízí krutý test Brnem.

Jak to dopadlo? Opravdu krutě…

Na prvním místě se už sice zobrazila alespoň kresba zdejší Staré radnice, jinak se však jedná o stejné snímky jako ve staré verzi vyhledávače s tím, že ani tentokrát nejsou všechny z Brna, ale třeba i z Prahy!

Klepněte pro větší obrázek Klepněte pro větší obrázek
Brno ve starém i novém vyhledávači. Tady umělá inteligence slušně řečeno selhala a výsledek je jen o píď lepší. Stále však hrozný.

Nabízí se tedy otázka, jestli má Seznam ve svém indexu vůbec nějaké reprezentativní snímky Brna. Má. Stačí vyhledat Petrov, Špilberk a další pamětihodnosti, načež jich Seznam vysype na obrazovku desítky a stovky ze všech možných úhlů.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Klobouk ve starém vyhledávači a v tom novém. Zmizela nahotinka, kterou bylo třeba rozčtverečkovat, a některé méně relevantní pokrývky hlavy.

Naštěstí se zdá, že takto špatně to dopadne jen v Brně a u jiných frází jsou již výsledky zpravidla mnohem lepší než ve stávající verzi vyhledávače.

Vyzkoušeli jsme to v praxi a dvacítku srovnávacích a komentovaných párů vždy pro stávající verzi a tu připravovanou najdete v galerii v úvodu článku.


Podívali jste se také na nové Obrázky.cz? Jak vám vyhledávaly? Bylo to na první pohled lepší, nebo stejné? Podělte se nám i ostatním v diskuzi pod článkem.

Diskuze (23) Další článek: V laboratoři se zrodily první kvasinky s umělou DNA

Témata článku: Seznam.cz, Web, Technologie, Umělá inteligence, Fotky, Vyhledávače, Strojové učení, Neuronová síť, Fotografování, Nábytek, Špilberk, Španělsko, Kresba, Slovíčko, Obrázek, Inteligence, Petro, Hlavní město, Oslo, Veřejná galerie, Vyhledávač, Úvod článku


Určitě si přečtěte

Portál občana už funguje. Na státní web vypadá až překvapivě použitelně

Portál občana už funguje. Na státní web vypadá až překvapivě použitelně

** Portál občana už funguje, vyřídíte na něm první požadavky ** Funkce se budou postupně rozšiřovat ** Web je docela moderní a přehledný

David Polesný | 65

15 věcí, které umí Windows 10, ale možná o nich vůbec nevíte

15 věcí, které umí Windows 10, ale možná o nich vůbec nevíte

** Systém Windows 10 umí spoustu užitečných drobností ** O mnoha praktických funkcích pravděpodobně ani nevíte ** Poznejte užitečné tipy, které se vám mohou hodit každý den

Vladislav Kluska | 36

Rekordy počasí: V Česku to ještě jde, skutečné extrémy zažívají jinde

Rekordy počasí: V Česku to ještě jde, skutečné extrémy zažívají jinde

** Teplotní extrémy dokážou překvapit. Seznamte se s rekordy v Česku i ve světě ** Rekordní hodnoty jsou mnohdy až k neuvěření ** Zjistěte, kdy ke bylo největší horko, zima, déšť či vítr

Karel Kilián | 7

Nechcete platit za Total Commander? Těmito bezplatnými programy ho můžete nahradit

Nechcete platit za Total Commander? Těmito bezplatnými programy ho můžete nahradit

** Total Commander je na Windows takřka legendou ** Licence však stojí více než tisíc korun ** Našli jsme pro vás deset alternativ dostupných zdarma

Karel Kilián | 141

Nová zbraň Microsoftu proti iPadu: Levný tablet Surface Go bude stát jen deset tisíc

Nová zbraň Microsoftu proti iPadu: Levný tablet Surface Go bude stát jen deset tisíc

** Microsoft představil nový tablet Surface Go ** Nový model zaujme nízkou cenou, ale schopnostmi zařízení Surface ** Microsoft nepoužil čip ARM, ale klasický procesor od Intelu 

Karel Javůrek | 116

Sex a rozmnožování při mezihvězdné cestě: Kolik lidí je potřeba pro let k Proximě Centauri?

Sex a rozmnožování při mezihvězdné cestě: Kolik lidí je potřeba pro let k Proximě Centauri?

** Vědci spočítali, jak velká by musela být posádka pro vícegenerační let k nejbližší hvězdné soustavě ** Proxima Centauri se nachází 4,3 světelných let od nás ** Za současných technologií bychom k ní letěli 6300 let

Petr Kubala | 55


Aktuální číslo časopisu Computer

Velký test 18 bezdrátových sluchátek

Vše o přechodu na DVB-T2

Procesory AMD opět porážejí Intel

7 NVMe M.2 SSD v přímém souboji