Určitě je to zajímavý. Jen bych připomněl službu Google suggest. Ta doplňujě nejčastější sekvence slov, podle toho, jak lidé hledají. A lidé hledají podle relevancí. V případě, kdyby lidé používali jen Google Suggest, brzo by se služba znehodnotila, protože v jistym smyslu by šlo jen o průměrné (nejčastější dotazy), napr. [george -> bush -> is -> an -> idiot]. Tím chci říci, že přesto, že dotazy jsou generovány lidmi, postupně se snižuje variance dotazů, TO znamená sníženou varianci informace, TO znamená omezenou, průměrnou, subjektivně vyloženou informaci. Tuto informaci někdy chceme ale někdy ne. Služba Google Suggest by bez normálního Google nemohla existovat.
Tvrdým oříškem bude určitě analýza dat. Pak kdybych chtěl hledat slova ["policie porušuje zákon"] a vyhledavač-analyzátor by narazil na video z czechteku, tak by mohlo dojít ke zmíněné interpretaci. Kdyby byl analyzátor kvalitní, tak by musel nějak upozornit, že informace je pravdivý vůči dotazu s nějakou pravděpodobností. Jiný problém je např. ve větě "Ženu holí stroj", výsledkem analýzy jsou různé interpretace.
Vše vypovídá o tom, že jakákoliv interpretace informace, ať subjektivní nebo objektivní vede postupem doby k znehodnocení databáze.
Rozpoznávání obrázků, filmu je určitě pěkná věc.
Myslím si, že dosavadní řešení např. Google je dostačující. Google by měl v ideálním případě brát dotaz jako soubor slov, bez interpretace. Google má k tomu účelu řadu příkazů, které napomáhají relevanci zvýšit.