reklama

Vyhledávací nástroj od Xeroxu simuluje lidskou inteligenci

Praha, 10. července 2007 – Xerox dnes představuje FactSpotter, nový softwarový nástroj pro prohledávání dokumentů. Vědečtí pracovníci z Evropského výzkumného centra Xeroxu (XRCE) v Grenoblu spojili pokročilé lingvistické metody s uživatelsky přívětivým rozhraním, které zákazníkům umožňuje vyhledávat informace prostřednictvím běžného jazyka.

Narozdíl od tradičních podnikových vyhledávacích systémů pátrá FactSpotter nejen po klíčových slovech v rámci dokumentu, ale hodnotí také kontext dokumentu, který hledané výrazy obsahuje. FactSpotter například při vyhledávání hesla „Jan Svěrák“ zobrazí nejen výsledky, které obsahují jeho celé jméno, ale i dokumenty, které jméno neosahují a přesto se ho týkají.

Inteligentní vyhledávač FactSpotter dokáže pročesávat téměř jakýkoliv dokument bez ohledu na jazyk v němž je napsán, na jeho umístění, formát nebo typ. Simuluje přitom způsob, jakým lidé přemýšlejí, hovoří a ptají se. Ve výsledku zobrazí pouze několik výstupů, které obsahují relevantní odpovědi na položený dotaz namísto stovek nepodstatných dokumentů.
 
„Náš vyhledávací engine překonal omezení typická pro vyhledávání podle klíčových slov a algoritmů současných data miningových nástrojů, které v praxi prohledávají pouze 40 % relevantních dokumentů, protože zadaná hesla jsou příliš omezující,” vysvětluje Frédérique Segond, vedoucí výzkumu v oblasti sémantiky Evropského výzkumného centra Xeroxu. „Nástroj společnosti Xerox je přesnější, protože se dokáže pohroužit do dokumentu a pochopit vztahy mezi jednotlivými slovy. ‘Pochopením’ kontextu dokáže rozpoznat správné informace a zvýraznit výskyt vyhledaného textu v dokumentu.“

FactSpotter je výsledkem a součástí dlouhodobého vývoje inteligentních technologií pro práci s dokumenty, který rozšiřuje rostoucí portfolio inovací společnosti Xerox se zaměřením na služby. Technologie obsažené v nástroji FactSpotter umožní zákazníkům lépe spravovat rozsáhlé archivy dokumentů a pracovat s velkými objemy informací ve finančním průmyslu, advokacii a dalších oborech. Xerox připravuje uvedení vyhledávacího nástroje FactSpotter na příští rok jako součást nabídky služeb pro právní kanceláře (Xerox Litigation Services), které zahrnují nástroje e-discovery pro zajišťování informací za účelem použití v právních sporech.

„Lidé, kteří pracují s informacemi, mají stále těžší pozici, vyrovnávají se s explozivním nárůstem objemu informací,” říká Mike Maziarka, ředitel konzultačních služeb v oblasti správy dokumentů společnosti InfoTrends. „V našem oboru potřebujeme nástroje, které usnadní hledání jehel v kupkách sena. FactSpotter je naplněním našich potřeb, protože usnadňuje vyhledávání, poskytuje přesnější, obsáhlejší výsledky a zvyšuje produktivitu informačních pracovníků.“

Nová generace vyhledávání

  • Uživatelské rozhraní systému FactSpotter umožňuje vyhledávání prostřednictvím přirozeného jazyka namísto nutnosti přizpůsobit dotaz počítačové logice. Tradiční systémy pracují pouze s jednotlivými slovy a vyhledají dokumenty, které obsahují pouze přesný obraz zadaných slov bez ohledu na jejich funkci v jazyce.
  • Narozdíl od tradičních vyhledávačů, které uživatele odkáží na celý dokument, v němž si uživatel musí sám najít relevantní výskyt hledaného hesla, FactSpotter uživateli nabízí konkrétní oblast dokumentu odpovídající dotazu.
  • FactSpotter bere do úvahy kontext celého dokumentu namísto shluku několika slov v blízkosti klíčového slova a pracuje se vztahy mezi větami a odstavci.
  • FactSpotter dokáže rozpoznat obecné termíny jako „lidé“ nebo „budova“ a vyhledá slova, která spadají do takto definované kategorie

Analýza významu dotazu a prohledávaného dokumentu umožňuje FactSpotteru výrazně usnadnit a zrychlit pátrání po konkrétních informacích. Například vyhledávání podkladů pro soudní líčení může díky FactSpotteru proběhnout velice rychle i při prohledávání milionů stran dokumentace. Rychlé a přesné vyhledávání dokáže revolučně usnadnit práci ve vědeckém výzkumu, farmakologii, advokacii, finančním průmyslu a dalších oborech bytostně závislých na dostupnosti kvalitních informací.

Témata článku: Discovery

Nejnovější komentáře

Přidat příspěvek
reklama
reklama