Live Labs Pivot: Procházejte, řaďte a analyzujte svět

Když něco nevím, zabrouzdám na Wikipedii. Brzy možná ale i na Pivot, který funguje trochu jinak. Řadí a filtruje fotografie a kartičky. Nechápete? Nebojte, princip je jednoduchý.

Jak vypadá současná webová stránka? V drtivé většině případů je to jen složitá změť HTML, CSS a JS kódu s důrazem na jedině – grafický výstup. Stroj, třeba vyhledávač, se však v něm vyzná jen s velkými obtížemi, netuší totiž, která část webové stránky obsahuje úvod, která tělo dokumentu – třeba článku – a kde se v textu nachází další logické celky. Čtenář toto všechno ví, jelikož vidí hotový grafický výsledek.

Web je plný dat, jak je ale vydolovat?

Touha po vnitřní logické srozumitelnosti internetové stránky je stará jako web samotný, doslova palčivá je však až od příchodu fulltextových vyhledávačů, které na přelomu století začaly nahrazovat staré katalogové vyhledávače (americké Yahoo, český Seznam). Robot, který prochází webovou stránkou a hodnotí její obsah pro vyhledávač, totiž potřebuje znát její strukturu, potřebuje vědět, jakou část stránky může použít třeba při výpisu výsledků, kde je na stránce ten nejdůležitější obsah a kde navigace, třeba rubriky nebo navigační menu..

V současné době takový robot s jistotou porozumí pouze nadpisům, názvům kapitol a odkazům, jak se ale vyznat v textu a doprovodných informacích. Jak se vyznat v tom, kam patří obrázky, vložené video, grafy a jiná multimédia. Řešením by mohly být takzvané mikroformáty, tedy několik technik, které v kódu stránky například popíšou, co obsahuje každý z odstavců. Pro čtenáře se tím nic nemění, jsou totiž neviditelné, dataminigový nebo vyhledávací robot ale přesně ví, že v této části stránky se nachází mapa, tady obrázky k článku, tady reklama a zde třeba seznam kapitol.

Různí hráči na trhu zkouší různé dataminingové metody. Dolují z webu data stejným způsobem jako horníci v patnáctém století, každý z nich ale používá cepín s trošku jinými parametry. Fulltextové vyhledávače do toho jdou po hlavě a s využitím složité analýzy webové stránky se pokouší odhadnout její strukturu. Celkem slušné to umí Google, učí se to Microsoft a také Seznam. Ten prostřední, Microsoft, ale zkouší ještě trošku jinou cestu, jak se vyznat v datech na webové stránce. Jedná se o projekt Live Labs Pivot.

Live Labs Pivot – webové kontingenční tabulky

Live Labs Pivot na první pohled vypadá jako jakýsi minimalistický webový prohlížeč. Ačkoliv jej napsali a navrhli lidé z Microsoftu, s Internet Explorerem má společně skutečně jen to vykreslovací jádro Trident. Pivot používá Direct3D, respektive technologii Seadragon (Deep Zoom) pro zobrazování náročné grafiky a neobejde se bez zapnutého akcelerovaného prostředí Windows Aero. Na Windows XP a nejnižších verzích Windows Vista si jej tedy nevyzkoušíte.

pivot webovy prohlizec.png  pivot webovy prohlizec.png
Na první pohled vypadá Pivot jako běžný webový prohlížeč – že by takto jednou vypadal Internet Explorer?

Pivot ale není pouze prohlížeč webových stránek, ale i jakýchsi informačních databází – katalogů obrázků a textových informací. Tyto se na první pohled jeví jako běžné webové stránky s příponou CXML dostupné skrze webovou adresu, jedná se ale o speciální XML soubory, které obsahují samotnou databázi.

Tak trošku jiná galerie

Takovou databází může být třeba seznam amerických prezidentů. Pokud ji v Pivotu otevřete, zobrazí se šachovnice fotografií a postranní panel, ve kterém můžete výsledky snadno filtrovat a přeskupovat podle nejrůznějších parametrů jako věk, vzdělání nebo politická příslušnost. Pivotová webová tabulka má tedy stejné rysy jako kontingenční tabulky z Excelu. Vše je zároveň hardwarově akcelerované, program si ale řekne o podstatnou část systémových prostředků – 2 GB operační paměti je vážně minimum.

pivot kolekce.png  pivot vudci.png
Autoři připravili několik kolekcí – databází, na druhém obrázku je tak galerie světových vůdců, kterou můžete fitrovat a různě řadit

Wikipedie jako kartotéka kartiček

Pivotová databáze může být statická, obsahuje tedy vše v jednom souboru, nebo složitější a dynamická, kdy se data generují na základě vašeho dotazu. A mezi tyto dynamické databáze patří i Pivot, který pracuje s databází anglické Wikipedie. Pivot tedy může zobrazovat a analyzovat i mnohem složitější data, než pouhopouhý seznam prezidentů. A právě napojení na Wikipedii už trošku připomíná dataminingové praktiky z úvodu. Vrcholem by totiž bylo, kdyby program uměl vytvářet podobné kontingenční tabulky i z dat dostupných na běžné webové stránce.. Ostatně i ta je založenána jazyku XML. V takovém případě by program rozluštil její obsah a vytvořil by podobnou galerii nebo mapu informací, které by pomocí postranního filtrovacího panelu uvedl do kontextu.

US prezidenti.png  US prezidenti - stale zijici.png  pivot wikipedie.png
Databáze amerických prezidentů a tatáž data omezená na ty, kteří jsou ńaživu
Na druhém obrázku pak rozcestník pro používání Wikipedie uvnitř Pivotu
 
pivot - praha, wikipedie.png  pivot - wikipedie, praha.png  pivot - wikipedie, praha.png
Na Wikipedii si budete muset v Pivotu chvíli zvykat. Představte si ji jako obrovské množství kartotékových lístečků. Na každém z nich je určitá samostatná informace, encyklopedický záznam. A každá z těchto kartiček je zařazena v odpovídající kartotéce. Filtorvání a řazení v Pivotu pak vlastně funguje stejným způsobem, jako byste vybírali z kartotéky pouze ty správné kartičky.  Na prvním obrázku tedy najdete všechny kartičky na dotaz „Prague“ v anglické Wikipedii. Na druhém obrázku jsou pak vyfiltrované pouze ty kartičky, které odpovídají pražským městským částem a na třetím ty kartičky, na kterých je zmínka o uzavírání míru v Praze

Live Labs Pivot je v současné době pouze technologický experiment, který si v našich podmínkách vyzkoušíte jedině v rámci několika předpřipravených databází – chytrých katalogů fotografií a konektoru pro Wikipedii. Autoři ale připravili i detailní dokumentaci, jendoduché pivotové galerie, databáze, či katalogy (nazývejte to dle chuti) si tedy můžete vytvořt i vy. K těm nejjednodušším vám přitom bude stačit Excel a speciální aplikace.

Má technologie Live Labs Pivot šanci? Nebo se naopak hodí jen na tak úzký okruh dat, že ji užije jen zanedbatelné množství uživatelů? Podělte se se svým názorem v diskuzi pod článkem.

stáhnout program Live Labs Pivot 1.0.6000.1 Licence: freeware (pro nekomerční použití), 28 MB
Autor: Microsoft Live Labs
Web programu: getpivot.com



X

Doporučit článek

Vaše jméno:

Váš e-mail:

E-mail adresáta:

Komentář:

kontrolní kód

Odeslat


celkem 2

Poslední komentáře Komentáře

A já podle nadpisu myslel, že už koupili nový... Pepa Vybíhal 10. 3. 2010 10:57
Mno musím uznať vyzerá to vcelku zaujímavo, ale... Peter Dvorský 10. 3. 2010 8:21
Přidat příspěvek Zobrazit vše


Další podobné články

Google Wallet je na Androidech s rootem snadno napadnutelný

Google Wallet je na Androidech s rootem snadno napadnutelný

Před 1 hodinou  |  Čížek Jakub  |  1
Intel Haswell: fotografie nové generace čipu od Intelu pro rok 2013

Intel Haswell: fotografie nové generace čipu od Intelu pro rok 2013

Před 2 hodinami  |  Javůrek Karel  |  3
Betaverze Windows 8 bude k dispozici 29. února

Betaverze Windows 8 bude k dispozici 29. února

Před 7 hodinami  |  Čížek Jakub  |  16
Google Chrome 17 načítá weby dřív, než na ně vstoupíte

Google Chrome 17 načítá weby dřív, než na ně vstoupíte

Google Chrome začal odhadovat, na které stránky půjdete, aby je mohl začít na pozadí načítat. A když stáhnete potenciálně nebezpečný soubor, upozorní vás, že si musíte dát pozor.

Před 17 hodinami  |  Večeřa Zdeněk  |  18

Jak na zabezpečení komunikace přes IPsec

Jak na zabezpečení komunikace přes IPsec

IP security (IPsec) je protokol pro zabezpečení komunikace mezi počítači na sítích TCP/IP. Vznikl jako povinná součást IPv6 a později se začal uplatňovat i ve starším protokolu IPv4.

Před 17 hodinami  |  Šimerda Pavel  |  2

Syrský prezident a jeho tým používá heslo 12345

Syrský prezident a jeho tým používá heslo 12345

Před 17 hodinami  |  Čížek Jakub  |  11
Apple iTV: Není důvod se těšit

Apple iTV: Není důvod se těšit

Američtí zákazníci se těší na tajemnou iTV od Applu a naopak výrobci televizorů propadají panice a uvádějí produkty proti neznámému konkurentovi. Co zatím víme?

Před 17 hodinami  |  Holčík Tomáš  |  18


DEJTE NÁM TIP NA ČLÁNEK









Další weby Mladé fronty