Nový Trillium Software Discovery analyzuje data globálně

Diskuze čtenářů k článku

Hardy  |  11. 01. 2006 14:21

Trillium Discovery. Discovery znamená "objevit" defekty v analyzovanych datech. Je ale Discovery schopno provést své objevy nad velkými objemy dat? Bohužel se ukazuje, že sliby distributora převažují nad vlastní funkcionalitou nástroje z hlediska objemu zpracovávaných dat. Ukázalo se, že nástroj není schopen analyzovat velké objemy dat a tedy je z hlediska analýzy kvality dat v datových skladech nepoužitelný. Bohužel nástroj je limitován nejen co do objemu zpracovávaných dat, ale také do množství zpracovávaných sloupců. Což představuje značnou nevýhodu, neboť analýzu nejste schopni provést najednou a musíte vytvářet omezené výběry a ty pak vzájemně analyzovat tak, aby jse zajistili například analýzu každého sloupce s každým a pod.
Touto cestou se velice komplikovaně dostaneme k pořadovanému výsledku a navíc, pokud soubor obsahuje více jak 50 milionů záznamů, nemusí Discovery objevit věchny datové defekty.
Bohužel musím konstatovat, že Trillium Discovery není objevitelem. Nástroj tedy není schopen naplnit všechna očekávání a požadavky kladedné na vlastnosti data profilingových nástrojů.
 

Souhlasím  |  Nesouhlasím  |  Odpovědět
Milan Kucera  |  30. 05. 2005 14:40

Lze souhlasit s tím, že data profiling je mladou oblastí z řízení informační (datové) kvality v České Republice. Data profiling s sebou přínáší určitou funkcionalitu, která byla požadována dodavately nástrojů na čištění dat (Athanor, Trillium Sofware System nyní Trillium Quality) a tak lze vysledovat globální trend, kdy firmy na čištění dat kupují (Trillium Software a Avelino) nebo navazují těsnou spolupráci (Similarity Systems a Evoke) právě s data profilingovými společnostmi.
Nástroj by měl naplňovat nejen určitou funkcionalitu, ale také být schopen podpořit řízení informační kvality ve společnosti neboť tyto nástroje jsou k tomuto účelu příhodné. Provádějí analýzu dat na vstupu procesu verifikace, jsou schopny připravit potřebné soubory pro "data cleansing" nástroje a ve finále jsou schopny vyhodnotit efektivnost provedených korekcí.
Trillium Discovery se zde zmiňuje jak postupně zavádí konektory do některých databází, ale vzhledem k tomu, že všechna data před vlastním zpracování musí být přesunuta do vlastního prostředí nástroje, je otázkou, k čemu jsou uvedené konektory vhodné, když data mohou být připravena ve formě textových souborů, když jsou pak následně uložena do repository nástroje.
Repository obsahuje nejen vlastní data, ale také výsledky jednotlivých analýz. Z hlediska informačního stewardshipu by bylo vhodné aby repozitory byla otevřena nástrojům třetích stran a tak efektivně podpořila implementaci informačního stewatrdshipu, který je nezbytnou podmínkou pro následné řízení zlepšování informační kvality ve společnosti.
Běžnou záležitostí by pak měla být příprava dat pro Trillium Software System. V tomto případě je nutné řící, že prozatím integrace s Trillium Discovery není efektivní a proto na tomto poli má Trillium Software co dohánět. Jedním z důvodů je skutečnost, že se jedná původně o zcela samostatné nástroje, které jsou postupně integrovány.
Zcela mi chybí možnost tvorby business pravidel, korekčních mechanizmů tak, aby je bylo možné distribuovat prostřednictvím email bez dodatečných finančních nákladů. Této oblasti se Trillium Discovery nevěnuje.
Trilliium Discovery je tedy nástroj který ne zcela vhodně podporuje proces zlepšování informační kvality a tak stojí před společností Trillium SOftware hodně úsilí na tomto poli, aby byla schopna naplnit funkcionalitu konkurenčních nástrojů poskytujících ucelenou funkcionalitu všetně podpory informačního stewardshipu a zpřístupnění repository širokému okolí.
 

Souhlasím  |  Nesouhlasím  |  Odpovědět
Zasílat názory e-mailem: Zasílat názory Můj názor