Množství dat prudce roste, hrozí nám datový kolaps?

Vánoce mají být svátky klidu, ale i v tento čas přichází zneklidňující informace. Ohromná množství dat v počítačích se totiž ukazují jako nebezpečná hrozba.

Žijeme v době, které dominují informace a ve které jsme všemožnými informacemi doslova zahlcováni každý den. Samotné rozlišování, zda pro nás daná data mají nějakou hodnotu, stojí spoustu energie. Kam až hromadění dat může dojít? Hrozí nám „datový kolaps“? Se zajímavou analýzou na toto téma přišly společnosti EMC a S&T CZ, přičemž závěr je jasný – ano, hrozí.

1000 miliard GB na obzoru

V tuzemských počítačích se data hromadí tak závratným tempem, že je uživatelé nestačí řádně ukládat, natož pravidelně zálohovat. V roce 2010 bude množství vytvořených a replikovaných informací tvořit 966 miliard gigabytů. To je osmnáctkrát více než všechny knihy, které byly kdy napsány. Pomyslný komínek knih by sahal od Slunce až na Pluto a zpět. V záplavě dat hrozí nevratná ztráta klíčových dokumentů či chaos – uživatelé nebudou schopni potřebné informace v nahromaděných datech najít.

Asi se shodneme na tom, že každý uživatel počítače v závislosti na své profesi denně vytvoří megabyty či gigabyty dat. Průměrný uživatel tak ročně vyprodukuje 40 GB dat, která zahrnují nejčastěji textové dokumenty, e-maily, fotografie a videonahrávky. Jistě jsou i tací, kteří díky internetovým službám pro sdílení dat či výměnným P2P sítím zvládají onen roční průměr během týdne. „Z analýzy vyplývá, že až na výjimky z řad větších firem málokterá firma či jednotlivec řeší ukládání a archivaci dat. Je proto jen otázkou času, kdy dojde ke kolapsu,“ řekl Jan Teuschel, technologický expert společnosti EMC.

Firmy a zejména domácnosti si totiž do důsledku neuvědomují, že dnes uložená data musí být dostupná nejen příští rok, ale třeba i za desítky let. Rychlé tempo, kterým data na firemních či domácích discích přibývají, znamená reálnou hrozbu. Tou je myšlena situace, kdy potřebná data – například firemní smlouvy či fotografie z dovolené – nejsou dostupná. Datový kolaps může mít řadu podob: selhání či poškození úložného disku, jeho zcizení, neúmyslné smazání dat či třeba poškození nebo ztráta záložního média. Během let se může navíc shromáždit tolik dokumentů, že najít ten potřebný je zhola nemožné – ať už na disku počítače nebo v množství záložních disků.

Stahujeme kopie…

A ruku na srdce milí čtenáři, víte přesně, kde máte co uloženo? Nepřerůstají vám data přes hlavu? Uchovávání dat vytvořených samotným uživatelem by se jistě dalo ještě zvládnout. Nicméně značnou část ukládaných souborů tvoří kopie dat vytvořených jinde. Například e-mail s 5MB obrázkem zaslaný deseti kolegům ubere kliknutím myši na firemních discích 50 MB prostoru. Pokud jde o velkou firmu, denní akumulace dat je nepředstavitelná. Větší firmy jsou proto přibývajícími daty doslova zavaleny. Šéf informačních technologií společnosti Chevron například tvrdí, že jeho firma denně akumuluje 2 terabyty dat, což je datový prostor, o kterém se ještě před několika lety tvrdilo, že by měl dvěma lidem vydržet na celý život.

Kolaps hrozí zejména těm firmám a jednotlivcům, kteří nemají vypracovaný systém ukládání a archivace dat. Mohou tak v důsledku o cenné informace navždy přijít nebo je jednoduše nenajdou. A nejde jen o pravidelné ukládání, ale i o to, kam se data ukládají a jak se archivuji. V případě firem to může ohrozit chod společnosti, domácnosti mohou přijít třeba o jedinečné fotografie svých ratolestí. Typickým fatálním omylem je například představa, že data stačí uložit třeba na DVD disk. „Životnost takových médií je v lepších případech deset let, ale disk nemusí být čitelný již po několika letech,“ upozorňuje Vojtěch Dvořák ze společnosti S&T CZ.

Převládnou výkonné pevné disky

Jako nejspolehlivější metoda archivace dat se jeví pevné disky. Sice ani ty nemají neomezenou životnost, ale je možné je snadno monitorovat, a pokud se schyluje k poruše, lze data přenést na jiný disk. Z pohledu firemní praxe se proto jako ideální řešení prosazuje budování centralizovaných úložišť dat. Tam jsou systémově ukládána data a s ohledem na jejich důležitost je zajištěna jejich rychlá dostupnost. Dalším způsobem, jak dostat data pod kontrolu, je volba důmyslnějšího způsobu ukládání dat. Spoustu místa lze ušetřit například zálohováním odkazů na již existující soubory. „Tím se zabrání nekontrolovatelnému tvoření kopií souborů. Úspory jsou markantní například u firem s mnoha pobočkami. Centralizovaná úložiště mají datové využití kolem 90 %, přičemž obyčejně se využitelnost pohybuje pouze kolem 40 %,“ říká Jan Teuschel.

Problémový ale není jen objem uchovávaných dat, ale i množství ukládaných souborů. Jak najít mezi desítkami tisíc souborů klíčový dokument, nahrávku telefonu či třeba fotografii? Uživatel je musí být schopen kdykoli najít, což v takovém množství dat nemusí být vůbec jednoduché. Ve výši zmíněné analýze se hovoří o celých 70 procentech korporátních dat, která nejsou nijak systematicky uložena či indexována. Cílem firem by proto mělo být dostat oněch 70 % dat pod kontrolu. Na trhu se proto stále více prosazují různé typy nástrojů pro indexaci obsahu takzvaných search nástrojů – například Microsoft Search či Google Search. Ty mohou pomoci při hledání v malých objemech dat, například v domácím počítači. Pro větší objemy dat jsou ovšem nepoužitelné, pro ně nastupuje technologie pro centralizovanou správu obsahu, takzvaný content management.

A ještě pár zajímavostí na závěr. Nároky na uložení velkého množství dat stoupají každým rokem. Zatímco průměrná velikost fotografie byla před několika lety okolo 2 MB, nyní díky lepším fotoaparátům a důrazu na vysoké rozlišení mají pět a více megabytů. S příchodem digitální televize a obsahu ve vysokém rozlišení hlad po úložném prostoru ještě více vzrostl. V roce 2006 činilo podle studie IDC množství vytvořených a replikovaných informací 161 exabytů (161 miliard gigabytů). To je třikrát více než všechny knihy, které byly kdy napsány.

Ještě lépe si lze toto množství informací představit jako dvanáct komínků knih dosahujících ze Země na Slunce. Do roku 2010 bude toto množství šestinásobné. Při použití analogie s knihami by komínek knih sahal od Slunce až na Pluto a zpět. Jen kvůli e-mailové komunikaci se každoročně ve firmách i domácnostech naakumuluje obrovské množství dat. Souvisí to s rychlostí internetu, která se každoročně zvyšuje. Podle studie IDC během let 1998 až 2006 počet odeslaných e-mailů rostl šestkrát rychleji než počet uživatelů e-mailu. Zčásti kvůli spamu, ale částečně i proto, že lidé posílají více e-mailů.

Já sám za sebe musím přiznat, že hledat něco v desítkách vypálených CD/DVD většinou předem vzdávám, pokud přesně nevím kde to najdu. A jelikož to opravdu není ideální řešení a je velmi pohodlné mít data „po ruce“, asi svému 500 GB externímu disku brzy pořídím ještě 1 TB brášku. Takže pozor na data, ať vás v příštím roce nestihne datový kolaps.

Diskuze (74) Další článek: Po ICQ se šíří vir, který krade účty

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,