Obří databáze Internet Archive pokořila hranici 10 PB

Obří databáze Internet Archive pokořila hranici 10 PB

Organizace Internet Archive, která se snaží zachovat co možná největší internetové dědictví a podobně jako muzeum či archiv tedy ukládá obrazy webových stránek v čase a další materiály, oznámila, že její obří databáze, která se rozrůstá již od konce 90. let, pokořila metu 10 PB.

Deset petabajtů odpovídá deseti tisícům terabajtů. Na první pohled možná leckoho napadne, že to zase není tak vysoké číslo, samotné skeny textových webových stránek však často zabírají jen desítky kilobajtů dat.

Klepněte pro větší obrázek
Snímek Živě.cz z počátku roku 2005

Podobný projekt najdete i u nás. Jmenuje se WebArchiv.cz a provozuje jej Národní knihovna. Robot ukládá podobu registrovaných stránek v čase a vy je tak objevíte i po letech, přestože původní web už třeba dávno neexistuje. WebArchiv.cz se tedy může hodit například i pro odborné citace.

K čemu je to dobré v praxi? Před lety jsem vydával vlastivědný blog o brněnské historii, který však dnes už na internetu neexistuje. Když mě tedy kontaktovala jistá studentka s prosbou o odkaz na již neexistující článek, mohl jsem ji odkázat právě na projekt Národní knihovny, kde jej našla v plné a původní podobě.

Diskuze (10) Další článek: ARM představil první 64bitové procesory, změní trh?

Témata článku: Web, Textová podoba, Obří databáze, Databáze, Arc, Národní knihovna, Původní materiál

Určitě si přečtěte


Aktuální číslo časopisu Computer

Jak rychlé je nabíjení bez drátů?

Test 11 sluchátek pro hráče

Aplikace, které vám zachrání dovolenou

Kompletní přehled datových tarifů