Obří databáze Internet Archive pokořila hranici 10 PB

Organizace Internet Archive, která se snaží zachovat co možná největší internetové dědictví a podobně jako muzeum či archiv tedy ukládá obrazy webových stránek v čase a další materiály, oznámila, že její obří databáze, která se rozrůstá již od konce 90. let, pokořila metu 10 PB.

Deset petabajtů odpovídá deseti tisícům terabajtů. Na první pohled možná leckoho napadne, že to zase není tak vysoké číslo, samotné skeny textových webových stránek však často zabírají jen desítky kilobajtů dat.

archive.org.png
Snímek Živě.cz z počátku roku 2005

Podobný projekt najdete i u nás. Jmenuje se WebArchiv.cz a provozuje jej Národní knihovna. Robot ukládá podobu registrovaných stránek v čase a vy je tak objevíte i po letech, přestože původní web už třeba dávno neexistuje. WebArchiv.cz se tedy může hodit například i pro odborné citace.

K čemu je to dobré v praxi? Před lety jsem vydával vlastivědný blog o brněnské historii, který však dnes už na internetu neexistuje. Když mě tedy kontaktovala jistá studentka s prosbou o odkaz na již neexistující článek, mohl jsem ji odkázat právě na projekt Národní knihovny, kde jej našla v plné a původní podobě.

Diskuze (10) Další článek: ARM představil první 64bitové procesory, změní trh?

Témata článku: , , , , , , , ,