reklama

Obří databáze Internet Archive pokořila hranici 10 PB

Organizace Internet Archive, která se snaží zachovat co možná největší internetové dědictví a podobně jako muzeum či archiv tedy ukládá obrazy webových stránek v čase a další materiály, oznámila, že její obří databáze, která se rozrůstá již od konce 90. let, pokořila metu 10 PB.

Deset petabajtů odpovídá deseti tisícům terabajtů. Na první pohled možná leckoho napadne, že to zase není tak vysoké číslo, samotné skeny textových webových stránek však často zabírají jen desítky kilobajtů dat.

Klepněte pro větší obrázek
Snímek Živě.cz z počátku roku 2005

Podobný projekt najdete i u nás. Jmenuje se WebArchiv.cz a provozuje jej Národní knihovna. Robot ukládá podobu registrovaných stránek v čase a vy je tak objevíte i po letech, přestože původní web už třeba dávno neexistuje. WebArchiv.cz se tedy může hodit například i pro odborné citace.

K čemu je to dobré v praxi? Před lety jsem vydával vlastivědný blog o brněnské historii, který však dnes už na internetu neexistuje. Když mě tedy kontaktovala jistá studentka s prosbou o odkaz na již neexistující článek, mohl jsem ji odkázat právě na projekt Národní knihovny, kde jej našla v plné a původní podobě.

Témata článku: Web

10 komentářů

Nejnovější komentáře

  • Hrdlodus 2. 11. 2012 17:37:24
    Sem patří diskuze o dohledání aktivity na Internetu. Co na tom, že web...
  • Karel Starý 2. 11. 2012 17:29:01
    10 PB? To je víc než moje složka s pornem.
  • House_MD 2. 11. 2012 16:58:23
    To asi nemají uložený v Cloudu :-D
reklama
Určitě si přečtěte

Facebook o nás ví vše. Díky dobře skrytému vyhledávači se to dozví i ostatní

Facebook o nás ví vše. Díky dobře skrytému vyhledávači se to dozví i ostatní

** Facebook o nás ví vše, protože mu to sami řekneme ** V jeho nitru se skrývá mocný vyhledávač ** Mohou jej zneužít stalkeři, sociální inženýři a další nezbedníci

16.  2.  2017 | Jakub Čížek | 72

Nevyznáte se ve značení procesorů Intelu? Tady máte tahák

Nevyznáte se ve značení procesorů Intelu? Tady máte tahák

** Z označení procesorů Intelu se toho dá mnoho vyčíst ** Ze čtyř čísel se dozvíte něco o výkonu i grafickém jádru ** Poradíme, jak číst číselné označení i písmena na konci

13.  2.  2017 | Stanislav Janů | 37


Aktuální číslo časopisu Computer

Stavba 3D tiskárny

Výbava domácí elektrodílničky

Budoucnost 5G sítí

Velké testy microSD karet a vodních chladičů

Přehled mobilních tarifů

reklama
reklama