Za výkonem pevných disků - RAID 0 vs. Raptor

Kombinace dvou pevných disků s prokládaným zápisem získává v poslední době na popularitě. Lidé ohromení velkými čísly v některých testovacích programech nabývají dojmu, že právě RAID 0 vyřeší ten největší problém výkonu počítače - omezení dané pevným diskem. Je skutečnost tak růžová? Nebude disk Raptor s deseti tisíci otáčkami za minutu rychlejší?
Za výkonem pevných disků - RAID 0 vs. Raptor

RAID 0 – nebezpečný výkon

Alternativou k pořízení drahého pevného disku s 10 000 ot./min je některé z polí RAID. RAID je zkratka pro Redundant Array of Independent Disks neboli „přebytečné pole nezávislých disků“. Pole v tomto kontextu můžeme definovat jako dva či více pevných disků zapojených do nějaké nestandardní formy zápisu a čtení (neboli jinak, než je běžné u jednoho disku). Tato nestandardnost spočívá v tom, že u RAID pole se jeden soubor zapisuje na více pevných disků najednou, a to většinou pouze z části.

Patrně se právě divíte, co znamená ono „přebytečné“. RAIDových polí existuje mnoho typů. V praxi se ale nejvíce používají tři – mezi ně patří i RAID 0, o kterém si dnes něco povíme. Jak už nula v názvu napovídá, není tento typ RAIDu až tak úplně standardní. Není na něm totiž vůbec nic redundantního. Je to čistě zrychlující technologie. U ostatních typů tomu tak ale není. U nich je totiž vždy nějaký ten disk přebytečný, aby bylo možné uchovávat nejen uživatelem používaná data, ale také něco navíc. Důvod je prostá snaha o vyšší spolehlivost – tím, že se uloží i něco navíc, je pole chráněno proti výpadku jednoho či více disků. Tak například pole RAID 5 sestavené ze tří disků dosahuje kapacity pouze dvou disků. Třetí slouží pro uchování kontrolních součtů, které v případě poruchy jednoho z disků umožní obnovit data. V praxi tak RAIDová pole většinou plní dvě funkce – navýšení výkonu a ochranu dat. Za tento luxus vždy platíme nějakou nevýhodou. U ochrany dat je to požadavek na dodatečný pevný disk, na kterém budou uložena ona redundantní data.

RAID 0 je specifickým typem pole z toho důvodu, že neobsahuje žádnou redundanci (proto ona nula v názvu). Neplní tedy funkci ochrany dat před poškozením pevného disku, ale zároveň také nestojí nic navíc. Poskytne tedy kapacitu, která je součtem kapacit použitých disků.

RAID 0 je založen na velice jednoduchém principu. Máme-li soubor o nějaké velikosti, pak současným zápisem na dva pevné disky tak, že na každý uložíme polovinu dat, dosáhneme vyšší (přesněji dvojnásobné) rychlosti čtení a zápisu.

Stripping (proužkování)

RAID 0 pracuje na jednoduchém principu zvaném stripping (proužkování). Pro jeho pochopení uveďme příklad. Mějme soubor o velikosti 24 kByte. Velikost proužku stanovme na 4 kByte. Pak v případě RAIDu 0 bude ukládání na dva disky probíhat následovně:

1 až 4 kB → na první disk
5 až 8 kB→ na druhý disk
9 až 12 kB→ na první disk
13 až 16 kB→ na druhý disk
17 až 20 kB→ na první disk
21 až 24 kB→ na druhý disk

Toto prokládání je navrženo tak, aby došlo k maximalizování výkonu jak při čtení, tak při zápisu. Celá operace je provedena na úrovni řadiče pevných disků, v některých případech s asistencí procesoru (zejména u levnějších řadičů neobsahujících odpovídající logiku v hardware). RAID 0 je dnes možné sestavit velmi levně, neboť prakticky každá novější, trošku lépe vybavená základní deska obsahuje řadič s touto funkcí. Pak už stačí koupit dva disky stejné kapacity...


Čipová sada Intel P965 + ICH8R nabízí RAID 0, 1, 10 a 5.

Velikost proužku hraje klíčovou roli pro celkový výkon pole. V našem modelovém příkladu jsem uvedl prokládání po 4 kByte. V praxi se běžně používá prokládání po 4, 8, 16, 32, 64 nebo 128 kByte. Žádná z těchto voleb není ideální, přitom její správné pochopení je klíčové.

Uveďme si opět příklad. Mějme soubory o velikosti 8 kByte. Pokud nastavíme stripe size (velikost proužku) na 4 kByte, pak jeden soubor bude ukládán na dva pevné disky (na každý z nich polovina). Pokud budeme chtít zapsat celý soubor, dosáhneme dvojnásobné rychlosti zápisu. Pokud budeme chtít soubor číst, rychlost bude taktéž dvojnásobná.


Červenou tečkou je znázorněno umístění požadovaných dat

Operace přitom bude probíhat tak, že oba pevné disky budou zapisovat na stejné místo na plotně, přičemž disk 1 bude zapisovat data 1 až 4 kB a disk 2 pak 5 až 8 kB.

Když změníme prokládání na 8 kByte, situace se dost změní. První disk zapíše celý soubor, zatímco druhý zapíše další soubor. Celý „vtip“ je v tom, že za této situace první disk zapisuje na nějaké místo na disku, zatímco druhý může zapisovat na místo úplně jiné (případně třeba i číst). Oba disky se pak chovají nezávisle. Protože vyhledávání je pro výkon pevného disku mnohem významnějším faktorem než samotný zápis, bude tato volba podstatně rychlejší, než kdyby tyto dva 8 kByte soubory zapisovaly dva disky se stripe size 4 kByte! Nevýhodou je, že pokud se bude zapisovat jen jediný 8 kByte soubor, nedojde k žádnému urychlení.

Podobné to bude u stripe size 16 kByte. Tam jeden disk zapíše 16 kByte vcelku. Pokud se bude pracovat s menšími soubory, než kolik činí tato velikost, bude urychlení plynout z toho, že oba disky budou jednat nezávisle (tedy z průměrně rychlejšího vyhledávání dat). Pokud bude objem dat větší, urychlení zajistí zrychlený zápis a čtení prostřednictvím rozložení úkolu mezi dva disky. Tyto dva výkonové faktory působí proti sobě. Správnou volbou velikosti proužku zajistíme optimální výkon. Tento bude přirozeně záviset na typu prováděné operace, přesněji řečeno na velikosti souborů, se kterými se pracuje.

Technicky není možné zajistit, aby byla stripe size variabilní pro každý soubor. Problematické je také zajistit změnu velikosti u již vytvořeného pole. Proto je nutné již při vytváření pole vědět, jaká velikost bude s největší pravděpodobností optimální.

Jedna důležitá poznámka: Malá velikost proužku u řadičů neobsahujících hardwarovou logiku zatěžuje procesor mnohem víc než velká velikost – logicky při poloviční velikosti proužku dochází k zdvojnásobení počtu operací.

Bez ohledu na to, jaký typ disku použijete, nejmenšího zatížení dosáhnete s velkým proužkem.

Pozor na nebezpečí ztráty dat – s RAIDem 0 roste

Zásadní nevýhodou RAIDu 0 je, že v případě selhání jednoho z disků přicházíte o všechna data. Pravděpodobnost poruchy je tak mnohem vyšší (téměř dvojnásobná). Jak to? Důkaz můžeme provést jednoduchým statistickým výpočtem. Máme-li pravděpodobnost poruchy disku o velikosti „p“, pak pravděpodobnost setrvání v dobré kondici je „1-p“. Uvažujme, že p = 5 %, což je pro dnešní pevné disky vcelku typická hodnota.

Můžou nastat následující situace:

Oba disky přežijí: 95 % × 95 % = 90,25 %
První disk se porouchá a druhý přežije: 5 % × 95 % = 4,75 %
První disk přežije a druhý se porouchá: 95 % × 5 % = 4,75 %
Oba disky se porouchají: 5 % × 5 % = 0,25 %

Součet pro kontrolu: 90,25 % + 2x 4,75 % + 0,25 % = 100 %. Výpočet je v pořádku.

U RAIDu 0 si můžeme dovolit pouze první situaci. Při ní je pravděpodobnost poruchy 9,75 %, což je téměř dvojnásobek oproti 5 % pro samostatný pevný disk. RAID 0 tak proto není doporučován v situaci, kdy nechcete přijít o svoje data. Nevyplatí se věřit lidem, kteří obhajují spolehlivost RAIDu 0 slovy, že jim funguje už několik měsíců / let. Statistika hovoří jasně a výmluvy těchto lidí pramení pouze z jejich chabých znalostí této exaktní vědy.

Témata článku: Hardware, Pevné disky, Kapacita, RAI, Důležitá poznámka, kB, Špičková rychlost, Pole, Strip, Centrum, Čtení, Raid, Cílová oblast, Výkon, Celá hra, Disk zapojený, Druhý muž, Small, Center, Jednotlivé bity, Disk, Mechanická část, Fyzikální limit, Razantní navýšení, Druhé řešení


Určitě si přečtěte

Proč je COVID-19 tak nebezpečný, jak se detekuje, jak ničí a máme už pandemii?

Proč je COVID-19 tak nebezpečný, jak se detekuje, jak ničí a máme už pandemii?

** V čem spočívá nebezpečí nemoci COVID-19? ** Jak se testuje její přítomnost v těle? ** Jak se ničí UVC i ozónem a proč už CNN mluví o pandemii?

Jakub Čížek | 73

Šest nejlepších služeb a aplikací pro automatizaci online světa a chytré domácnosti

Šest nejlepších služeb a aplikací pro automatizaci online světa a chytré domácnosti

** Nastavte si automatiku na každodenní rutinní záležitosti ** Propojte online služby a chytrou domácnost ** Vybrali jsme šest nejlepších služeb pro automatizaci

Karel Kilián | 14


Aktuální číslo časopisu Computer

Megatest 24 PC zdrojů

Jak využít umělou inteligenci

10 špičkových sluchátek s ANC

Playstation 5 vs Xbox Series X