TOP500: Pětistovka nejrychlejších superpočítačů a Amálka

Nedávno byl zveřejněn aktualizovaný žebříček nejvýkonnějších superpočítačů současnosti. Na prvním místě se udržel Roadrunner, česká Amálka se ale bude muset ještě hodně snažit.

Každý rok v červnu a listopadu zveřejní Hans Meuer z Heidelberské univerzity společně s Jackem Dongarrou z Univerzity Tennessee a kolegy z výzkumného ústavu v Berkeley žebříček pěti set nejvýkonnějších počítačů současnosti – paralelních superpočítačů.

Superpočítač podle Wikipedie
Superpočítač je obecné označení pro velice výkonný počítač. Superpočítače se používají pro složité výpočetní úlohy, např. výzkum genomu, fyzikální modelování apod. Běžným dnešním způsobem návrhu superpočítačů je propojení velkého množství běžných počítačových procesorů prostřednictvím speciální vysokorychlostní počítačové sítě, tzv. cluster. Tento způsob používá např. firma Google pro katalogizaci stránek z celého internetu.

Jejich výkon se tradičně měří pomocí benchmarku Linpack v jednotce Flops, což je vlastně počet jednoduchých matematických výpočtu s reálnými čísly za jednotku času (flop/s). Člověk prý dokáže na kalkulačce provést maximálně deset podobných operací za sekundu, kalkulačka má tedy přeneseně řečeno maximální teoretický výkon 10 Flopů.

První superpočítače, které překonaly hranici  jednoho gigaflopu, se objevily v šedesátých letech, ty současné ale hravě zvládnou desítky teraflopů – bilionů operací za sekundu. Prvním petaflopovým superpočítačem se letos na jaře stal americký vojenský cluster Roadrunner vyrobený IBM pro superpočítačové centrum v Los Alamos.

Česká Amálka se do pětistovky (zatím) nedostala

Flopy jsou nicméně poměrně zavádějící, o kvalitě počítače totiž vypovídají pouze tehdy, bude-li správně použit. Obecně lze říci, že výpočty s reálnými čísly jsou nejčastěji složité statistické analýzy a nejrůznější vektorové transformace. Jelikož se jedná o charakteristické činnosti superpočítačů, má v jejich případě smysl mluvit o výkonu jako o flopech za sekundu. Výkon osobního počítače, pokud neholdujete nejnáročnějším 3D hrám, které se svou podstatou supercomputingu už přibližují, by byl v této jednotce ale poměrně nejednoznačný. Dnešní nejmodernější grafické karty mají sice ve flopech neskutečný výkon, tradiční aplikace této síly ale prostě neumí využít. 

amalka1.png  amalka2.png
Český superpočítač Amálka (stav v roce 2006)

Své superpočítače má samozřejmě i Česká republika, jejich výkony ve flopech jsou ale při srovnání s konkurencí téměř zanedbatelné. Velmi často se mluví především o Amálce, doposud nejvýkonnějším českém počítači, který najdete na Ústavu fyziky atmosféry AV ČR. Na konci loňského roku Xeony vyzbrojená Amálka uměla spočítat lehce přes čtyři biliony operací (4 TFlops), což je sice úžasný výkon a Amálka k němu tehdy potřebovala více než tři stovky procesorů, na jaře spuštěná polská Galéra, které také „běží“ na Xeonech, se nicméně může pochlubit teoretickým výkonem dokonce až 50 TFlops.

České superpočítače v roce 2009
Českým superpočítačům a netradičním serverům se budeme na Živě.cz věnovat i nadále. Dozvíte se, jak vypadá datové centrum velké univerzity, kam se ukládá elektronická pošta, jak to vypadá ve velké hostingové serverovně a na jakém superpočítači se modelují molekuly.

Roadrunner: 200 českých Amálek na jedné hromadě

V praxi sice zatím polští inženýři dostali z Galéry „jen“ 38 TFlops, což jim v listopadovém žebříčku zajistilo 68. pozici, i tak se ale jedná o 17 metrů dlouhý kolos vážící 5 tun. Celý cluster Galéra se skládá z 350 serverů, čtrnácti set čtyřjádrových Xeonů a délka kompletní kabeláže, která obhospodařuje servery, činí dvanáct kilometrů.

galera1.png  galera2.png
Polská Galéra je s teoretickým výkonem 50 TFlops nejvýkonnější superpočítač ve střední Evropě.

Galéra je fenomenální, v zemích bývalého východního bloku najdete rychlejší stroj až v Rusku, nicméně je naprosto bezvýznamná při srovnání se skutečným „superclusterem“ Roadrunner, který obhájil pozici a přinejmenším do června příštího roku se bude moci chlubit nálepkou nejrychlejšího (a přeneseně tedy snad i nejdokonalejšího) stroje, který kdy lidstvo sestavilo.

Jestli drobná Amálka spočítá 4 biliony operací za sekundu, americký vojenský cluster za stejnou dobu provede 1,1 biliardy operací. Aby se mu Česká republika vyrovnala, potřebovala by rovnou dvě stě Amálek. Ve skutečnosti by jich ale muselo být ještě více, jelikož čím větší cluster postavíte, tím větší část výkonu spotřebuje nutná režie na obhospodaření tisícovek mikroprocesorů, které spolu musí složitě komunikovat podobně jako třeba počítače uvnitř internetu. Bez síťového principu, výpočetních jednotek a serverů se prostě žádný dnešní clusterový superpočítač neobejde.

Roadrunner vyrobila IBM na clusterové platformě BladeCenter. Za svůj výkon vděčí 12 960 procesorům PowerXCell 8i s taktem 3,2 GHz, které najdete třeba v herní konzoli PlayStation 3, a 6 480 dvoujádrovým 1,8GHz Opteronům.

roadrunner2.png  ps3_sc.jpg
IBM Roadrunner a superpočítač postavený z několika PlayStationů 3 s Linuxem zapojených do clusteru

Pokud byste si chtěli podobný cluster sestavit v práci, počítejte s investicí okolo 133 milionů USD a s tím, že se jeho příkon vyšplhá ke 2,5 MW. Nutno podotknout, že to je poměrně málo a IBM postavila skutečně „zelený“ superpočítač, na druhém místě se totiž umístil Jaguar (Cray XT5), který požaduje na svůj provoz včetně chlazení až 7 MW (!) a je z celé pětistovky energeticky zdaleka nejnáročnější.

Základní přehled desítky nejrychlejších superpočítačů najdete v následující tabulce.  I když je v současné době Roadrunner nejrychlejší, Jaguar od společnosti Cray mu povážlivě šlape na paty a za zenitem ještě není ani legendární BlueGene, který byl loni světovou jedničkou a je dimenzován až na rychlost okolo 3 PFlops.

Nejrychlejší superpočítače v listopadu 2008

Počítač (řešení)Výkon (TFlops)Použité procesoryPočet jaderOperační systémZeměVýrobce
Roadrunner (BladeCenter)1 105PowerXCell 8i 3.2 GHz,
Opteron DC 1,8 GHz
129 600Red Hat LinuxUSAIBM
Jaguar (XT5)1 059Opteron QC 2,3 GHz150 152CNLUSACray
Pleiades (Altix)487Xeon QC 3 GHz51 200Suse LinuxUSASGI
BlueGene/L (eServer)478PowerPC 440 700 MHz212 992Suse LinuxUSAIBM
BlueGene/P (eServer)450PowePC 450 850 MHz163 840Suse LinuxUSAIBM
Ranger (SunBlade)433Opteron QC 2,3 GHz62 976Sun Grid EngineUSASun
Franklin (XT4)266Opteron QC 2,3 GHz38 642CNLUSACray
Jaguar (XT4)205Opteron QC 2,1 GHz30 976CNLUSACray
Red Storm (XT3/4)204Opteron DC 2,4 GHz38 208CNLUSACray
Dawning 5000A180Opteron QC 1,9 GHz30 720Windows HPCČínaDawning
.....................
Amálka4Xeon DC/QC572Suse LinuxČeskoSPRINX
CNL – Compute Node Linux, QC – čtyřjádrový procesor, DC – dvoujádrový procesor 

Nejvíce superpočítačů vyrábí HP, ty nejrychlejší pak IBM

A kdo vlastně podobné mašiny vyrábí? V první desítce se velmi zadařilo legendárnímu výrobci Cray a IBM, která navrhla jak Roadrunner, tak starší modely BlueGene. Pokud byste ale trochu slevili z výkonu a spokojili se s běžným průmyslovým superpočítačem o výkonu maximálně několika desítek TFlops, asi byste se rozhodli pro řešení od HP, tento výrobce totiž okupuje prakticky celou střední třídu a v TOP500 má 41% podíl.

500 nejvýkonnějších superpočítačů podle výrobce

top500_vyrobci.jpg

A rozdělení superpočítačů podle výrobce je zajímavé i z pohledu vývoje v posledních patnácti letech. Z grafu níže je patrné, že v devadesátých letech pomalu končila éra starých výrobců. Legendární Cray tehdy vyrobil téměř polovinu počítačů v TOP500, postupně ale předal žezlo IBM a HP. Zajímavá je také epizoda SGI, která se sice může pochlubit třetím nejvýkonnějším počítačem světa, výrazný nárůst v polovině devadesátých let ale ztratila s příchodem nového milénia. To samé ostatně platí i o Sun Microsystems.

superpocitace_vyrobci.png
Výrobci TOP500 superpočítačů v letech 1993 až 2008 (Zdroj: TOP500)

Pravý graf pak znázorňuje podíl výrobců na trhu z hlediska výkonu v TFlops. Obrázku jednoznačně vévodí bleděmodrá a IBM, zatímco žlutý HP se musí spokojit se čtvrtinovým podílem. HP se tedy skutečně orientuje spíše na malé a středně výkonné superpočítače.

Nejvíce superpočítačů používá Linux

Zajímavá je také statistika použitých operačních systémů. Superpočítačový cluster sice pomocí Windows XP ovládat nelze, neznamená to ale, že by byl tento sektor trhu Microsoftu cizí, letos na podzim totiž gigant z Redmondu představil svůj nový superpočítačový systém Windows HPC 2008. O „pestrobarevná okénka“ tedy nepřijdou ani administrátoři a uživatelé těchto netradičních výpočetních strojů.

500 nejvýkonnějších superpočítačů podle operačního systému

 top500_os.jpg

Bezmála devadesát procent všech HPC (high performance computing) strojů okupuje v TOP500 Linux. Jedná se buď o celkem známé distribuce Red Hat a Suse v Enterprise edicích, nebo zcela exotické jednoúčelové distribuce. Tradiční Unix používá pouze necelých pět procent superpočítačů a třetí místo patří právě Microsoftu, který má v TOP500 rovných pět zástupců, přičemž má letos díky čínskému superpočítači Dawning svého zástupce i v exkluzivní první desítce. Poslední příčka patří Mac OS, který je v TOP500 zastoupen pouze jednou.

top500_os.png
TOP500 a operační systémy v letech 1993 až 2008 (Zdroj: TOP500)

A opět malé nahlédnutí do historie. Jak vidno, obrovský nástup Linuxu na supercomputingu je relativně nedávnou události. Ještě před pěti lety tento sektor ovládal Unix. Na konci minulého století pak měl prakticky absolutní postavení. Ze světa těch nejvýkonnějších HPC se postupně vytratila také platforma BSD.

Superpočítačovou velmocí jsou USA

A nakonec ještě poslední statistika, které myslím vypovídá o všem – superpočítače podle regionů. Celých 58 procent nejrychlejších počítačů světa najdete v USA, zbytek planety s trochou nadsázky tak trochu živoří, Británie na druhém místě má totiž mezi superpočítači pouze devítiprocentní podíl. Hospodářský motor EU, Německo, má v TOP500 25 superpočítačů a stále rostoucí Čína 15 supervýkonných serverů (3% podíl). USA nejsou superpočítačovou velmocí pouze co do počtu instalovaných strojů, ale i z hlediska celkového výkonu, dvě třetiny veškerého výpočetního výkonu superpočítačů se totiž zpracovává právě zde.

500 nejvýkonnějších superpočítačů podle států

top500_zeme.jpg

Doposud jsem psal pouze o jednotlivých superpočítačích nebo konkrétních zemích, jaký by ale byl společný výkon všech pěti set nejrychlejších serverů? Stěží představitelný. Pokud byste všechny tyto počítače a clustery rozeseté po celém světě zapojili do celoplanetárního gridu, skládal by se ze tří milionů procesorů, jejichž společný výkon by byl neskutečných 17 petaflopů, během jedné sekundy by tedy takový grid vypočítal 17 biliard matematických operací s pohyblivou čárkou.

Největší síla v supercomputingu? Internetový grid

Kupodivu ani tato síla se ale nemůže rovnat s ještě působivějším fenoménem – internetovým gridem, do kterého se může zapojit kdokoliv z vás a přenechat část výkonu svého procesoru dobré věci. První internetové veřejné gridy se začaly na webu objevovat na konci devadesátých let minulého století. Tisíce lidí hledaly důkaz mimozemské inteligence v legendárním projektu Seti@Home, špičkou v oboru se ale stal Folding@Home, který se zabývá poměrně velkým množstvím biochemických projektů. Letos v létě autoři služby oznámili, že společný výkon všech zapojených uživatelů vyjádřený ve flopech činí 4,1 PFlops – to je čtyřikrát více než IBM Roadrunner!

grid.png  grid-internet.png
Grid může využít výkonu různých typů počítačů, největším gridem je ale internet samotný

Pokud si představíte, že k vybudování podobného gridu potřebujete pouze jeden levný superpočítač pro datové úložiště a několik programátorů, kteří napíší klienta pro distribuovaný výpočet, který si každý účastník nainstaluje na počítač, je zřejmé, že gridy mohou být velmi efektivní.

Jak rychlý by byl asi grid, do kterého by se se svými počítači zapojili všichni uživatelé internetu? Těžko říci, současný nejrychlejší superpočítač Roadrunner by ale z takového srovnání vyšel jako poměrně primitivní kalkulačka.

Diskuze (41) Další článek: Chrome chce konkurovat silné dvojce, příští rok spustí masivní kampaň

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,