Dvakrát ročně vzniká žebříček nejrychlejších superpočítačů světa. Ten listopadový dal šanci americkému systému Jaguar a z Číny udělal skutečnou výpočetní velmoc.
Těch šest měsíců uteklo jako voda a zamíchalo kartami na poli nejrychlejších strojů planety. Legendární výrobce superpočítačů Cray se vrací na vrchol díky americkému modernizovanému Jaguarovi, Roadrunner od IBM, který první příčku okupoval rok a půl, se pak musel spokojit díky přestavbě s druhým místem.
Žhavé evropské želízko, německý JUGENE, klesl také o jednu příčku a musel se spokojit se čtvrtým místem. Stále výrazněji o sobě naopak dává vědět Čína, jejiž Tianhe-1 je zároveň prvním počítačem v TOP10, který namísto tradičních procesorů Opteron, Xeon a PowerPC vsadil také na GPU Radeon HD 4870.
Jakkoliv však byla každoroční pranice výrobců výkonných počítačů sebedramatičtější, nic to nemění na tom, že USA zůstávají téměř neporazitelnou superpočítačovou velmocí. Kdybyste sečetli výkon pěti set nejrychlejších superpočítačů světa, pak ty americké představují více než polovinu, jeden jediný Roadrunner nebo Jaguar pak představuje všechny čínské nebo francouzské stroje dohromady. Oběma naráz se pak nemohou rovnat ani všechny superpočítačové clustery v Německu nebo Velké Británii.
Desítka nejrychlejších počítačů světa v listopadu 2009
Počítač (modelová řada) | Země | Výrobce | Operační systém | Výkon (TFLOPS) | Použité procesory | Počet jader |
Jaguar (XT5) | USA | Cray | Compute Node Linux | 1 759 | 6C Opteron 2,6 GHz | 224 162 |
Roadrunner (BladeCenter) | USA | IBM | Red Hat Linux | 1 042 | PowerXCell 8i 3.2 GHz, Opteron DC 1,8 GHz | 122 400 |
Kraken (XT5) | USA | Cray | Compute Node Linux | 831 | 6C Opteron 2,6 GHz | 98 928 |
JUGENE (BlueGene/P) | Německo | IBM | CNK/Suse Linux | 825 | PowerPC 450 850 MHz | 294 912 |
Tianhe-1 (NUDT TH-1) | Čína | NUDT | neznámý Linux | 563 | Xeon E5540/E5450, Radeon HD 4870 | 71 680 |
Pleiades (Altix ICE) | USA | SGI | Suse Linux | 544 | 4C Xeon 3 GHz | 56 320 |
bezejmenný (BlueGene/L) | USA | IBM | CNK/Suse Linux | 478 | PowerPC 440 700 MHz | 212 992 |
bezejmenný (BlueGene/P) | USA | IBM | CNK/Suse Linux | 458 | PowerPC 450 850 MHz | 163 840 |
Ranger (SunBlade) | USA | Sun | Sun Grid Engine | 433 | 4C Opteron 2,3 GHz | 62 976 |
Red Sky (SunBlade) | USA | Sun | CentOS | 423 | Xeon X55xx 2,9 GHz | 41 616 |
Červeně je znázorněn počítač, jehož zaznamenaný výkon od června klesl, zeleně jsou znázorněné stroje, jejichž výkon naopak vzrostl a modře pak nováčci v první desítce. 4C a 6C odpovídá počtu jader procesoru.
Srovnejte tabulku s červnem 2009 a listopadem 2008
Před 16 lety byl nejrychlejší počítač 30 000x pomalejší
Ale zpět ke kořenům. Statistika TOP500 vychází dvakrát ročně vždy v červnu a listopadu na konferenci s prostým názvem SC – Supercomputing Conference. První ročník se odehrál již v roce 1993 a od té doby se toho skutečně mnoho změnilo. Ostatně posuďte sami. Tehdejší nejrychlejší počítač světa z amerického Los Alamos disponoval tisícovkou výpočetních jader a výkonem 59,7 GFLOPS. Současná dvoujádrová karta ATI Radeon HD 5970 se čtyřmi miliardami tranzistorů toho umí mnohem více.
- výkon: 1,7 PFLOPS (2,3 teoreticky)
- CPU: 37 376x Opteron 2,6 GHz
- počet jader: 224 256
- RAM: 300 TB
- úložiště: 10 PB
- operační systém: SUSE Linux
- příkon: 6 950 kW
Výkon se už desítky let měří pomocí metodiky Linpack, v rámci které se vyjadřuje počtem matematických operací s pohyblivou čárkou za sekundu. Tento systém se hodí především pro tradiční vědecké superpočítače a grafické karty, reálná čísla se totiž používají při nejrůznějších statistických, vektorových a maticových transformací. Pokud tedy potřebujete vykreslit 3D objekt, který se skládá z několika milionů trojúhelníků – polygonů, superpočítač je to pravé, co potřebujete. Pokud naopak hledáte počítač, který vám co nejrychleji spustí Word nebo takový Solitaire, Linpack testování, reálná čísla a superpočítače vám budou naprosto k ničemu.
Linpack výkon se udává ve FLOPS – FLoat Operations Per Second, tedy počtu operací za sekundu. CM-5/1024 z jara 1993 nabídl výkon 59,7 GFLOPS, tedy necelých šedesát miliard operací s reálnými čísly za sekundu. Nejrychlejší superpočítač současnosti Jaguar disponuje reálným výkonem 1,7 PFLOPS, spočítá tedy skoro dvě biliardy operací za sekundu a je tak bezmála 30 000x rychlejší. A jen tak na okraj – skládá se z 224 tisíc výpočetních jader (37 tisíc šestijádrových AMD Opteron 2,6 GHz procesorů). Časy se skutečně mění.
Nejvýkonnější superpočítač (cluster) Jaguar Cray XT5 (Zdroj: Oak Ridge National Laboratory)
Celé desetiletí patřila nejrychlejší desítka zcela neohroženě americkým výzkumným laboratořím pod patronátem armády, pak o sobě ale začali dávat vědět i jiní. Před rokem se tak na desátém místě umístil čínský Magic Cube a letos na jaře se prosadilo také Německo se svým systémem JUGENE. Na dveře ale už klepe také ruský Lomonosov z Moskevské státní univerzity (12. místo), který je se svými 350 TFLOPS druhý nejrychlejší superpočítač Evropy. Jen pro srovnání, legendární česká Amálka postavena z tří set Xeonů, disponuje výkonem 6,38 TFLOPS.
Superpočítače mají hlad
Superpočítače samozřejmě nepočítají zdarma, musíte je nakrmit docela velkým soustem elektrické energie. Cynik se musí zasmát při myšlence, že ačkoliv se většina z těch nejrychlejších alespoň okrajově zabývá výpočtem klimatických modelů pro příští desetiletí, ekologická stopa takového Jaguara se vyrovná více než třem elektrickým lokomotivám. Se svým elektrickým příkonem 6 950 kW by dokázal rozsvítit téměř půl milionu zářivek, spustit 32 tisíc televizorů nebo „rozvrčet“ čtyři tisíce výkonných vysavačů.
Pokud tedy plánujete vybavit garáž malým clusterem, tedy skládačkou desítek a stovek rackových skříní zaplněných odshora dolů procesory, pamětí, chlazením a kabeláží, počítejte nejen s pořizovací cenou mnoha milionů dolarů, ale také s obrovským účtem od Eonu nebo ČEZu.
Propagační video AMD k modernizaci superpočítače Kraken (díky ní se stal světovou trojkou)
Druhý nejrychlejší superpočítač světa Roadrunner by vás přišel asi na 133 milionů dolarů, další miliony ale stojí jeho pouhopouhý provoz a počítání. Není se tedy čemu divit, že původní statistiku TOP500 nejrychlejších superpočítačů světa nedávno doplnil žebříček Green500, který tytéž stroje řadí podle toho, kolik FLOPSů spočítají na jeden watt elektrického příkonu. Nejzelenější jsou počítače v Německu, dokážou totiž spočítat 722 MFLOPS na 1 W příkonu. Velmi úsporný je také Roadrunner, který obsadil 6. místo (444 MFLOPS/W), a Jaguar? Ten je jen o kousek rychlejší než Roadrunner, jeho spotřeba je však skoro třikrát vyšší, propadl se tedy až na 44. místo (253 MFLOPS/W). Ty nejrychlejší hračky tedy ani zdaleka nemusí být ekonomicky nejefektivnější.
Modely ze superpočítačů v národních laoratořích Oak Ridge, kde je instalovaný také Jaguar
S problémem spotřeby se ostatně u rozsáhlých clusterů vážou i další vlastnosti. Tak třeba opět výkon. Ačkoliv by se mohlo zdát, že zdvojnásobení počtu procesorů automatický zdvojnásobí i výkon, není to samozřejmě pravda. Nejedná se o přímou úměru, s počtem procesorů totiž roste i délka kabeláže, potřebného chlazení, a jelikož se cluster už chová spíše jako rozsáhlá síť, také počet směrovačů a přepínačů. Jednoduše řečeno stoupá obrovskou měrou režie, je třeba mnohem efektivněji pracovat s chlazením a také přerozdělováním výkonu konkrétním softwarovým úlohám. Když tedy bude váš systém obsahovat už stovky tisíc jader, zjistíte, že výkon už jaksi neroste tak efektivně a dramaticky jako dříve a že se malá změna konfigurace okamžitě podepíše na výkonu. To se ostatně stalo i v případě Roadrunneru, který přeskládáním přišel o 5,7 % svého výkonu a klesl na druhé místo. Takovou ztrátu byste na svém domácím počítači skoro nezaznamenali, v případě Roadrunneru se ale jednalo o pokles o 63 TFLOPS, tedy o 63 bilionů operací za sekundu. Jen takové malé škytnutí, co říkáte?
Nejrychlejší superpočítač máte na stole nebo v kapse
Superpočítačový cluster má tedy sice vysoký výkon, ale stejně tak vysokou energetickou i výpočetní režii. Existuje tedy nějaký dokonalejší systém? Jeden by tu byl. Skládá se ze stovek milionů výpočetních jader, která nepotřebují vodní chlazení, a relativně malého množství serverů, které připomínají spíše malé jaderné elektrárny. A když už jsme u té energie, i tato jádra jsou hladová, ovšem méně než superpočítače. Souhrnný výkon tohoto systému je jen stěží představitelný. Ten systém velmi dobře znáte, právě v tuto chvíli jste totiž jeho součástí. Jmenuje se internet a skládá se z vašich počítačů, mobilů, herních konzolí a dalšího online zařízení.
Sestavování nejrychlejšího evropského clusteru JUGENE (Zdroj: Forschungszentrum Jülich)
Kdyby se všechny domácí počítače, pracovní stanice, servery, chytré mobily a zejména herní konzole s výkonnými procesory na chvíli spojily a skrze internet by vykonávaly jednu jedinou úlohu, zpracovaly by ji mnohem dříve, než Jaguar s Roadrunnerem dohromady. Že je to možné, ukazují internetové gridy. Jsou to vlastně také clustery, počítače však nejsou navzájem propojené skrze optickou kabeláž v jednom obrovském vychlazeném hangáru, ale skrze běžný internet. Každý z dílů tohoto obrovského řetězce pak dostane od hlavního serveru část úkolu, zpracuje ho a výsledek pošle zpět do centrály. Na tomto principu pracují zejména evropské akademické sítě v čele s projektem GÉANT2, jehož členem je i Česká republika. Výhody jsou zřejmé. Sice chvíli trvá, než server získá všechny dílčí výsledky a složí je zpět, je to ale poměrně levné, nemusíte totiž investovat stovky milionů dolarů.
Existuje množství uzavřených akademických i průmyslových gridů, pak jsou tu ale i ty, které jsou otevřené veřejnosti a do kterých se může zapojit kdokoliv z vás. Tím nejúspěšnějším je pravděpodobně Folding@Home, který se zabývá zejména výpočty v biochemii. Dnes je do projektu zapojeno tisíce lidí z celého světa a sdílený výkon všech těchto procesorů tak vzrostl na úctyhodných 8,13 PFLOPS. Jen zopakuji, že nejrychlejší cluster Jaguar má v současnosti linpackový výkon 1,7 PFLOPS. Do projektu Folding@Home je zapojeno okolo půl milionu počítačů. Těch, které jsou připojené k internetu, je však mnohonásobně více. Dokážete si představit ten v pravdě pohádkový potenciál?
Výpočetní technologie se bude nadále zlepšovat, počty jader se budou zvyšovat, křemíkové kompozity a elektrický proud časem možná alespoň částečně nahradí „sklo“ a fotony a stejně tak naše domácnosti budou do sítě sítí napojené skrze mnohem kvalitnější technologie, než nabízí současnost. Internetová HD televize se stane realitou a i web samotný se promění z „bílé nástěnky s textem a obrázky“ v živé interaktivní plátno. Ten, který v té relativně blízké budoucnosti jako první využije obrovského výkonu a konektivity supergridu jménem internet, objeví nový a doposud nepoznaný svět, nebo možná otevře Pandořinu skříňku.