Superpočítačová honba za výkonem

Nejvíce superpočítačů na světě vlastní Spojené státy, které však nemusí mít své prvenství dlouho. Čína totiž začala hromadně investovat i ve výpočetním segmentu.

Superpočítače jsou již velmi dlouhou dobu jakousi ukázkou našich možností v oblasti výpočetního výkonu, který dokážeme využít v mnoha oblastech vědy. Nejvýkonnější z nich jsou pochopitelně určeny pro vojenské účely, tedy simulace jaderných reakcí, efektivity bomb a podobně „užitečných“ věcí. Najdou se však samozřejmě i superpočítače, které jsou určeny pro simulaci a předvídání vývoje počasí, chování molekul a další fyzikální, matematické či chemické úlohy, které pomáhají objevit i nové léky a způsoby léčení nejzávažnějších nemocí.

Závody ve zbrojení už naštěstí nejsou tak hlavním a důležitým parametrem pro prezentaci síly států, ale v podobném duchu se toto soupeření začíná profilovat pomocí výpočetního výkonu. Není tak překvapením, že se chce Čína stát výpočetní velmocí, kterou jsou v současnosti Spojené státy.

Jednu biliardu operací za sekundu, prosím

Zatím stále nejvýkonnějším superpočítačem je „Jaguar“ Cray XT5-HE, který byl minulý rok upgradován, obsahuje přesně 37 376 šestijádrových procesorů AMD Opteron s frekvencí 2,6 GHz, přičemž jeho špičkový výkon je teoreticky až 2,331 PFLOPS, podle známého testu Linpacku však disponuje použitelným výkonem 1,759 PFLOPS. Tento zatím nejvýkonnější superpočítač je umístěn v národní laboratoři Oak Ridge (ORNL), kde se také nachází jeho 362 TB operační paměti s rychlostí kolem 284 GB/s a datovým úložištěm s kapacitou 10 PB.

IBM BlueGene P.jpg

Před několika měsíci se však odehrála výměna stráži na druhé pozici, kterou dlouhou dobu držel bulvárně známý IBM Roadrunner od IBM. Jeho výkon 1,042 PFLOPS totiž nestačil na nový superpočítač z Číny nazvaný „Nebulae“ s přesným označením Dawning TC3600 Blade System. Jeho výkon 1,271 PFLOPS (teoreticky až 2,98 PFLOPS) je však v jistém smyslu mnohem „lepší“, než u současného Jaguara. Spotřeba tohoto superpočítače je totiž téměř třikrát menší, než u o trochu výkonnějšího soupeře v podobě Cray XT5-HE. Jak je to možné, když Jaguar obsahuje relativně nové procesory? Ano, grafické karty, to je oč tu běží.

Nvidia Fermi: stvořeno pro novou generaci (super)počítačů

Pokud si ještě vzpomínáte na náš starší článek se stejnojmenným názvem, který byl uveden při příležitosti oficiálního představení nové generace grafických karet od Nvidie s čipy založenými na architektuře Fermi, už asi tušíte, jak je možné dosáhnout takto vysokého výkonu s několikanásobně nižší spotřebou.

Čínský Nebulea, který se nachází v národním superpočítačovém centru v Šen-čenu, je totiž tvořen nejen šestijádrovými procesory Intel Xeon X5650, ale také přesně 4 640 profesionálními kartami Nvidia Tesla C2050 (každá má 3 GB GDDR5 paměti). Celý systém má spotřebu „pouze“ 2,55 MW (výkon 1,271 PFLOPS), zatímco Jaguar si řekne o více než 7 MW (výkon 1,759 PFLOPS).

nvidia-tesla.jpg

Jedná se tak o jedno z prvních velkých použití výpočetních grafických karet, které poskytují mnohonásobně vyšší paralelní výkon, než klasické procesory, přičemž jejich efektivita je ještě lepší, především v případě poměru výkonu a spotřeby. Tento superpočítač sice neaspiruje na nejefektivnější model z celého žebříčku, i ten je však držen superpočítačem QPace Cluster s grafickými kartami, který je schopen poskytnout 774 MFLOPS na pouhý jeden watt. Průměrná hodnota se v případě všech 500 superpočítačů pohybuje kolem 195 MFLOPS na watt a stále se zvyšuje.

Čína má zatím sice pouze dva superpočítače v první desítce (sedm jich má USA a jeden vlastní Německo), ale to se možná brzy změní.

Cena jde dolů

Ruská společnost T-Platforms, která se specializuje právě na superpočítačové systémy, vyvinula unikátní systém, který obsahuje neuvěřitelně vysoký výkon v malém prostoru, včetně neuvěřitelně nízké ceny.

Jedna jediná speciálně navržená základní deska totiž obsahuje nejen mobilní verzi (MXM) grafického čipu Nvidia Tesla (GF100-875-A3) s 3 GB GDDR5 paměti, ale také dvojici čtyřjádrových nebo šestijádrových procesorů Intel Xeon, které mají k dispozici celkem 6 GB DDR3 operační paměti.

T-Platforms_TB2-TL_675.jpg

Díky zmenšení a inženýrské miniaturizaci je možné poskytnout výkon blížící jednomu petaflopu pomocí pouhých deseti rackových skříní 42U (Jeden 7U rack poskytuje výkon 192 procesorových jader a 32 grafických čipů Nvidia Tesla 2050 nebo 2070 (MXM) s výkonem přes 16 TFLOPS v Dual Precision). Cena za tento výkon se však nepohybuje v řádu desítkách nebo stovkách milionů dolarů, ale neměla by překročit pouhých 300 tisíc dolarů.

T-Platforms_TB2-TL_Inside_6.jpg

Jak je vidět, efektivnější superpočítače lze stavět i s použitým stejných čipů, které jsou však efektivněji rozloženy, což umožňuje použít nejen menší prostory, ale také jednodušší chlazení, které se na celkové spotřebě systému taktéž velmi podílí.

Exaflop do roku 2020

Jeden Exaflop je tisíc Petaflopů a jak můžete vidět na dnešním nejvýkonnějším superpočítači, je to více než pětsetkrát větší výkon oproti současnosti (2010). Čína to s výpočetním výkonem samozřejmě myslí velmi vážně a již v této chvíli staví nové superpočítačové centrum, které se bude nacházet taktéž ve městě Šen-čen. V procesu stavby jsou však i další projekty, nejen v Číně, ale také v Evropě a pozadu nejsou pochopitelně ani Spojené státy, které si prvenství jistě nenechají snadno vzít.

ChinaHPCsite.jpg
Pouze jedna z několika obřích prostor pro nejvýkonnější superpočítače

Takto vysoký výkon by samozřejmě nemohl být dosažen se stávajícími nebo budoucími procesory, univerzální grafické čipy se ale postaraly o dostatečný výkon pro udržení exponenciální křivky vývoje, který je z jednoho pohledu určován právě výpočetním výkonem.

2intel-research.jpg

Pokud se zaokrouhleně podíváme na současné parametry s prvním brzkým vylepšením (32 nm, 28 nm), k dosažení 2 PFLOPS je zapotřebí přibližně 2 MW energie. K napájení hypotetického superpočítače s výkonem jeden exaflop by bylo nutné 1000 MW, tedy jeden 1 GW. S příchodem další miniaturizace a zvyšování výkonu jednotlivých čipů se však za deset let (možná i dříve) dočkáme prvního superpočítače, který s přijatelnou spotřebou překročí magickou hranici 1 EFLOPS.

intel-research.jpg

Ve stejném roce také IBM plánuje, že bude možné kompletně simulovat lidský mozek. Co to ale bude znamenat? To by bylo na další samostatný článek.

Diskuze (92) Další článek: Pitva: Xbox 360 rozebraný do poslední součástky

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,