IBM a Nvidia staví superpočítač s výkonem až 300 PFLOPS

IBM a Nvidia staví superpočítač s výkonem až 300 PFLOPS

V USA se bude stavět nový superpočítač za téměř půl miliardy dolarů, který bude mít výpočetní výkon až 300 PFLOPS. Bude mít nové procesory i grafické výpočetní čipy.

Výkon nejlepších superpočítačů na světě se neustále zvyšuje a dávno už není tvořen pouze procesory. Velkou část výpočetního výkonu dnes zajišťují grafické výpočetní karty od AMD, Nvidie a nově i speciální výpočetní karty Xeon Phi od Intelu.

Nejvýkonnějším superpočítačem na světě je stále čínský Tianhe-2 (MilkyWay-2), který má výpočetní výkon až 33,8 PFLOPS, respektive špičkově až 55 PFLOPS. ORNL v USA vlastní druhý nejvýkonnější superpočítač Titan, který je přibližně o polovinu pomalejší. Ale to se změní s novým superpočítačem „Summit“.

Základem budou čipy od IBM a Nvidie

Superpočítač s označením „Summit“ by měl být dokončen v roce 2018, bude tak obsahovat čipy, které ještě nejsou ani ve výrobě. Oproti Titanu, který má 18 688 výpočetních uzlů, bude mít Summit jen přibližně 3 400. Každý z 3 400 uzlů by měl mít výkon kolem 40 TFLOPS.

 2014-11-15 v 10.30.57.png
Porovnání parametrů Titanu a Summitu

V každém bude několik vícejádrových procesorů IBM Power 9 (Titan má jen jeden 16jádrový) a také několik výpočetních karet Nvidia s čipy s budoucí architekturou Volta. Jedná se o architekturu, která nahradí Pascal, nástupce, Maxwellu a přinese několik novinek. Po architektuře Pascal by měla převzít podporu hybridních složených pamětí.

Paměti HBM umožní už v prvních verzích a při kombinaci několika čipů propustnost až 1 TB/s a oproti GDDR5 jsou navíc až o 68 % úspornější a o 65 % menší. Díky tomu je možné mít i větší kapacity, což je u těchto karet poměrně důležité (i když nejde o hry s detailními texturami).

Výpočetní karty sice mají 3D paměti HBM, procesory IBM ale budou používat operační paměti DDR4. V rámci jednoho uzlu bude dohromady k dispozici 512 GB paměti (kombinovaně HBM a DDR4). Titan měl u jednoho uzlu jen 32 GB paměti DDR3.

609394786.png
Architektura Volta přinese i podporu hybridních složených 3D pamětí, které nahradí současné GDDR5

Každý uzel bude mít navíc ještě 800 GB paměti NVRAM, která bude adresovatelná jak procesory, tak i grafikami a poslouží jako vyrovnávací buffer mezi souborovým systémem. Summit bude používat souborový systém IBM General Parallel File System (GPFS) s propustností až 1 TB/s a kapacitou až 120 PB. Počítá se i s napojením na archivní systém HPSS (OLCF High Performance Storage System), který je tvořen pevnými disky a páskami.

Důležitá je i rychlost komunikace mezi procesorem a grafikou. Zatímco dříve bylo nutné spoléhat na pomalejší rozhraní PCI Express druhé generace (Titan), pro nový Summit má Nvidia připravenou novou technologii s označením NVLink.

nvlink.png
Nvidia NVLink nahradí pomalé rozhraní PCI Express pro spojení grafických čipů a procesoru

Oproti PCI Express nabízí pětkrát až dvanáctkrát vyšší propustnost dat a je samozřejmě o něco úspornější. Nvidia tvrdí, že je také mnohem flexibilnější pro návrh serverů. Systémové spojení bude mít rychlost až 23 GB/s (Dual Rail Mellanox EDR-IB).

Podobná spotřeba, výkon až 300 PFLOPS

Zatímco Titan má celkovou spotřebu 9 MW a poskytuje výkon špičkově až 27 PFLOPS, Summit bude mít jen malinko větší spotřebu 10 MW a nabídne výpočetní výkon v oblasti 150 až 300 PFLOPS. Nádherná ukázka Moorova zákonu v konečném důsledku.

 2014-11-15 v 10.32.17.jpg

To znamená i desetkrát více výkonu, než měli vědci v ORNL (Oak Ridge National Laboratory) dostupných s Titanem. Summit bude určen pro „Open Science“ a tedy dostupný pro různé výpočty, které uspějí ve výběru různých prací, studií a podobně. OLCF už má připravený kalendář hlavních akcí, včetně workshopů pro aplikace. Je nutné co nejvíce programovat pro frameworky jako CUDA, OpenCL a podobně, které dokáží dostat ze superpočítače co nejvíce paralelního výkonu.

V plánu je ještě druhý, o něco slabší superpočítač Sierra, který nahradí současný superpočítač Sequoia určený pro výzkum simulací „jaderných nebezpečí“. Výkon by u i Sierry měl překonat hranici 100 PFLOPS.

EXAFLOPS v roce 2020

Zatím to vypadá, že nastolený odhad nového milníku v oblasti výpočetního výkonu jednoho superpočítače – 1 EXAFLOPS (EFLOPS), bude dosažen kolem roku 2020, možná o rok či dva později. Stále to tak odpovídá tempu tisíckrát vyššího výkonu jednou za přibližně deset let:

Výkon superpočítačů

  • 1938: OPS
  • 1943: kOPS
  • 1961: MFLOPS
  • 1984: GFLOPS
  • 1997: TFLOPS
  • 2008: PFLOPS
  • 2019: EFLOPS
  • 2030: ZFLOPS
  • 2041: YFLOPS

Podobná rychlost samozřejmě platí i v jiných rozměrech (počítače, notebooky). Pokud se podíváme na srovnání milníků výpočetního výkonu superpočítačů, lze vidět, že například mobilní zařízení s podobným výpočetním výkonem jsou zatím přibližně 20 let pozadu.

20 let tedy trvalo dostat výkon obřího superpočítače do rozměrů mobilu (spotřeba přibližně tisíckrát nižší). V roce 2020 by tak mobilní zařízení měla mít výpočetní výkon v oblasti jednotek či desítek TFLOPS. A co s ním budeme dělat? To si necháme na nějaký budoucí článek.

TIP: Výpočetní výkon: od mozku až k superpočítačům

 

Určitě si přečtěte

Články odjinud