V USA se bude stavět nový superpočítač za téměř půl miliardy dolarů, který bude mít výpočetní výkon až 300 PFLOPS. Bude mít nové procesory i grafické výpočetní čipy.
Výkon nejlepších superpočítačů na světě se neustále zvyšuje a dávno už není tvořen pouze procesory. Velkou část výpočetního výkonu dnes zajišťují grafické výpočetní karty od AMD, Nvidie a nově i speciální výpočetní karty Xeon Phi od Intelu.
Nejvýkonnějším superpočítačem na světě je stále čínský Tianhe-2 (MilkyWay-2), který má výpočetní výkon až 33,8 PFLOPS, respektive špičkově až 55 PFLOPS. ORNL v USA vlastní druhý nejvýkonnější superpočítač Titan, který je přibližně o polovinu pomalejší. Ale to se změní s novým superpočítačem „Summit“.
Základem budou čipy od IBM a Nvidie
Superpočítač s označením „Summit“ by měl být dokončen v roce 2018, bude tak obsahovat čipy, které ještě nejsou ani ve výrobě. Oproti Titanu, který má 18 688 výpočetních uzlů, bude mít Summit jen přibližně 3 400. Každý z 3 400 uzlů by měl mít výkon kolem 40 TFLOPS.

Porovnání parametrů Titanu a Summitu
V každém bude několik vícejádrových procesorů IBM Power 9 (Titan má jen jeden 16jádrový) a také několik výpočetních karet Nvidia s čipy s budoucí architekturou Volta. Jedná se o architekturu, která nahradí Pascal, nástupce, Maxwellu a přinese několik novinek. Po architektuře Pascal by měla převzít podporu hybridních složených pamětí.
Paměti HBM umožní už v prvních verzích a při kombinaci několika čipů propustnost až 1 TB/s a oproti GDDR5 jsou navíc až o 68 % úspornější a o 65 % menší. Díky tomu je možné mít i větší kapacity, což je u těchto karet poměrně důležité (i když nejde o hry s detailními texturami).
Výpočetní karty sice mají 3D paměti HBM, procesory IBM ale budou používat operační paměti DDR4. V rámci jednoho uzlu bude dohromady k dispozici 512 GB paměti (kombinovaně HBM a DDR4). Titan měl u jednoho uzlu jen 32 GB paměti DDR3.

Architektura Volta přinese i podporu hybridních složených 3D pamětí, které nahradí současné GDDR5
Každý uzel bude mít navíc ještě 800 GB paměti NVRAM, která bude adresovatelná jak procesory, tak i grafikami a poslouží jako vyrovnávací buffer mezi souborovým systémem. Summit bude používat souborový systém IBM General Parallel File System (GPFS) s propustností až 1 TB/s a kapacitou až 120 PB. Počítá se i s napojením na archivní systém HPSS (OLCF High Performance Storage System), který je tvořen pevnými disky a páskami.
Důležitá je i rychlost komunikace mezi procesorem a grafikou. Zatímco dříve bylo nutné spoléhat na pomalejší rozhraní PCI Express druhé generace (Titan), pro nový Summit má Nvidia připravenou novou technologii s označením NVLink.

Nvidia NVLink nahradí pomalé rozhraní PCI Express pro spojení grafických čipů a procesoru
Oproti PCI Express nabízí pětkrát až dvanáctkrát vyšší propustnost dat a je samozřejmě o něco úspornější. Nvidia tvrdí, že je také mnohem flexibilnější pro návrh serverů. Systémové spojení bude mít rychlost až 23 GB/s (Dual Rail Mellanox EDR-IB).
Podobná spotřeba, výkon až 300 PFLOPS
Zatímco Titan má celkovou spotřebu 9 MW a poskytuje výkon špičkově až 27 PFLOPS, Summit bude mít jen malinko větší spotřebu 10 MW a nabídne výpočetní výkon v oblasti 150 až 300 PFLOPS. Nádherná ukázka Moorova zákonu v konečném důsledku.

To znamená i desetkrát více výkonu, než měli vědci v ORNL (Oak Ridge National Laboratory) dostupných s Titanem. Summit bude určen pro „Open Science“ a tedy dostupný pro různé výpočty, které uspějí ve výběru různých prací, studií a podobně. OLCF už má připravený kalendář hlavních akcí, včetně workshopů pro aplikace. Je nutné co nejvíce programovat pro frameworky jako CUDA, OpenCL a podobně, které dokáží dostat ze superpočítače co nejvíce paralelního výkonu.
V plánu je ještě druhý, o něco slabší superpočítač Sierra, který nahradí současný superpočítač Sequoia určený pro výzkum simulací „jaderných nebezpečí“. Výkon by u i Sierry měl překonat hranici 100 PFLOPS.
EXAFLOPS v roce 2020
Zatím to vypadá, že nastolený odhad nového milníku v oblasti výpočetního výkonu jednoho superpočítače – 1 EXAFLOPS (EFLOPS), bude dosažen kolem roku 2020, možná o rok či dva později. Stále to tak odpovídá tempu tisíckrát vyššího výkonu jednou za přibližně deset let:
Výkon superpočítačů
- 1938: OPS
- 1943: kOPS
- 1961: MFLOPS
- 1984: GFLOPS
- 1997: TFLOPS
- 2008: PFLOPS
- 2019: EFLOPS
- 2030: ZFLOPS
- 2041: YFLOPS
Podobná rychlost samozřejmě platí i v jiných rozměrech (počítače, notebooky). Pokud se podíváme na srovnání milníků výpočetního výkonu superpočítačů, lze vidět, že například mobilní zařízení s podobným výpočetním výkonem jsou zatím přibližně 20 let pozadu.
20 let tedy trvalo dostat výkon obřího superpočítače do rozměrů mobilu (spotřeba přibližně tisíckrát nižší). V roce 2020 by tak mobilní zařízení měla mít výpočetní výkon v oblasti jednotek či desítek TFLOPS. A co s ním budeme dělat? To si necháme na nějaký budoucí článek.
TIP: Výpočetní výkon: od mozku až k superpočítačům