reklama

Nvidia Tesla K20: základ nejvýkonnějšího superpočítače

Nvidia představila novou verzi výpočetní karty Tesla K20 a K20X, která je založena na architektuře Kepler a je v nejvýkonnějším superpočítači Titan.

Společnost Nvidia se vzhledem k přechodu architektur grafických čipů na více univerzální čipy před několika lety rozhodla cílit své modely i pro oblast serverů a výpočetních clusterů, která samozřejmě zahrnují i výkonné superpočítače.

Do nedávna musely superpočítače spoléhat pouze na výkon procesorů, které nejsou zrovna optimální pro paralelní výpočty. Jejich efektivita je pro tento druh výpočtů kvůli komplexnímu zaměření poměrně nízká, alespoň při srovnání s výpočetními grafickými čipy.

Nvidii se v oblasti výpočetních karet daří velmi dobře a pokud se podíváme na rozšíření řešení od AMD a Nvidie v oblasti nejvýkonnějších superpočítačů, je Nvidia mezi nejlepšími.

Úspěch jménem CUDA

Jakýkoli hardware, ať už je sebelepší, potřebuje ke svému úspěchu výbornou podporu z oblasti softwaru. Nvidia vytvořila pro své výpočetní karty platformu CUDA (C/C++/Fortan), která slouží pro snadnější programování - paralelní výpočty rozhodně nejsou jednoduchou záležitostí.

Klepněte pro větší obrázek
Infografika Nvidie k CUDA

Jak můžete vidět v přehledné infografice přímo od Nvidie, více než 580 univerzit po celém světě již zapracovalo platformu CUDA do svých výukových hodin programování. Více než 8 000 institucí již zaregistrovalo svůj vývojářský účet CUDA a publikováno bylo již 20 000 prací na téma CUDA.

Z oficiálních stránek CUDA již došlo ke stažení 1,5 milionů souborů a Nvidia již vyrobila přes 450 milionů grafických čipů, které tuto platformu podporují. Nesmíme zapomenout ani na podporu software třetích stran, který je k dispozici z různých oblastí vědy a výzkumu, designu, výroby, financí nebo vizualizace.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Srovnání výkonu a rozšíření, Nvidia zažívá v superpočítačích úspěch

Nvidia se chlubí tím, že více než 50 nejvýkonnějších superpočítačů v TOP500 běží na platformě CUDA, což je jistě úctyhodný výsledek.

Nvidia Tesla K20 a K20X: zaměřeno na výpočty

Předchozí generace výpočetních Fermi karet v čele s Tesla M2090 se dočkaly velkého úspěchu, Nvidia ale přináší novou architekturu Kepler a s ní i pokročilejší výrobní proces s 28nm tranzistory.

Klepněte pro větší obrázek
Výpočetní karta Nvidia Tesla K20

Nové modely Tesla K20 a K20 se mírně liší výkonem a konfigurací. Výkonnější Tesla K20X má čip s 2 688 stream procesory, jádro pracuje na frekvenci 732 MHz a má k dispozici 6 GB paměti GDDR5 s frekvencí 5,2 GHz (384bit).

Prohlédněte si podrobné oficiální materiály:

Počet tranzistorů se dostal na neuvěřitelných 7,1 miliard, přičemž TDP se udrželo v rozumné hladině 235 W. Karta je schopná poskytnout výpočetní výkon v SP (Single Precision) 3,95 TFLOPS, v DP (Double Precision) pak 1,31 TFLOPS. Nižší model má kvůli slabší konfiguraci výkon v DP „jen“ 1,17 TFLOPS. Paměťová propustnost činí u K20X 250 GB/s.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Srovnání parametrů výpočetních karet od Nvidie (Zdroj: Anandtech)

Pokud jde o efektivitu výkonu a spotřeby, poměřovanou v rámci GFLOPS/W, je Kepler výrazně lepší než starší Fermi. Chystaná architektura Maxwell přinese ale ještě výraznější skok, který bude několikanásobný.

Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek
Architektura výpočetního grafického čipu od Nvidie

Spotřeba a efektivita je v dnešní době důležitá i pro obří datacentra a to je jeden z důvodů, proč lze vidět tak obrovský nárůst grafických čipů proti procesorovým právě v superpočítačích.

 Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek
Srovnání s řešením od Intelu a výhled od budoucnosti

Intel po dlouhé době připravil i vlastní řešení pro paralelní výpočty – Xeon Phi, ze kterého si Nvidia samozřejmě trochu utahuje. Kvůli pozdnímu příchodu má omezenější podporu, nepoužívá otevřené standardy a je složitější na programování a to i přes to, že je založen na jádrech x86.

Z Jaguara na Titan s desetinásobným výkonem

V národních laboratořích Oak Ridge došlo k modernizaci již poměrně zastaralého superpočítače Jaguar, který dosahuje špičkového výkonu 2,3 PFLOPS.

Zatímco původní Jaguar má přes 200 000 jader v rámci šestijádrových procesorů Opteron od AMD a spotřebu 7 MW, nový se pyšní 300 000 jádry procesorů Opteron a téměř 19 000 výpočetními čipy Tesla K20 (přesně 18 688).

Díky tomu je výkon desetinásobný, teoreticky přes 20 PFLOPS při maximální spotřebě 9 MW (typicky 7 MW). Desetinásobně vyšší výkon za pouhé čtyři roky s minimální navýšením spotřeby – to je síla výpočetních grafických čipů. Jak Nvidia uvádí ve svých materiálech, pokud byste chtěli stejného výkonu dosáhnout pouze procesory, superpočítač by měl spotřebu kolem 30 MW.

Výměna jednotlivých serverů (4 800) v 200 kabinetech superpočítače od Cray samozřejmě zabrala určitý čas, na videu můžete vidět jak docházelo k výměně některých Fermi karet za Kepler.

Klepněte pro větší obrázek
Upgrade s desetinásobným zvýšením výkonu

Původní kapacita operační paměti byla zvýšena z 300 TB na 710 TB, Titan používá upravený operační systém Linux od společnosti Cray, který je založen na distribuci SUSE 11.

Klepněte pro větší obrázek

Jednotlivé kabiny, kterých je celkem 200, jsou napájeny 480 V a celý systém je chráněn i proti výpadku elektrické energie. Během několika vteřin dojde k přepnutí na záložní napájení.

V roce 2016 je v plánu 200 PFLOPS

ORNL již v této chvíli plánuje další upgrade za další čtyři roky, tedy přibližně v roce 2016. Podobně jako u současného upgradu, předpokládá opět minimálně desetinásobné zvýšení výkonu, což by se s chystaným řešením od Nvidie a větším propojení klasických procesorových jader a grafických čipů mělo bez problému podařit.

Klepněte pro větší obrázek
Oblastí na výpočet bude vždy hodně

V roce 2016 by tak mělo ORNL mít k dispozici superpočítač s výkone kolem 200 PFLOPS. Jak už několikrát předpokládali i další společnosti jako třeba IBM, lidstvo by mělo mít první superpočítač schopný výkonu přes 1 EFLOPS (EXAFLOPS) v období kolem roku 2020. Další významný milník tak bude pokořen.

A jak to bude dál? To si můžete přečíst například v článku Výpočetní výkon: od mozku až k superpočítačům.

 

Témata článku: Hardware, Technologie, Nvidia, Superpočítače, Infografika, Kepler, Jaguar, Titan, Dp, Maxwell

7 komentářů

Nejnovější komentáře

  • van01 20. 11. 2012 2:07:13
    Ještě by stálo za to zmínit, že vedle technologie CUDA existuje Open...
  • Josef Jiřík 20. 11. 2012 0:27:24
    Kvalitní čtení ;-)
reklama
Určitě si přečtěte

UPC překopli páteřní kabel. V Brně i druhý den nejede internet ani kabelovka

UPC překopli páteřní kabel. V Brně i druhý den nejede internet ani kabelovka

** V Brně byl velký výpadek služeb UPC ** Důvodem je překopnutý páteřní kabel ** V některých lokalitách služby stále nefungují

5.  12.  2016 | Jakub Čížek | 100

17 expertek Microsoftu předpovědělo rok 2027. Splní se alespoň něco?

17 expertek Microsoftu předpovědělo rok 2027. Splní se alespoň něco?

** Zmizí klasické vyhledávače ** Budeme programovat buňky ** Kvantové počítače překonají šifry

6.  12.  2016 | Jakub Čížek | 34

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

** Novinka od Asusu míří přímo proti MacBooku od Applu ** Nabídne daleko více výkonu za stejné peníze

2.  12.  2016 | David Polesný | 145

11 tipů na dobrý stolní počítač: od základu po herní mašiny

11 tipů na dobrý stolní počítač: od základu po herní mašiny

** Postavte si stolní počítač! Máme pro vás 11 vzorových sestav s rozpisem komponent ** Většina tipů cílí na hráče, věnujeme se ale i základnímu PC a počítačům na střih videa ** Nadělte si nový počítač třeba pod stromeček

5.  12.  2016 | Adam Kahánek | 73


reklama