Rekordmanem roku 2012 se stal superpočítač IBM Sequoia, který se pyšnil výkonem 17,17 PFLOPS, později se dostal až na hranici 20,13 PFLOPS. Architektura staví na starším Blue Gene/Q a k dispozici je na tehdejší dobu rekordních 1 572 864 procesorových jader (16jádrové čipy A2) a 1,5 PB operační paměti. I když je spotřeba poměrně vysokých 7,9 MW, celý superpočítač je několikanásobně efektivnější než starší modely Blue Gene, které se tak už vzhledem k nákladům na elektřinu ani nevyplatí provozovat. ​Foto: Lawrence Livermore National Laboratory, Public domain

Rekordmanem roku 2012 se stal superpočítač IBM Sequoia, který se pyšnil výkonem 17,17 PFLOPS, později se dostal až na hranici 20,13 PFLOPS. Architektura staví na starším Blue Gene/Q a k dispozici je na tehdejší dobu rekordních 1 572 864 procesorových jader (16jádrové čipy A2) a 1,5 PB operační paměti. I když je spotřeba poměrně vysokých 7,9 MW, celý superpočítač je několikanásobně efektivnější než starší modely Blue Gene, které se tak už vzhledem k nákladům na elektřinu ani nevyplatí provozovat. | ​Foto: Lawrence Livermore National Laboratory, Public domain

Na pozici nejvýkonnějšího superpočítače se udržel dva roky a zajímavostí je, že se dodnes ještě používá. Podobně jako Numerical Wind Tunnel, i tento superpočítač byl postaven pro specializovaný účel, který je simulace počasí a pododbně. Foto: Manatee_tw, CC BY-SA 4.0-3.0-2.5-2.0-1.0

Na pozici nejvýkonnějšího superpočítače se udržel dva roky a zajímavostí je, že se dodnes ještě používá. Podobně jako Numerical Wind Tunnel, i tento superpočítač byl postaven pro specializovaný účel, který je simulace počasí a pododbně. | Foto: Manatee_tw, CC BY-SA 4.0-3.0-2.5-2.0-1.0

Na laťku 124,5 GFLOPS dosáhl v roce 1993 superpočítač Fujitsu Numerical Wind Tunnel, který obsahoval 166 paralelně propojených vektorových procesorů s jak název napovídá, byl optimalizovaný pro simulaci vzduchu, což je důležité pro různá odvětví (letectví, počasí, vesmír a podobně). Konfigurace počítače zahrnovala 42 GB operační paměti (každý procesor měl k dispozici 256 MB). Foto: Museum.jpsj.or.jp

Na laťku 124,5 GFLOPS dosáhl v roce 1993 superpočítač Fujitsu Numerical Wind Tunnel, který obsahoval 166 paralelně propojených vektorových procesorů s jak název napovídá, byl optimalizovaný pro simulaci vzduchu, což je důležité pro různá odvětví (letectví, počasí, vesmír a podobně). Konfigurace počítače zahrnovala 42 GB operační paměti (každý procesor měl k dispozici 256 MB). | Foto: Museum.jpsj.or.jp

Rodinu superpočítačů IBM Blue Gene asi nejvíce vystihuje model Blue Gene/L, který byl od roku 2004 až do roku 2008 nejvýkonnějším na světě. Obsahoval celkem 131 072 procesorů IBM PowerPC s frekvencí 700 MHz, celkem 491 TB operační paměti a 1,89PB diskové úložiště. Celkový výpočetní výkon byl nejprve 70,72 TFLOPS, pozdějšími upgrady se v roce 2007 dostal ale až na 596 TFLOPS. ​Foto: Argonne National Laboratory´s Flickr page, CC BY-SA 2.0

Rodinu superpočítačů IBM Blue Gene asi nejvíce vystihuje model Blue Gene/L, který byl od roku 2004 až do roku 2008 nejvýkonnějším na světě. Obsahoval celkem 131 072 procesorů IBM PowerPC s frekvencí 700 MHz, celkem 491 TB operační paměti a 1,89PB diskové úložiště. Celkový výpočetní výkon byl nejprve 70,72 TFLOPS, pozdějšími upgrady se v roce 2007 dostal ale až na 596 TFLOPS. | ​Foto: Argonne National Laboratory´s Flickr page, CC BY-SA 2.0

Jen o trochu výkonnější superpočítač Jaguar byl představený v roce 2009 od legendární společnosti Cray. Výkonu 1,75 PFLOPS dosahoval pomocí 224 256 procesorových jader AMD Opteron s frekvencí 2,6 GHz (šestijádrové čipy). Jaguar byl k dispozici v různých generacích a s postupnými upgrady, v roce 2012 už hybridní Cray XK7 Titan zahrnoval i grafické výpočetní karty od Nvidie. Foto: United States Federal Government, Public domain

Jen o trochu výkonnější superpočítač Jaguar byl představený v roce 2009 od legendární společnosti Cray. Výkonu 1,75 PFLOPS dosahoval pomocí 224 256 procesorových jader AMD Opteron s frekvencí 2,6 GHz (šestijádrové čipy). Jaguar byl k dispozici v různých generacích a s postupnými upgrady, v roce 2012 už hybridní Cray XK7 Titan zahrnoval i grafické výpočetní karty od Nvidie. | Foto: United States Federal Government, Public domain

Japonský rekordní superpočítač Fujitsu K computer byl představen v roce 2011 a pyšnil se výpočetním výkonem 10,51 PFLOPS. Fujitsu pro stavbu použilo 45nm osmijádrové procesory SPARC64 VIIIfx s frekvencí 2 GHz, kterých je celkem 88 128 kusů. V rámci 864 kabinetů je tak k dispozici 705 024 procesorových jader. K computer má spotřebu 12,6 MW (přibližně jako 10 tisíc domů), ale efektivita byla v tehdejší době výborná – 824,6 GFLOPS/kW. ​Foto: Fujitsu

Japonský rekordní superpočítač Fujitsu K computer byl představen v roce 2011 a pyšnil se výpočetním výkonem 10,51 PFLOPS. Fujitsu pro stavbu použilo 45nm osmijádrové procesory SPARC64 VIIIfx s frekvencí 2 GHz, kterých je celkem 88 128 kusů. V rámci 864 kabinetů je tak k dispozici 705 024 procesorových jader. K computer má spotřebu 12,6 MW (přibližně jako 10 tisíc domů), ale efektivita byla v tehdejší době výborná – 824,6 GFLOPS/kW. | ​Foto: Fujitsu

První příčku si v roce 2013 zajistil čínský superpočítač Tianhe-2 (MilkyWay-2), který disponuje výpočetním výkonem 33,86 PFLOPS. Žádá si ale neuvěřitelných 24 MW energie. Jedná se o hybridní superpočítač, který je postaven na technologiích od Intelu. Konkrétně se jedná o procesory Intel Xeon (Ivy Bridge) a výpočetní karty Intel Xeon Phi. Celkový součet výpočetních jader je 3 120 000.Celková velikost operační paměti (včetně paměti u výpočetních karet) je 1,375 PB a úložiště má kapacitu 12,4 PB s propustností 1 TB/s. Systém obsahuje i4 096 specializovaných 16jádrových procesorů FeiTeng-1500 (SPARC) s frekvencí 1,8 GHz. Jeden čip má výkon 144 GFLOPS se spotřebou 85 W.Extrémní výkon ale znamenal i extrémní cenu – 390 milionů dolarů. Foto: O01326, CC BY-SA 4.0

První příčku si v roce 2013 zajistil čínský superpočítač Tianhe-2 (MilkyWay-2), který disponuje výpočetním výkonem 33,86 PFLOPS. Žádá si ale neuvěřitelných 24 MW energie. Jedná se o hybridní superpočítač, který je postaven na technologiích od Intelu. Konkrétně se jedná o procesory Intel Xeon (Ivy Bridge) a výpočetní karty Intel Xeon Phi. Celkový součet výpočetních jader je 3 120 000.Celková velikost operační paměti (včetně paměti u výpočetních karet) je 1,375 PB a úložiště má kapacitu 12,4 PB s propustností 1 TB/s. Systém obsahuje i4 096 specializovaných 16jádrových procesorů FeiTeng-1500 (SPARC) s frekvencí 1,8 GHz. Jeden čip má výkon 144 GFLOPS se spotřebou 85 W.Extrémní výkon ale znamenal i extrémní cenu – 390 milionů dolarů. | Foto: O01326, CC BY-SA 4.0

Superpočítač Cray Y-MP uvedený v roce 1988 dostal frekvenci až osmi procesorů na 167 MHz (6 ns) a celkový výpočetní výkon byl až 2,6 GFLOPS. Operační paměť mohla mít kapacitu až 512 MB a místo pevných disků už bylo možné objednat dražší SSD s kapacitou až 4 GB. Cray uvedl několik verzí, k dispozici byly výkonnější vodou chlazené modely i levnější, které se spokojily pouze s chlazením pomocí vzduchu. ​Foto: Dave Pape, Public domain

Superpočítač Cray Y-MP uvedený v roce 1988 dostal frekvenci až osmi procesorů na 167 MHz (6 ns) a celkový výpočetní výkon byl až 2,6 GFLOPS. Operační paměť mohla mít kapacitu až 512 MB a místo pevných disků už bylo možné objednat dražší SSD s kapacitou až 4 GB. Cray uvedl několik verzí, k dispozici byly výkonnější vodou chlazené modely i levnější, které se spokojily pouze s chlazením pomocí vzduchu. | ​Foto: Dave Pape, Public domain

ASCI White z roku 2000 využíval procesory od IBM (Power3). Celý systém zahrnoval 6 TB operační paměti a 160 TB úložného prostoru pro data. Hmotnost celého superpočítače byla 106 tun a spotřeba dosahovala na rekordní 3 MW. Odpovídal tomu ale i výpočetní výkon, který byl až 12,3 TFLOPS. Superpočítač používal operační systém IBM AIX a tehdejší cena byla 110 milionů dolarů. ​Foto: US Government: Lawrence Livermore National Laboratory, Public domain

ASCI White z roku 2000 využíval procesory od IBM (Power3). Celý systém zahrnoval 6 TB operační paměti a 160 TB úložného prostoru pro data. Hmotnost celého superpočítače byla 106 tun a spotřeba dosahovala na rekordní 3 MW. Odpovídal tomu ale i výpočetní výkon, který byl až 12,3 TFLOPS. Superpočítač používal operační systém IBM AIX a tehdejší cena byla 110 milionů dolarů. | ​Foto: US Government: Lawrence Livermore National Laboratory, Public domain

Superpočítač NASA Pleiades

Superpočítač NASA Pleiades

Superpočítač NASA Pleiades

Superpočítač NASA Pleiades

Na pozici nejvýkonnějšího superpočítače se udržel dva roky a zajímavostí je, že se dodnes ještě používá. Podobně jako Numerical Wind Tunnel, i tento superpočítač byl postaven pro specializovaný účel, který je simulace počasí a pododbně. Foto: Manatee_tw, CC BY-SA 4.0-3.0-2.5-2.0-1.0
Na laťku 124,5 GFLOPS dosáhl v roce 1993 superpočítač Fujitsu Numerical Wind Tunnel, který obsahoval 166 paralelně propojených vektorových procesorů s jak název napovídá, byl optimalizovaný pro simulaci vzduchu, což je důležité pro různá odvětví (letectví, počasí, vesmír a podobně). Konfigurace počítače zahrnovala 42 GB operační paměti (každý procesor měl k dispozici 256 MB). Foto: Museum.jpsj.or.jp
Rodinu superpočítačů IBM Blue Gene asi nejvíce vystihuje model Blue Gene/L, který byl od roku 2004 až do roku 2008 nejvýkonnějším na světě. Obsahoval celkem 131 072 procesorů IBM PowerPC s frekvencí 700 MHz, celkem 491 TB operační paměti a 1,89PB diskové úložiště. Celkový výpočetní výkon byl nejprve 70,72 TFLOPS, pozdějšími upgrady se v roce 2007 dostal ale až na 596 TFLOPS. ​Foto: Argonne National Laboratory´s Flickr page, CC BY-SA 2.0
Jen o trochu výkonnější superpočítač Jaguar byl představený v roce 2009 od legendární společnosti Cray. Výkonu 1,75 PFLOPS dosahoval pomocí 224 256 procesorových jader AMD Opteron s frekvencí 2,6 GHz (šestijádrové čipy). Jaguar byl k dispozici v různých generacích a s postupnými upgrady, v roce 2012 už hybridní Cray XK7 Titan zahrnoval i grafické výpočetní karty od Nvidie. Foto: United States Federal Government, Public domain
12
Fotogalerie

Žádné petaflopsy! Nový test rychlosti superpočítačů ukázal, že obří mašiny jsou mnohonásobně pomalejší

Žebříček nejrychlejších superpočítačů světa TOP500 se dočkal nového vydání, nicméně poslední roky začíná pomalu nudit.

Nejrychlejší mašinou zůstává čínský obr TaihuLight se změřeným výkonem 93 PFLOPS (93 biliard výpočtů s reálnými čísly za sekundu), hned za ním je jeho bratříček Tianhe-2 (33,9 PFLOPS) a bronz míří do Švýcarska pro tým okolo clusteru Piz Daint (16,6 PFLOPS).

Deset nejrychlejších superpočítačů světa podle TOP500:

Superpočítač Počet jader CPU/GPU Rychlost Spotřeba
Sunway TaihuLight (Čína) 10,6 mil. 93,0 PFLOPS 15,4 MW
Tianhe-2 (Čína) 3,1 mil. 33,9 PFLOPS 17,8 MW
Piz Daint (Švýcarsko) 361,8 tis. 19,6 PFLOPS 2,3 MW
Gyoukou (Japonsko) 19,9 mil. 19,1 PFLOPS 1,4 MW
Titan (USA) 560,7 tis. 17,6 PFLOPS 8,2 MW
Sequoia (USA) 1,6 mil. 17,2 PFLOPS 7,9 MW
Trinity (USA) 980 tis. 14,1 PFLOPS 3,8 MW
Cori (USA) 622 tis. 14,0 PFLOPS 4,0 MW
Oakforest-PACS (Japonsko) 556 tis. 13,6 PFLOPS 2,7 MW
K (Japonsko) 705 tis. 10,5 PFLOPS 12,7 MW

Současné měření výkonu superpočítačů přestává stačit

Výkon superpočítačů v žebříčku TOP500 se od počátku devadesátých let zjišťuje pomocí testu Linpack (varianta HPL), který měří počet operací s pohyblivou čárkou za sekundu. Podle mnohých expertů však stejně jako ostatní benchmarky za ty roky zestárnul a nemá adekvátní vypovídající hodnotu.

Proč jej tedy TOP500 stále používá? Protože všichni mají rádi astronomická čísla – včetně organizací, které do podobných superstrojů investovaly nemalé peníze. Magazín IEEE Spectrum situaci přirovnává ke sportovnímu speciálu. Sice dokáže vyvinout ohromnou rychlost, ale v reálných podmínkách je tomu trošku jinak.

Stručně řečeno ti šťastnější z vás, kteří mají v garáži pod plachtou Lamborghini, z něj nejvíce vytáhnou leda tak na uzavřeném testovacím okruhu, ale rozhodně ne v běžném provozu. Se superpočítači a Linpackem je to podobné.

Proto se už roky hledá nový benchmark, který by více odpovídal reálným projektům, které superpočítače zpracovávají. Výstupem by sice byla opět stejná jednotka – 1 FLOPS (1 výpočet s reálnými čísly za sekundu), nicméně by se počítala na odlišných matematických operacích než doposud.

Podle nového benchmarku jsou superpočítače i o několik řádů pomalejší

Nový benchmark už existuje, jmenuje se HPCG, a přestože o něm zatím širší veřejnost téměř neví, vyvíjejí jej přímo akademici z projektu TOP500. Čerstvý žebříček HPCG pak vypadá naprosto jinak.

Jednička z TOP500 je v tomto případě až na páté příčce a ta první patří naopak japonské mašině K, která kdysi kralovala i žebříčku TOP500. Co je však nejzajímavější, drasticky klesly změřené rychlosti.

Deset nejrychlejších superpočítačů světa podle HPCG:

Superpočítač Počet jader CPU/GPU Rychlost
K (Japonsko) 705 tis. 603 TFLOPS
Tianhe-2 (Čína) 3,1 mil. 580 TFLOPS
Trinity (USA) 979 tis. 546 TFLOPS
Piz Diant (Švýcarsko) 361,8 tis. 486 TFLOPS
Sunway TaihuLight (Čína) 10,6 mil. 481 TFLOPS
Oakforest-PACS (Japonsko) 557,1 tis. 385 TFLOPS
Cori (USA) 632,4 tis. 355 TFLOPS
Sequoia (USA) 1,6 mil. 330 TFLOPS
Titan (USA) 560,6 tis. 322 TFLOPS
Tsubame (Japonsko) 136,1 tis. 189 TFLOPS

Namísto bezmála 100 PFLOPS se může nejrychlejší K pochlubit pouhými 600 TFLOPS (teraflops) a TaihuLight zvládne jen 481 TFLOPS. Pokud je přitom účelem testu HPCG přiblížit benchmark reálným situacím, jsou i tato nižší čísla věrohodnějšími výkony, kterých superpočítače běžně dosahují.

Jelikož jsou však dramaticky nižší než lákavá meta 100 PFLOPS, z marketingového hlediska se o nich moc nemluví. V každém případě, test HPCG zároveň ukazuje, jak ošemetná a abstraktní je samotná jednotka FLOPS, která se vždy váže jen ke konkrétnímu benchmarku.

Pokud si tedy v kdejakém testu pro mobily změříte FLOPSový výkon své chytré tatranky, rozhodně to neznamená, že můžete výsledné číslo automaticky srovnávat třeba zrovna se superpočítači. Oba benchmarky by totiž musely být naprosto totožné, což je často nemožné.

Určitě si přečtěte

Články odjinud