Skupina vědců z evropských a amerických univerzit dvakrát ročně sestavuje žebříčky nejvýkonnějších počítačů světa TOP500. Píšeme o nich pravidelně, byť je to už roky vlastně docela nuda. O první příčky se jednoduše řečeno přetahují USA s Čínou a občas na výsluní pronikne i někdo jiný – třeba Japonsko.
Ačkoliv totiž známe název nejvýkonnější mašiny – aktuálně to je onen japonský cluster Fugaku s více než sedmi miliony procesorových jader Fujitsu A64FX, poněkud nám uniká, jak na tom jsou superpočítače v Česku. Tuzemskou scénu doposud nikdo pořádně nezmapoval, byť i u nás najdete špičkové stroje. Jen se o nich mnohdy neví.
Začněme zdola. Zejména na přelomu let 2017-2018 byste našli svým způsobem špičkový superpočítač v kdejakém zaprášeném skladu a garáži v sousedství. Tedy, je to trošku nadsázka, není ale příliš daleko od pravdy, sám jsme jich totiž pár viděl.
Superpočítače v českých garážích a skladech
Tou dobou vrcholila velká bitcoinová vlna, kdy se cena populární kryptoměny vůči dolaru krátce vyšplhala až ke 20 000 USD/BTC. Šílený kurz tehdy motivoval nejednoho podnikatele se srdcem geeka k nákupu zprvu jednotek a později i desítek výpočetních karet s GPGPU čipy od Nvidie, které firemní ajťák propojil dohromady, a ve sklepě začala hučet rozměrná kostra blikající elektroniky s výkonem v řádu mnoha TFLOPS.

Těžební cluster složený z herních konzolí Playstation
Čeští podnikatelé i jednotlivci v těch letech začali masivně těžit kryptoměny a Nvidia zažila zlatou horečku. Ta pak sice v následujících letech poněkud ochabla, jak se cena bitcoinu počátkem roku 2019 propadla opět ke dnu, nicméně od té doby alespoň v dlouhodobém měřítku opět roste, a tak lze očekávat, že mnozí opět nakoupí grafické karty a opráší své rackové skříně v podnikovém skladu.
Pokračování 2 / 4
Velké průmyslové počítače
Pomineme-li bitcoinové nadšence, máme tu také podniky a jejich vývojová centra, která potřebují solidní výpočetní výkon. Na stranu druhou, český kapitál se v tomto směru nemůže srovnávat se Západem, a tak si firmy, pokud už potřebují opravdu špičkový výkon, procesorový čas spíše pronajímají. Stručně řečeno, pokud potřebujete rychle něco spočítat, jednoduše si ta virtuální jádra CPU a GPU na chvíli pronajmete třeba v datacentrech Google Cloud, Microsoft Azure, Amazon AWS aj. Stačí vám kreditka a webový prohlížeč.


První západní počítač ve Škodovce a dnešní 2PFLOPS mašina
Jen ty největší firmy investují do vlastního superpočítačového železa, které pak mohou prodat i optikou svého vlastního náborového marketingu. Typickým příkladem je mladoboleslavská Škoda Auto, která se už loni pochlubila svým novým datovým centrem, v jehož srdci stojí systém SGI 8600 od Hewlett Packard Enterprise. Cluster vyplněný procesory Xeon se může podle Škodovky pochlubit teoretickým výkonem okolo 2 PFLOPS, přičemž v plánu je navýšení až na 15 PFLOPS!
Stroj tedy dokáže alespoň teoreticky spočítat až dvě biliardy základních výpočtů s reálnými čísly za sekundu.
15 PFLOPS a i ty 2 PFLOPS by měly bohatě stačit v umístění v žebříčku TOP500, jehož nejpomalejší stroj Huawei Graham disponuje změřeným výkonem 1,2 PFLOPS. Jenže jde právě o to slovíčko změřeným. Stručně řečeno, do tabulky se dostanou jen ty stroje, jejichž reálný výkon změřil standardizovaný benchmark organizátorů. A ten v praxi pochopitelně dosahuje mnohem nižších hodnot.
Škodovácký superpočítač na propagačním videu:
A co je zdaleka nejdůležitější, majitel superpočítačového clusteru se také musí chtít zapojit. Proto žebříčku TOP500 vévodí především akademické superpočítače a stroje firem, které umístění vnímají i jako formu vlastní propagace včetně té náborové. Tisíce dalších ale nemají čas spouštět na svých mašinách jakési benchmarky, protože si je prostě pořídily kvůli něčemu jinému. Byznysu.
Pokračování 3 / 4
Tuzemští vědci
Malé superpočítače kryptoměnových těžařů a průmyslové clustery doplňuje ještě česká věda. K těm medializovanějším mašinám patří například superpočítače Českého hydrometeorologického ústavu, na kterých zpracovává svoje předpovědní modely.

Výpočetní sál ČHMÚ v roce 1985: Ing. Krištůfek a paní Šťastná zakládají pásky se staničními daty ke zpracování počítačem ADT
Páskový počítač ADT (PDF) z 80. let postupně vystřídaly rackové skříně NEC SX4, na kterých ČHMÚ počítal modely ALADIN na přelomu století. NEC SX4 se mohl pochlubit výkonem 6 GFLOPS, takže by jej dnes pokořil kdejaký kapesní čipset. V prvním desetiletí stárnoucí mašinu vystřídal NEC SX6 s výkonem 64 GFLOPS, který předpovídal počasí v letech 2003-2009, no a do roku 2017 pak ČHMÚ používal ještě svižnější stroj NEC SX9 s teoretickým výkonem 3,2 TFLOPS.

NEC SX4 počítal modely Aladin v letech 1998-2003 a nabízel výkon 6 GFLOPS
Pomalu se dostáváme do současnosti, od května 2018 totiž potřebám vědců slouží aktuální NEC série LX (PDF), který disponuje konstrukčním výkonem zhruba 270 TFLOPS, a na sklonku loňského roku se začalo mluvit o nákupu ještě výkonnějšího nástupce za pár desítek milionů korun, který jej postupně doplní.



NEC SX6, SX9 a konečně současný NEC LX s výkonem 270 TFLOPS (Foto: ČHMÚ)
Superpočítače NEC jsou špičkové mašiny – 270 bilionů výpočtů za sekundu přece není úplně k zahození, avšak optikou TOP500, kde se hraje na petaflopsy, tedy biliardy, to jsou už ořezávátka nižší třídy.
Pokračování 4 / 4
Ostrava
Pomalu se dostáváme k českému superpočítačovému vrcholu, kterým je samozřejmě Ostrava. Slezská metropole, kterou celé století definovala především těžba uhlí a vysoké pece, s postupným útlumem tradičního průmyslu hledá cesty ven a jednou z nich jsou superpočítačové technologie.

Souhrnný výkon ostravského centra
Na půdě zdejší Vysoké školy báňské – Technické univerzity Ostrava totiž sídlí IT4Innovations, tedy národní superpočítačové centrum, do kterého jsou zapojené i další akademické a privátní subjekty z Česka.
Atlas mobility
Pokud jsem už výše nastínil, že si mnohé firmy vystačí s výpočty v cloudu a pronajímaným superpočítačovým výkonem, než aby investovaly desítky milionů do vlastního železa, IT4Innovations je jednou z cest, svůj vlastní procesorový čas totiž taktéž nabízí jak akademické, tak privátní sféře a letos na jaře se organizace otevřela výzkumníkům ještě více.

Atlas mobility a síť s klastry, ve kterých se pohybujeme nejčastěji
V posledním roce bylo o IT4I slyšet třeba v souvislosti s tzv. Atlasem mobility, který modeluje pohyb obyvatel ČR na základě anonymizovaných údajů z mobilních vysílačů T-Mobile. Analýza tak ohromného balíku dat vyžaduje špičkový procesorový výkon, a tak se Atlas mobility průběžně počítá právě na půdě ostravského superpočítačového centra. Výstupy pak v posledních dnech používala ve svých epidemiologických rozhodnutích a veřejných výstupech i česká vláda.

Atlas mobility: Změna nevyjíždějících
Čtyři ostravské clustery
Centrum disponuje čtyřmi superpočítačovými mašinami. Jednou z nich je malý box Nvidia DGX-2 vyzbrojený dvojicí procesorů Xeon Platinum, především ale 16 výpočetními GPGPU kartami Tesla V100. Je to ideální stroj pro zpracovávání neuronových sítí a pro strojové učení.

Barbora spočítá až 849 bilionů matematických výpočtů za sekundu
A pak tu najdete ještě stárnoucího Anselma s teoretickým výkonem 94 TFLOPS, mnohem pracovitější Barboru s výkonem 849 TFLOPS a konečně Salomona, který disponuje podobným konstrukčním výkonem jako mladoboleslavský cluster, tedy 2 PFLOPS. Ostatně, oba stroje pocházejí od stejného výrobce – SGI, který dnes spadá pod křídla Hewlett Packard Enterprise.



Salomon má konstrukční/teoretický výkon 2 biliard výpočtů za sekundu
Salomon ale postupně stárne. Zatímco v roce 2015 se v celosvětovém žebříčku TOP500 umístil na skvělém 40. místě, dnes mu hrozí, že z tabulky zmizí, v červnu letošního roku se totiž propadl až na 423. místo.
15,2 PFLOPS v roce 2021
Není divu, dolarová cena za petaflops výkonu postupně klesá, a tak si stroje této kategorie může dovolit mnohem více hráčů než před pěti lety. IT4Innovations proto čeká modernizace výbavičky a v rámci širší evropské spolupráce dostane nový stroj opět od Hewlett Packard Enterpise.

Ostrava by se měla příští rok dočkat nového superpočítače
Nový superpočítač nabídne teoretický výpočetní výkon 15,2 PFLOPS a budou jej tvořit clusterové systémy Apollo 2000 a Apollo 6500 se serverovými procesory AMD EPYC a pětistovkou GPU akcelerátorů Nvidia A100 Tensor Core včetně akcelerace úloh z oblasti A.I. Hotovo by mělo být v průběhu příštího roku.
Celý cluster bude rozdělný do několika bloků. Univerzální část pro tradiční numerické simulace bude tvořit 720 serverů s teoretickým výkonem 3,8 PFLOPS. Pak tu bude akcelerovaná část 70 serverů s výkonem 11 PFLOPS pro ty nejnáročnější simulace a výpočty v oblasti A.I. 36 serverů s výkonem 131 TFLOPS bude vyhrazeno pro cloudové služby. Všechny části propojí dohromady 200Gb/s optická síť a k dispozici bude úložiště s kapacitou okolo 1 PB a se schopností zapisovat rychlostí až 1 TB/s.

Hledá se jméno pro nový superpočítač
Mimochodem, kdyby byla mašina hotová už dnes a pečlivě změřená v žebříčku TOP500, Česko by se vrátilo přinejmenším do první třicítky nejrychlejších strojů planety.
Každá mašina podobné kategorie potřebuje svoje jméno, organizace IT4Innovations proto vyhlásila veřejnou soutěž. Navrhnout můžete do 15. prosince až tři názvy, a pokud porota vybere ten váš, odnesete si domů za odměnu svůj vlastní malý superpočítač HPE MicroServer Gen10 Plus.