Intel MIC: přes 50 jader s výkonem na hranici TFLOPS

Připravovaný superpočítačový akcelerátor MIC od Intelu se objeví již příští rok. K dispozici jsou další informace, podaří se Intelu porazit grafické karty v HPC segmentu?

O chystaném superpočítačovém čipu Knights Corner jsme vás již informovali ve starších článcích, nyní ale Intel zveřejnil nejen nové informace, ale také fotografie samotného čipu. Intel na prezentaci odpověděl i na mnohé otázky, které byly v případě tohoto výpočetního akcelerátoru stále nezodpovězeny.

Jeden čip s výkonem deseti tisíc Pentií

Desktopové procesory sice začínaly pouze s jedním jádrem, postupe času ale dosáhly maximální použitelné frekvence a bylo nutné zvyšovat výkon jinou cestou. Kromě zlepšování architektury tak došlo k přidávání dalších jader, dnešní průměrný procesor má čtyři jádra, jednojádrové pomalu mizí z nabídky. AMD nedávno uvedla první 16jádrový procesor, který ale neposkytuje nijak zázračný výkon, Intel totiž dokáže velmi snadno konkurovat i s osmi jádry.

Screen Shot 2011-11-15 at 8.33.38 PM.png
Před 14 lety k výkonu 1 TFLOPS Intel potřeboval 9 298 procesorů Pentium II Xeon s celkovou spotřebou 500 kW, dnes stačí jeden čip a méně než 300 W

Grafické karty obsahují stovky a dnes již tisíce malých a jednoduchých jader, které byly sice původně určeny pouze pro grafiku, dnes je již lze využít i k dalším a mnohem univerzálnějším výpočtům, které lze snadno paralelizovat.

A právě v této oblasti Intelu mírně ujel vlak, včetně nepodařené grafické karty Larrabee. Výpočetní grafické karty s vysokým paralelním výkonem se totiž velmi rychle dokázaly dostat do HPC segmentu a nyní jsou důležitým základem těch nejvýkonnějších superpočítačů na světě. Intel ale samozřejmě vyvíjel různé technologie vícejádrových čipů v rámci Tera-Scale a reálným výsledkem je Intel Many Integrated Core.

intel_knights_corner_big.jpg
Intel Knights Corner - 22 nm, kolem 4 miliard tranzistorů a 50 až 64 výpočetních x86 jader

První testovací karty Knights Ferry s tímto čipem spoléhaly na 45nm technologii výroby, což umožňovalo použít pouze 32 jader a SP (Single Precision) výkon v oblasti 1 TFLOPS (spotřeba bohužel 300W+). Ve většině případů a především v superpočítačích je však DP (Double Precision) nutností, takže bylo jen otázkou času, kdy Intel v nové verzi čipu tyto výpočty umožní.

mic_cern.jpg mic_scale.jpg Screen Shot 2011-11-15 at 8.34.36 PM.png
 

Nový 22nm čip Knights Corner je vyroben 22nm technologií a nabízí 1 TFLOPS výkon v DP (2 TFLOPS v SP). Intel prezentoval i zajímavé srovnání, kdy takový výkon měl systém ASCI Red v roce 1997, který byl tvořen 9 298 procesory Pentium II Xeon v 72 skříních s celkovou spotřebou okolo 500 kW. Po čtrnácti letech je ten samý výkon k dispozici v rámci jednoho čipu s nesrovnatelně nižší spotřebou.

50 nebo 64 jader?

Intel ve všech materiálech vždy uváděl, že čip bude mít ve finální prodejní verzi „50+“ jader. Tato specifikace zůstává stále a Intel odhalil, proč je tomu tak. V případě takto velkého čipu s velkým počtem tranzistorů (pravděpodobně kolem 4 miliard) mnohem více záleží na kvalitě waferu a výsledné čipy nemusí být stoprocentní funkční. Počítá se s maximálně 64 jádry, i horší čip by však měly mít alespoň 50 funkčních jader. Vše se bude odvíjet od kvality vyrobených čipů, zatím není jasné, zda Intel představí různé modely, podobně jako v procesorové oblasti. Dalším parametrem, který se bude odvíjet od kvality, je také frekvence, která by měla být v rozmezí 1,2 GHz až 1,6 GHz.

 Nově byly prezentovány pouze samotné čipy určeny pro zatím neznámý socket (LGA/BGA?), tedy žádná celá karta do PCI Express slotu. Na kartu sice lze umístit rychlé GDDR5 paměti, s rozšířením je to však horší. V případě základní desky lze ale použít pomalejší DDR3 paměti s mnohem větší kapacitou, což je pro některé výpočty možná větší přínos.

Kompatibilita s x86

Hlavní výhodou těchto čipů oproti těm grafickým je kompatibilita s instrukční sadou x86, pro kterou jsou napsány většiny programů v superpočítačové oblasti. Pokud tak chcete pořídit výkonnější superpočítač, máte dvě základní volby. Zvolit systém na bázi grafický karet, tedy je nutné kompletně přepsat všechny programy a v některých případech i více než miliony řádků kódu, nebo zvolit Intel MIC a kód pouze upravit.

intel_scaling.jpg
Intel prezentuje snadné škálování systémů na bázi MIC

Intel uvádí, že se tak podařilo například 5 milionů řádků kódu v jazyce Fortran, Python, C a C++ pro x86 systémy upravit pro MIC během tří měsíců, například u NWChem, ENZO (astrofyzika), ELK (výzkum materiálů) či MADNESS (aplikovaná matematika).

Oba hlavní výrobci grafických karet – AMD a Nvidia sice nabízí různé vývojářské nástroje pro programování, podobné úpravy však rozhodně nejsou tak snadno možné a vyžadují zcela jiný systém, který se odvíjí od odlišnosti grafický čipů proti klasickým x86 procesorům.

Budoucnost v superpočítačích

I když Intel tyto čipy příští rok uvede, jejich efektivita v poměru výkon a spotřeby není na tak dobré úrovni, jako v případě grafických čipů. Zatímco Intel bude vyrábět čipy 22nm technologií a s novými 3D Tri-gate tranzistory, příští generace grafických čipů si bude muset vystačit s 28 nm.

Jejich výkon by měl být ale v DP vyšší a spotřeba přitom nižší, než u Intel MIC. Přesná čísla se samozřejmě dozvíme až po uvedení, Intel ale bude i přes pokročilejší 22nm proces výroby v horším postavení. To by ale mohla vyrovnat zmíněná kompatibilita s x86 a tím pádem i snadnější vývoj a přenos současných aplikací. U některých jednodušších aplikací a programů je možné novou platformu použít již během několika dní, zatímco při přenosu na grafické čipy by ten samý proces trval několik měsíců.

Bude jistě zajímavé sledovat, jak si Intel z této pozice povede a jak dokáže s Nvidií (Tesla) a AMD (FireStream) bojovat na poli těch nejvýkonnějších počítačů na světě, ale i v oblasti profesionálních výpočetních systémů na grafiku a podobně.

Diskuze (2) Další článek: EXOdesk od ExoPC: futuristická pracovní plocha brzy v prodeji

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,