Intel MIC: přes 50 jader s výkonem na hranici TFLOPS

Připravovaný superpočítačový akcelerátor MIC od Intelu se objeví již příští rok. K dispozici jsou další informace, podaří se Intelu porazit grafické karty v HPC segmentu?

O chystaném superpočítačovém čipu Knights Corner jsme vás již informovali ve starších článcích, nyní ale Intel zveřejnil nejen nové informace, ale také fotografie samotného čipu. Intel na prezentaci odpověděl i na mnohé otázky, které byly v případě tohoto výpočetního akcelerátoru stále nezodpovězeny.

Jeden čip s výkonem deseti tisíc Pentií

Desktopové procesory sice začínaly pouze s jedním jádrem, postupe času ale dosáhly maximální použitelné frekvence a bylo nutné zvyšovat výkon jinou cestou. Kromě zlepšování architektury tak došlo k přidávání dalších jader, dnešní průměrný procesor má čtyři jádra, jednojádrové pomalu mizí z nabídky. AMD nedávno uvedla první 16jádrový procesor, který ale neposkytuje nijak zázračný výkon, Intel totiž dokáže velmi snadno konkurovat i s osmi jádry.

Klepněte pro větší obrázek
Před 14 lety k výkonu 1 TFLOPS Intel potřeboval 9 298 procesorů Pentium II Xeon s celkovou spotřebou 500 kW, dnes stačí jeden čip a méně než 300 W

Grafické karty obsahují stovky a dnes již tisíce malých a jednoduchých jader, které byly sice původně určeny pouze pro grafiku, dnes je již lze využít i k dalším a mnohem univerzálnějším výpočtům, které lze snadno paralelizovat.

A právě v této oblasti Intelu mírně ujel vlak, včetně nepodařené grafické karty Larrabee. Výpočetní grafické karty s vysokým paralelním výkonem se totiž velmi rychle dokázaly dostat do HPC segmentu a nyní jsou důležitým základem těch nejvýkonnějších superpočítačů na světě. Intel ale samozřejmě vyvíjel různé technologie vícejádrových čipů v rámci Tera-Scale a reálným výsledkem je Intel Many Integrated Core.

Klepněte pro větší obrázek
Intel Knights Corner - 22 nm, kolem 4 miliard tranzistorů a 50 až 64 výpočetních x86 jader

První testovací karty Knights Ferry s tímto čipem spoléhaly na 45nm technologii výroby, což umožňovalo použít pouze 32 jader a SP (Single Precision) výkon v oblasti 1 TFLOPS (spotřeba bohužel 300W+). Ve většině případů a především v superpočítačích je však DP (Double Precision) nutností, takže bylo jen otázkou času, kdy Intel v nové verzi čipu tyto výpočty umožní.

Klepněte pro větší obrázek Klepněte pro větší obrázek Klepněte pro větší obrázek
 

Nový 22nm čip Knights Corner je vyroben 22nm technologií a nabízí 1 TFLOPS výkon v DP (2 TFLOPS v SP). Intel prezentoval i zajímavé srovnání, kdy takový výkon měl systém ASCI Red v roce 1997, který byl tvořen 9 298 procesory Pentium II Xeon v 72 skříních s celkovou spotřebou okolo 500 kW. Po čtrnácti letech je ten samý výkon k dispozici v rámci jednoho čipu s nesrovnatelně nižší spotřebou.

50 nebo 64 jader?

Intel ve všech materiálech vždy uváděl, že čip bude mít ve finální prodejní verzi „50+“ jader. Tato specifikace zůstává stále a Intel odhalil, proč je tomu tak. V případě takto velkého čipu s velkým počtem tranzistorů (pravděpodobně kolem 4 miliard) mnohem více záleží na kvalitě waferu a výsledné čipy nemusí být stoprocentní funkční. Počítá se s maximálně 64 jádry, i horší čip by však měly mít alespoň 50 funkčních jader. Vše se bude odvíjet od kvality vyrobených čipů, zatím není jasné, zda Intel představí různé modely, podobně jako v procesorové oblasti. Dalším parametrem, který se bude odvíjet od kvality, je také frekvence, která by měla být v rozmezí 1,2 GHz až 1,6 GHz.

 Nově byly prezentovány pouze samotné čipy určeny pro zatím neznámý socket (LGA/BGA?), tedy žádná celá karta do PCI Express slotu. Na kartu sice lze umístit rychlé GDDR5 paměti, s rozšířením je to však horší. V případě základní desky lze ale použít pomalejší DDR3 paměti s mnohem větší kapacitou, což je pro některé výpočty možná větší přínos.

Kompatibilita s x86

Hlavní výhodou těchto čipů oproti těm grafickým je kompatibilita s instrukční sadou x86, pro kterou jsou napsány většiny programů v superpočítačové oblasti. Pokud tak chcete pořídit výkonnější superpočítač, máte dvě základní volby. Zvolit systém na bázi grafický karet, tedy je nutné kompletně přepsat všechny programy a v některých případech i více než miliony řádků kódu, nebo zvolit Intel MIC a kód pouze upravit.

Klepněte pro větší obrázek
Intel prezentuje snadné škálování systémů na bázi MIC

Intel uvádí, že se tak podařilo například 5 milionů řádků kódu v jazyce Fortran, Python, C a C++ pro x86 systémy upravit pro MIC během tří měsíců, například u NWChem, ENZO (astrofyzika), ELK (výzkum materiálů) či MADNESS (aplikovaná matematika).

Oba hlavní výrobci grafických karet – AMD a Nvidia sice nabízí různé vývojářské nástroje pro programování, podobné úpravy však rozhodně nejsou tak snadno možné a vyžadují zcela jiný systém, který se odvíjí od odlišnosti grafický čipů proti klasickým x86 procesorům.

Budoucnost v superpočítačích

I když Intel tyto čipy příští rok uvede, jejich efektivita v poměru výkon a spotřeby není na tak dobré úrovni, jako v případě grafických čipů. Zatímco Intel bude vyrábět čipy 22nm technologií a s novými 3D Tri-gate tranzistory, příští generace grafických čipů si bude muset vystačit s 28 nm.

Jejich výkon by měl být ale v DP vyšší a spotřeba přitom nižší, než u Intel MIC. Přesná čísla se samozřejmě dozvíme až po uvedení, Intel ale bude i přes pokročilejší 22nm proces výroby v horším postavení. To by ale mohla vyrovnat zmíněná kompatibilita s x86 a tím pádem i snadnější vývoj a přenos současných aplikací. U některých jednodušších aplikací a programů je možné novou platformu použít již během několika dní, zatímco při přenosu na grafické čipy by ten samý proces trval několik měsíců.

Bude jistě zajímavé sledovat, jak si Intel z této pozice povede a jak dokáže s Nvidií (Tesla) a AMD (FireStream) bojovat na poli těch nejvýkonnějších počítačů na světě, ale i v oblasti profesionálních výpočetních systémů na grafiku a podobně.

Diskuze (2) Další článek: EXOdesk od ExoPC: futuristická pracovní plocha brzy v prodeji

Témata článku: Hardware, Technologie, Intel, Superpočítače, Vývojářská deska, Zázračný výkon, Screen, TFLOPS, Mnohý výzkum, Gate, Madness, Nvidia, Grafický čip, Různé materiály, Tera, Jádro, Fortran, Snadné škálování, Dp, Vyrobený čip, TFL, Výpočetní výkon

Určitě si přečtěte


Aktuální číslo časopisu Computer

Zachraňte nefunkční Windows

Jak nakupovat a prodávat kryptoměny

Otestovali jsme konvertibilní notebooky

Velký test 14 herních myší