Xeon Phi: superpočítačový čip s 60 jádry od Intelu

Intel se dlouho dobu snažil vyvinout výpočetní čip s vysokým paralelním výkonem. I přes neúspěšné Larrabee se mu to ale nakonec podařilo.

S příchodem první akcelerační karty pro 3D výpočty se v počítačích začaly samostatně rozvíjet dvě hlavní výpočetní části. Na jedné straně byl tradiční procesor, který má jedno či pár jáder na vysoké frekvenci, je univerzální a schopný zpracovat různé druhy úloh, a na druhé straně grafický čip, který má mnoho menších výpočetních celků pro specializované druhy výpočtů při zpracování obrazu.

V začátcích 3D akcelerace to byli oba současní konkurenti – AMD (tehdy ATI) a Nvidia, kteří začali udávat směr vývoje grafických čipů. Postupným vývojem se ale začaly grafické čipy zaměřovat na větší a větší rozsah výpočtů a architektura se nakonec stala velmi univerzální i pro obecné výpočty, které s grafikou nemají vůbec nic společného.

Neslavné Larrabee

Intel teoreticky odstartoval výzkum mnohojádrových výpočetních čipů v roce 2004 a v rámci programu Tera-Scale se o tento směr zajímalo přes 80 samostatných projektů. Kvůli absenci výkonné grafiky se Intel snažil vyrobit grafickou kartu s kódovým označením Larrabaee, která by byla dostatečně výkonná a efektivní při srovnání s modely od AMD a Nvidie.

Vývoj Larrabee byl ale propadák, ani s těmi nejdražšími dostupnými inženýry se zkrátka nepodařilo dotáhnout produkt do cílových vlastností. Mnoholeté zkušenosti AMD a Nvidie zkrátka nešly jen tak dohnat. Grafický čip byl i pro Intel tvrdý oříšek a dle neoficiálních informací padly na vývoj více než tři miliardy dolarů. Naštěstí se architektura grafických čipů stávala univerzálnější a Intel už se nemusel soustředit na složité konstrukce pro 3D výpočty a na extrémně složité ovladače a kompatibilitu.

1.jpg
Vývoj paralelních čipů u Intelu

Univerzální paralelní výpočetní čip byl ten správný směr, který zachránil Intel před velkým neúspěchem v této oblasti. Na konci roku 2009 slavnostně ukázal běžící čip Larrabee s výkonem téměř 1 TFLOPS, samozřejmě bez bližších informací. Spotřeba s tehdejší výrobní technologií a s minimální optimalizací ale byla mnohem vyšší, než u modelů od AMD a Nvidie.

Čas, hodně peněz a pokročilá výrobní technologie ale i tento problém vyřešily, inženýrům se podařilo architekturu nadále vyvíjet a dočkali jsme se představení „many-core“ čipů jako Aubrey Isle (MIC), Rock Creek (Single chip Cloud Computer), které se již začaly blížit finální verzi, která bude určena pro prodej.

Intel Xeon Phi

Po několika ukázkách výpočetních karet s kódovým označením Knigts Corner, které měly čipy s 32 jádry, později i s 50 jádry, se nakonec podařilo Intelu dotáhnout do úspěšného konce produkt s označením Xeon Phi.

intel-xeon-phi.jpg

Oproti výrobcům AMD nebo Nvidie, kteří u svých univerzálních grafických čipů používají specializovanou architekturu, se Intel rozhodl kvůli zpětné kompatibilitě a snazšímu rozšíření použít i v tomto případě instrukční sadu x86. Výsledný čip si tak lze představit jako velké množství jednoduchých procesorů, které jsou určeny pro společné paralelní výpočty. Na jednom kusu křemíku.

XeonPhiDie_03.jpg
Počet miniaturních jader u Xeon Phi dosahuje zatím na 61 (Zdroj: Intel)

Programy určené pro současné procesory Xeon v superpočítačích tak budou fungovat takřka bez problémů, bude ale nutná optimalizace pro využití maximálního výkonu. Není však nutné současné programy kompletně přepisovat a programátoři se tak mohou soustředit pouze na optimalizaci.

Intel_Xeon_Phi_Hotchips_architecture_presentation 10-10.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 11-11.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 12-12.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 13-13.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 14-14.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 15-15.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 16-16.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 17-17.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 18-18.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 19-19.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 20-20.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 21-21.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 2-2.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 22-22.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 23-23.jpeg
Intel_Xeon_Phi_Hotchips_architecture_presentation 24-24.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 25-25.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 26-26.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 27-27.jpeg  Intel_Xeon_Phi_Hotchips_architecture_presentation 29-29.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 30-30.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 31-31.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 3-3.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 4-4.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 5-5.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 6-6.jpegIntel_Xeon_Phi_Hotchips_architecture_presentation 7-7.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 8-8.jpeg Intel_Xeon_Phi_Hotchips_architecture_presentation 9-9.jpeg

Intel představil několik modelů karet do slotu PCI Express a v rámci paralelní výkonu přesahují 1 TFLOPS (DP), přesně 1 073 GFLOPS. Všechny modely mají čipy vyrobené 22nm technologií, mírně se ale liší konfigurace a spotřeba.

Dva modely mají 61jádrový čip na frekvenci 1,1 GHz a paměti GDDR5 s frekvencí 5,5 GHz s celkovým TDP 300 W, model Xeon Phi 5110P (pasivně chlazený v rámci možností racku) má 60 jader na frekvenci 1,053 GHz, GDD5 ECC paměti na frekvenci 5 GHz a TDP 225 W. Výpočetní výkon je pak 1 011 GFLOPS.

XeonPhiSKUs.png
Intel Xeon Phi a konfigurace (Zdroj: Intel)

Všechny Xeon Phi karty mají 8 GB paměti GDDR5 (512bit), ještě v této půlce roku by měl ale Intel představit i dva nové modely ze série 3100 s 6 GB paměti GDDR5 a TDP 300 W.

Vzhledem k určení jsou ceny vysoké, ale Intel se musel přizpůsobit současné konkurenci v podobě Nvidie a AMD. Xeon Phi 5110P je tak v prodeji za 2 700 dolarů (Nvidia Tesla K20 stojí 3 200 dolarů) a chystaná série 3100 pak bude začínat na 2 000 dolarech.

Xeon Phi a souboj o nejvýkonnější superpočítače

Intel si chce pochopitelně udržet silnou pozici v oblasti velkých serverů a superpočítačů, což by bez paralelního výpočetního čipu nebylo ani možné. Již dnes může až 90 % výkonu toho nejvýkonnějšího superpočítače tvořit právě výpočetní karty od konkurence. A to je pro byznys Intelu nebezpečné, protože jde o segment s vysokou marží, ze kterého teče hodně peněz.

Jedním z prvních velkých a významných nasazení výpočetních karet Xeon Phi je superpočítačový systém Stampede, který se již dostal do žebříčku deseti nejvýkonnějších superpočítačů na světě a ve finální verzi by měl dosáhnout na výkon 10 PFLOPS.

2.jpg
Složitější úlohy si žádají vyšší výkon

Rozložení výkonu je ve stylu zmíněného poměru, 8 PFLOPS poskytují karty Xeon Phi, 2 PFLOPS pak klasické procesory. Pro zajímavost, velikost operační paměti je v tomto případě 272 TB a k dispozici je úložný prostor s kapacitou 14 PB.

srampede-2-470.jpg
Výpočetní karty Xeon Phi v superpočítači Stampede (Zdroj: TACC)

Nyní se tak Intel bude snažit zvrátit útok AMD a Nvidie v oblasti paralelních výpočtů v serverech a superpočítačích, oba konkurenti už totiž mají poměrně širokou základnu i softwarovou podporu. Intel má ale v rukávu stále pokročilejší výrobní technologie, takže dokud tomu tak bude, jeho produkty bude vždy těžké porazit. 

Diskuze (28) Další článek: Nový PSPad 4.5.7 přináší várku užitečných oprav

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,