Intel příští rok uvede novou generaci superpočítačového čipu Xeon Phi, který obsahuje 72 „Atomových“ jader s celkovým výkonem přes 3 TFLOPS.
Začalo to v roce 2008 už v rámci projektu Larrabee, který skončil fiaskem v roce 2010. Intel ale věděl, že musí mít vícejádrový čip s vysokým paralelním výkonem, který by dokázal konkurovat novým univerzálním výpočetním grafickým čipům od AMD a Nvidie.
V roce 2010 se tak z Larrabee zrodil čip, respektive výpočetní karta Knight Ferry s 32 jednoduchými jádry na frekvenci 1,2 GHz, 2 GB GDDR5 paměti a výkonem 750 GFLOPS. Výrobní proces v podobě 45nm tranzistorů znamenal vysoké TDP 300 W. Hlavní směr Intelu byl ale jasný – nabídnout vícejádrový čip kompatibilní s instrukční sadou x86, což konkurenční grafické karty nemůžou nabídnout.
Rok poté už Intel ukázal prototyp novější generace, která byla vyráběna 22nm technologií – Knights Corner (61 jader, 1,2 TFLOPS). V roce 2012 pak Intel představil zbrusu novou značku pro tyto čipy – Xeon Phi. Intel pokračuje ve vývoji a příští rok uvede novou generaci s kódovým označením Knights Landing.
Knights Landing: 14 nm a výkon 3 TFLOPS
Nová generace superpočítačového čipu Xeon Phi bude vyrobena pomocí 14nm technologie, tedy stejně jako chystané čipy Broadwell. Intel už v minulosti oznámil, že chce nejnovější výrobní technologie použít v rámci celého spektra čipů.

Základní vlastnosti nové generace Xeon Phi Knights Landing
Intel nabídne řešení ve dvou verzích – jako samostatný čip a jako koprocesorovou kartu do PCI Express. Základem architektury bude s největší pravděpodobností 72 „Atomových“ jader Airmont (Silvermont), přičemž každé bude zvládat až čtyři vlákna současně. Každé jádro bude mít dvě 512bitové vektorové jednotky s podporou AVX-512F (AVX 3.1), AVX-512 CDI a AVX-512 ERI. TDP zatím nebylo oznámeno, ale očekává se v rozmezí 160 W až 215 W.

Detaily o novém paměťovém systému na bázi Hybrid Memory Cube od Micronu
V rámci paměťového systému Intel spolupracoval s Micronem a implementoval nový typ TSV (Through Silicon) vycházející z HMC (Hybrid Memory Cube), která umožní u jednoho čipu použít až 16 GB paměti s 15krát vyšší propustností než nabízí operační paměti DDR3 a pětkrát větší propustností než u DDR4. Toto řešení si lze představit jako obří cache. Paměťová propustnost totiž hraje velkou roli právě u těchto čipů, které zpracovávají obrovské množství dat.


Výsledkem by měl být obrovský výpočetní výkon nad hranicí 3 TFLOPS v DP (Double Precision). A jak vysoký je to výpočetní výkon? Pro srovnání – nejvýkonnější profesionální grafika AMD FirePro W9100 s 16 GB paměti GDDR5 má v DP výkon pouze 2 TFLOPS a její cena je kolem sto tisíc korun. Čipy Knights Landing budou mít i klasický řadič pro operační paměti DDR4.
Omni Scale pro rychlé spojení
Pro stavbu superpočítačů složených třeba i z mnoha tisíc takových čipů, je nutné zajistit i rychlé spojení mezi jednotlivými čipy. Intel vyvinul vlastní řešení s označením Omni Scale, které vychází z technologií od společností Cray a QLogic.
Intel zatím nezveřejnil bližší detaily, ale k tomu by mělo dojít s uvedením finální verze nové generace Xeon Phi, která se dostane na trh až v druhé polovině roku 2015.

Intel s Omni Scale počítá i u nasazení s klasickými procesory Xeon
Jeden z prvních superpočítačů postavených na nových čipech bude „Cori“ organizace NERSC (National Energy Research Scientific Computing Center), který bude obsahovat celkem 9 300 čipů Knights Landing. Ani u tohoto superpočítače nejsou známé bližší informace, jednoduchou matematikou lze ale odhadnout, že výpočetní výkon by měl být kolem hranice 30 PFLOPS.