V oblasti akceleraci strojového učení, hlubokých neuronových sítí, big data nebo umělé inteligence obecně si Nvidia v posledních letech vybudovala velmi silnou pozici i s vlastním frameworkem CUDA a dalšími nástroji.
V segmentu serverů má tak AMD po stránce grafických akcelerátorů mnohem slabší pozici, ale to by se mohlo změnit s novými generacemi jak grafických akcelerátorů, tak i softwaru a kompletní řešení i s procesory Zen.
Radeon Instinct: kombinace hardwaru a softwaru
AMD pod označením Radeon Instinct zahrnuje dvě části – hardware v podobě nových grafických akcelerátorů a také otevřenou softwarovou platformu s označením ROCm (Radeon Open Compute Platform).

Stavení bloky Radeon Instinct
Výhodou je, že tato platforma už je na trhu přes rok, takže již existuje podpora řady nástrojů, knihoven a frameworků. Přehled můžete vidět na obrázku, je mezi nimi například Caffe nebo třeba i TensorFlow od Googlu.

Softwarová platforma ROCm
Oproti Nvidii, která staví na více uzavřené platformě, se tak AMD snaží vybudovat otevřenou variantu. Jak už jsme ale zmínili, Nvidia si za poslední roky vybudovala obří komunitu a v oblasti serverů a datacenter jsou akcelerátory Nvidia jedním z důvodů masivního růstu příjmů v posledních čtvrtletích. AMD tak z tohoto pohledu nic jiného, než otevřenost nezbývá, protože uzavřené řešení by nemohlo s Nvidií konkurovat.
Pasivně chlazení akcelerátory
AMD představilo tři modely grafických akcelerátorů Radeon Instinct. Jedná se o modely Instinct MI6, MI8 a MI25. Nejslabším modelem je Instinct MI6, který je postaven na moderním 14nm čipu s architekturou Polaris a v rámci TDP 150 W poskytuje výpočetní výkon 5,7 TFLOPS (SP, ve stylu Radeonu RX 480)). Karta je v tomto případě vybavená 16 GB paměti GDDR5 s propustností 224 GB/s.

Přehled akcelerátorů Radeon Instinct
Výkonnější model Instinct MI8 má zcela odlišnou konfiguraci, protože využívá ještě staršího 28nm čipu s architekturou Fiji, ale zároveň s 4 GB rychlé paměti HBM. Díky tomu je paměťová propustnost 512 GB/s. Celkový výpočetní výkon je 8,2 TFLOPS (SP) s TDP 175 W (podobně jako starší Radeon R9 Nano řady 300).

Nejvýkonnějším modelem bude Radeon Instinct MI25, který už bude mít čip založený na architektuře Vega. V rámci TDP 300 W poskytne výkon 12,5 TFLOPS (SP, při FP16 pak 25 TFLOPS). Další informace o tomto modelu zatím AMD bohužel neprozradilo. Tento model by měl ale přímo konkurovat nejvyššímu modelu od Nvidie – Tesla P100. Podle grafů je Radeon Instinct MI25 v testu DeepBench GEMM téměř dvakrát výkonnější, než nejnovější Titan X s architekturou Pascal od Nvidie.


Ve všech případech jsou karty vybavené pouze pasivním chlazením, takže nemají žádné ventilátory. Generované teplo je ale pochopitelné nutné odvádět aktivním chlazením v rámci samotného serverového racku.
Kompletní řešení nejdříve v polovině příštího roku
I když nové výpočetní karty vypadají nadějně, AMD se potýká s problémem, který už trvá poměrně dlouho – dostupnost. Zatímco Nvidia už nové modely prodává, AMD by mělo možná stihnout první polovinu roku 2017, kdy už zase Nvidia může představit nejen nové modely, ale také klidně snižovat ceny a ještě více tak poškodit AMD.

Jeden procesor Zen dokáže díky podpoře 64 linek obsloužit čtyři karty napojené na PCI Express x16
AMD má ale oproti Nvidii šanci vytvořit kompletní serverovou platformu Naples na bázi čipů Zen, která by mohla cenově a výkonově konkurovat právě kombinaci Intel + Nvidia. Bude moci nabídnout celkem 64 linek PCI Express x16 v rámci jednoho procesoru, což znamená možnost připojit čtyři karty bez zpomalení propustnosti na sběrnici.

Ve výsledku tak může být kompletní řešení od AMD levnější, i když nelze předpokládat, že v oblasti procesoru bude výkonnější než Intel. Procesor je ale pro trénování hlubokých neuronových sítí a zpracování big data oproti výpočetním kartám stejně velmi neefektivní, takže v tomto případě záleží hlavně na výkonu akcelerátorů a celkové ceně a spotřebě platformy.