Minulý týden se pro Nvidii nesl v duchu každoroční konference GTC (GPU Technology Conference). V rámci několika přednášek představila společnost několik novinek jak z oblasti grafických karet, tak virtuální reality nebo autonomních automobilů. Tady je shrnutí těch nejpodstatnějších.
Obří Pascal
O architektuře Pascal víme déle než rok. Už loni v březnu jsme viděli první prototyp karty, která byla na čipu nové generace postavena. Až nyní se však Nvidia pochlubila s podrobnostmi a detailními parametry a navíc ukázala první kartu, která stojí na novém GPU GP100.
První kartou postavenou na Pascalu je Tesla P100 určená pro superpočítače
Tesla P100 je první 16nm FinFET karta, která bude určena především jako výpočetní jednotka pro použití v superpočítačích a serverech. Parametry hovoří jasně – vedle TDP 300 W, které je nejvyšší v rámci jednočipové karty je to pak i nový formát s rozhraním NVLink, které v tomto segmentu může nahradit nedostačující PCIe, které se stává v těchto extrémních případech úzkým hrdlem. GP100 je zároveň největším grafickým čipem Nvidie neboť zabírá plochu 610 mm2.
Nvidia vybavila Teslu P100 téměř dvojnásobným počtem tranzistorů než v případě aktuální generace Maxwell – z osmi miliard se stalo 15,3 miliard. V základu bude jádro pracovat s taktem 1 328 MHz, v boostu má potom maximum 1 480 Mhz. K dispozici bude 16 GB paměti typu HBM a je tedy jasné, že herní výkon tu jde stranou. Zároveň Nvidia snížila počet stream procesorů, jimiž jsou vybaveny funkční bloky SM (shader multiprocesory) na polovinu. U Maxwellu jich bylo 128, teď to bude 64.
Schéma funkčního bloku SM
Na půlku se potom sníží i počet texturovacích jednotek. Funkční bloky přitom nebudou v případě Tesly aktivní všechny – z šedesáti zůstanou čtyři nevyužity. I tak bude Tesla P100 dosahovat extrémních výkonů - 10,6 TFLOPS v FP32 (jednoduché přesnosti) a 5,3 TFLOPS v FP64 (dvojité přesnosti). Aktuálně nejvýkonnější Titan X je přitom v FP32 na hodnotě 6,1 TFLOPS.
Kompletní schéma čipu GP100. Čtyři bloky však zůstanou neaktivní
Nové paměti i rozhraní
Pascal vůbec poprvé přinese HBM paměti – v tomto případě typu HBM2 s šířkou sběrnice 4 096 bitů a frekvencí 1,4 GHz. Výslednou propustností by mělo být 720 GB/s, tedy o 40 % více než v případě Fiji.
Nakonec nesmíme zapomenout ani na nové rozhraní NVLink, které u Tesly doplní PCIe. V případě vícečipových řešení umožní komunikovat rychlostí 40 GB/s mezi sebou a v případě podpory ze strany procesoru by to mělo být až 160 GB/s. Kompatibilní budou procesory IBM Power, které budou moci být zapojeny přímo do sítě rozhraní NVLink.
Konektory nového rozhraní NVLink, které bude doplňovat stávající PCIe
Pascal by se v podobě karty P100 měl do prvních superpočítačů a serverů dostat na začátku příštího roku. Nvidia však nabídne i vlastní řešení – počítač DGX-1 zaměřený na strojové učení – deep learning. Ten bude obsahovat hned osm karet P100 s celkovým výkonem 170 TFLOPS v FP16. Jeho cena by se měla pohybovat kolem 129 000 dolarů, tedy asi třech milionů korun.
A co hráči? Jak už bylo zmíněno, do herních grafik GP100 s velkou pravděpodobností nezamíří. Pascal tam budou reprezentovat GP104 a GP106, které by měly nahradit GTX 980 a GTX 960. To si však Nvidia zatím nechává pro sebe – oficiálního uvedení se dočkáme až na Computexu, který začíná poslední květnový den.
Vše pro VR
Velký prostor dostala v prezentacích Nvidie zcela podle očekávání virtuální realita. Přepracování se proto dočkalo prostředí Iray – plugin do modelovacího softwaru sloužící pro renderování fotorealistické grafiky. Ten bude možné použít pro vytváření trojrozměrných scén, v nichž se bude uživatel pohybovat a rozhlížet díky brýlím jako Oculus Rift nebo HTC Vive.
Tohle není fotka BMW Z4. Je to scéna pro virtuální realitu renderovaná pomocí Iray VR
Nvidia bude nabízet několik verzí pluginu, které se budou lišit svými možnostmi a tedy svými hardwarovými nároky. Nejméně náročná verze Iray Lite tak například nebude pracovat se světlem, jehož zařazení do virtuální reality zásadně zvyšuje nároky pro renderování scény. To bude dostupné až v plnotučné verzi Iray VR, kde přibude například tone mapping. O náročnosti svědčí harwdare, který Nvidia použila pro demo ukázky – dvojici karet Nvidia Quadro M6000 s celkovou kapacitou paměti 24 GB. A cenou asi půl milionu korun.
Robotické formule s mozkem Nvidie
Dalším levelem v motoristických sportech by po Formuli E mohl být Roborace. Tedy závod automobilů, které jsou řízeny pouze pomocí umělé inteligence. A právě o tu se bude starat superpočítač od Nvidie s označením Drive PX 2. Závodní týmy dostanou totožný vůz vybavený totožnou řídící jednotkou a jejich úkolem bude napsat co možná nejlepší software, který bude rozhodovat o výsledcích.
Všechna auta v závodě Roborace bude pohánět superpočítač od Nvidie
Závody robotických automobilů, jejichž řídící jednotky budou disponovat výkonem stopadesáti Macbooků Pro, by se poprvé měly objevit v rámci závodů Formule E na začátku příštího roku.