Novinky Nvidie: první Pascal, prostředí pro virtuální realitu a formule bez řidiče

  • Nvidia ukázala první kartu postavenou na architektuře Pascal
  • Zamíří především do superpočítačů a serverů
  • Pozornost zaměřuje nejen na hardware pro VR, ale také software

Minulý týden se pro Nvidii nesl v duchu každoroční konference GTC (GPU Technology Conference). V rámci několika přednášek představila společnost několik novinek jak z oblasti grafických karet, tak virtuální reality nebo autonomních automobilů. Tady je shrnutí těch nejpodstatnějších.

Obří Pascal

O architektuře Pascal víme déle než rok. Už loni v březnu jsme viděli první prototyp karty, která byla na čipu nové generace postavena. Až nyní se však Nvidia pochlubila s podrobnostmi a detailními parametry a navíc ukázala první kartu, která stojí na novém GPU GP100.

P100_575px_2.jpg
První kartou postavenou na Pascalu je Tesla P100 určená pro superpočítače

Tesla P100 je první 16nm FinFET karta, která bude určena především jako výpočetní jednotka pro použití v superpočítačích a serverech. Parametry hovoří jasně – vedle TDP 300 W, které je nejvyšší v rámci jednočipové karty je to pak i nový formát s rozhraním NVLink, které v tomto segmentu může nahradit nedostačující PCIe, které se stává v těchto extrémních případech úzkým hrdlem. GP100 je zároveň největším grafickým čipem Nvidie neboť zabírá plochu 610 mm2.

Nvidia vybavila Teslu P100 téměř dvojnásobným počtem tranzistorů než v případě aktuální generace Maxwell – z osmi miliard se stalo 15,3 miliard. V základu bude jádro pracovat s taktem 1 328 MHz, v boostu má potom maximum 1 480 Mhz. K dispozici bude 16 GB paměti typu HBM a je tedy jasné, že herní výkon tu jde stranou. Zároveň Nvidia snížila počet stream procesorů, jimiž jsou vybaveny funkční bloky SM (shader multiprocesory) na polovinu. U Maxwellu jich bylo 128, teď to bude 64.

gp100_SM_diagram.png
Schéma funkčního bloku SM

Na půlku se potom sníží i počet texturovacích jednotek. Funkční bloky přitom nebudou v případě Tesly aktivní všechny – z šedesáti zůstanou čtyři nevyužity. I tak bude Tesla P100 dosahovat extrémních výkonů - 10,6 TFLOPS v FP32 (jednoduché přesnosti) a 5,3 TFLOPS v FP64 (dvojité přesnosti). Aktuálně nejvýkonnější Titan X je přitom v FP32 na hodnotě 6,1 TFLOPS.

nvidia_tesla_p100_s_16nm_cipem_gp100_architektury_pascal_02.png
Kompletní schéma čipu GP100. Čtyři bloky však zůstanou neaktivní

Nové paměti i rozhraní

Pascal vůbec poprvé přinese HBM paměti – v tomto případě typu HBM2 s šířkou sběrnice 4 096 bitů a frekvencí 1,4 GHz. Výslednou propustností by mělo být 720 GB/s, tedy o 40 % více než v případě Fiji.

Nakonec nesmíme zapomenout ani na nové rozhraní NVLink, které u Tesly doplní PCIe. V případě vícečipových řešení umožní komunikovat rychlostí 40 GB/s mezi sebou a v případě podpory ze strany procesoru by to mělo být až 160 GB/s. Kompatibilní budou procesory IBM Power, které budou moci být zapojeny přímo do sítě rozhraní NVLink.

P100Back.jpg
Konektory nového rozhraní NVLink, které bude doplňovat stávající PCIe

Pascal by se v podobě karty P100 měl do prvních superpočítačů a serverů dostat na začátku příštího roku. Nvidia však nabídne i vlastní řešení – počítač DGX-1 zaměřený na strojové učení – deep learning. Ten  bude obsahovat hned osm karet P100 s celkovým výkonem 170 TFLOPS v FP16. Jeho cena by se měla pohybovat kolem 129 000 dolarů, tedy asi třech milionů korun.

A co hráči? Jak už bylo zmíněno, do herních grafik GP100 s velkou pravděpodobností nezamíří. Pascal tam budou reprezentovat GP104 a GP106, které by měly nahradit GTX 980 a GTX 960. To si však Nvidia zatím nechává pro sebe – oficiálního uvedení se dočkáme až na Computexu, který začíná poslední květnový den.

Vše pro VR

Velký prostor dostala v prezentacích Nvidie zcela podle očekávání virtuální realita. Přepracování se proto dočkalo prostředí Iray – plugin do modelovacího softwaru sloužící pro renderování fotorealistické grafiky. Ten bude možné použít pro vytváření trojrozměrných scén, v nichž se bude uživatel pohybovat a rozhlížet díky brýlím jako Oculus Rift nebo HTC Vive.

Zancher-BMW02.png
Tohle není fotka BMW Z4. Je to scéna pro virtuální realitu renderovaná pomocí Iray VR

Nvidia bude nabízet několik verzí pluginu, které se budou lišit svými možnostmi a tedy svými hardwarovými nároky. Nejméně náročná verze Iray Lite tak například nebude pracovat se světlem, jehož zařazení do virtuální reality zásadně zvyšuje nároky pro renderování scény. To  bude dostupné až v plnotučné verzi Iray VR, kde přibude například tone mapping. O náročnosti svědčí harwdare, který Nvidia použila pro demo ukázky – dvojici karet Nvidia Quadro M6000 s celkovou kapacitou paměti 24 GB. A cenou asi půl milionu korun.

Robotické formule s mozkem Nvidie

Dalším levelem v motoristických sportech by po Formuli E mohl být Roborace. Tedy závod automobilů, které jsou řízeny pouze pomocí umělé inteligence. A právě o tu se bude starat superpočítač od Nvidie s označením Drive PX 2. Závodní týmy dostanou totožný vůz vybavený totožnou řídící jednotkou a jejich úkolem bude napsat co možná nejlepší software, který bude rozhodovat o výsledcích.

Roborace_NVIDIA_Perspective_Green_003_10comp.jpg
Všechna auta v závodě Roborace bude pohánět superpočítač od Nvidie

Závody robotických automobilů, jejichž řídící jednotky budou disponovat výkonem stopadesáti Macbooků Pro, by se poprvé měly objevit v rámci závodů Formule E na začátku příštího roku.

Diskuze (19) Další článek: Pozvánka: IT Camp – DevOps

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,