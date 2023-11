Přibližně rok po čipu H100 uvede Nvidia vylepšený model H200. Nejde o nástupce, tím bude až B100, ale jen mezigenerační aktualizaci šitou na míru nejnáročnějším uživatelům.

Samotný akcelerátor se ostatně ani nemění, pořád je to obří čip architektury Hopper s 80 miliardami tranzistorů a plochou 812 mm². Jedinou ohlášenou změnou je paměť, která je větší a rychlejší. Nvidia rozšířila sběrnici na 6144 bitů, použila rychlejší HBM3e od Micronu a zvýšila kapacitu na 141 GB. Propustnost oproti H100 narostla o 43 %, kapacita o 75 %.

H200 H100 A100 V100 P100 architektura Hopper Hopper Ampere Volta Pascal die size 812 mm² 812 mm² 826 mm² 815 mm² 610 mm² tranzistorů 80 mld. 80 mld. 54,2 mld. 21,1 mld. 15,3 mld. FP32 CUDA jader 16 896 16 896 6912 5120 3584 boost takt 1980 MHz 1980 MHz 1410 MHz 1530 MHz 1480 MHz VRAM 141 GB HBM3e 80 GB HBM3 80 GB HBM2 32 GB HBM2 16 GB HBM2 sběrnice 6144bit 5120bit 5120bit 4096bit 4096bit propustnost 4,8 TB/s 3,35 TB/s 2,0 TB/s 0,9 TB/s 0,7 GB/s FP32 67 TFLOPs 67 TFLOPs 19,5 TFLOPs 15,7 TFLOPs 10,6 TFLOPs FP64 34 TFLOPs 34 TFLOPs 9,7 TFLOPs 7,8 TFLOPs 5,3 TFLOPs INT8 Tensor 1979 TLOPs 1979 TOPs 624 TOPs - - FP16 Tensor 990 TFLOPs 990 TFLOPs 312 TFLOPs 125 TFLOPs - TF32 Tensor 495 TFLOPs 495 TFLOPs 156 TFLOPs - - interconnect NVLink 4, 900 GB/s NVLink 4, 900 GB/s NVLink 3, 600 GB/s NVLink 2, 300 GB/s NVLink 1, 160 GB/s TDP 700 W 700 W 400 W 350 W 300 W Výroba TSMC 4N TSMC 4N TSMC 7N TSMC 12nm FFN TSMC 16nm FinFET+

Jen touto úpravou stoupne výkon v serverových a AI operacích, a to tím víc, čím jsou závislejší na pamětech. Podle údajů Nvidia to bude v obecných HPC výpočtech o 18 % navíc. V AI modelu Llama2 s 13 miliardami parametrů o 40 % víc, se 70 miliardami o 90 % víc a se 175 miliardami pak o 60 % víc, protože zde už opět bude paměti méně, než by bylo třeba. U výpočtů inferencí GPT-3 se 175 miliardami parametrů výkon také stoupne o 60 %.

Čip Nvidia H200 bude dostupný od druhého čtvrtletí 2024 ve formě kartet SXM, případně na serverových deskách HGX se čtyřmi či osmi kartami najednou. Cenu firma neuvedla, ale to stejně nemá smysl. Kvůli boomu generativní AI teď prodá všechno, co vyrobí, za ceny mnohonásobně vyšší, než činí výrobní náklady. Jedna karta H100 se vyrobí za pžibližně 3000 dolarů, ale zákazníci je kupují i za 60 000 dolarů.