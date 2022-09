Nvidia představila novou generaci architektury pro výpočetní grafické karty pro servery již před nějakou dobou, takže jsme mohli poměrně snadno spekulovat o tom, jaká bude nová generace herních grafických karet pro desktopové počítače. Po mnoha uniklých informacích jsme se nakonec dočkali oficiálního představení pouze tří hi-end modelů – GeForce RTX 4090 a dvou verzí GeForce RTX 4080.

Architektura Ada Lovelace

Nové čipy jsou postavené na architektuře Ada Lovelace, která je v rámci samotných čipů vyráběná pomocí nejnovější upravené 4nm technologie u TSMC (proto označení 4N místo běžných N4). Vzhledem k tomu, že minulá generace grafických karet GeForce RTX 3000 vznikla u Samsungu pomocí 8nm technologie, jde o opravdu velký skok v miniaturizaci, která dovolila množství tranzistorů posunout o obrovský kus na 76 miliard.

Nvidia nesázela pouze na to, ale vylepšila architekturu jednotlivých částí čipu, které v moderních hrách a aplikacích hrají stále důležitější roli. K dispozici je tak už čtvrtá generace tensor jader, které zlepšují výkon i ve spojení s novou verzí DLSS 3. Propustnost tensor jader se zvýšila až pětkrát. Hrubý výkon je až 1,4 „tensor“ PFLOPS (FP8).

Specializovaná jádra pro ray tracing už jsou ve třetí generaci a přináší několik novinek, které poskytují kromě jiného i dvakrát větší výkon oproti minulé generaci (až 200 RT TFLOPS). Mezi tyto nové technologie patří Opacity Micromap (OMM) nebo Displaced Micro-Mesh Engine (DMM).

Protože práce se shadery je ve hrách stále primární, Nvidia vyvinula i novou technologii SER (Shader Execution Reordering), která optimalizuje pořadí jednotlivých procesů při zpracování obrazu, díky čemuž jsou všechny části, shadery, ray tracing, tensor jádra) využité co možná na maximum v daném čase a čip tak zbytečně nepřepíná mezi jednotlivými typy tak často.

Dle Nvidie to zlepšuje výkon při zpracování shaderů s ray tracingem až třikrát, přičemž ve hrách se to reálně projeví zvýšením výkonu až o 25 %. Shadery jsou oproti minulé generaci dvakrát efektivnější a nabízí výkon až 90 TFLOPS.

Vylepšené byly i enkodéry pro video (NVENC), které jsou už v osmé generaci a podporují i hardwarovou akceleraci AV1 v rozlišení 8K s 10bitovými barvami a 60 fps.

GeForce RTX 4090 a GeForce RTX 4080

Nvidia zatím uvedla pouze dva, respektive tři hi-endové modely – GeForce RTX 4090 a GeForce RTX 4080 v provedení s 16 GB a 12 GB paměti.

GeForce RTX 4090 je postavená na čipu AD102-300, má 76 miliard tranzistorů a celkem 16 384 cuda jader. Vzhledem k tomu, že plnotučný čip z této generace, který je zatím jen u serverových modelů (H100), má 16 896 cuda jader, má Nvidia ještě menší prostor pro budoucí „GeForce RTX 4090 Ti“, kterou lze případně čekat příští rok. Boostovací frekvence čipu je standardně 2 520 MHz, ale bude samozřejmě záležet dle konkrétního modelu a případného přetaktování z výroby.

Specifikace grafických karet Nvidia GeForce RTX 4000 (Ada) Model GeForce RTX 4090 GeForce RTX 4080 16 GB GeForce RTX 4080 12 GB Výroba 4N (TSMC) 4N (TSMC) 4N (TSMC) CUDA jádra 16 384 9 728 7 680 Boost frekvence 2 520 MHz 2 505 MHz 2 610 MHz Kapacita paměti 24 GB (GDDR6X) 16 GB (GDDR6X) 12 GB (GDDR6X) E. frekvence paměti 21 GHz 22,5 GHz 21 GHz Paměťové rozhraní 384bit 256bit 192bit Propustnost paměti 1 008 GB/s 720 GB/s 504 GB/ Spotřeba TGP (Max) 450 W (660 W) 320 W (516 W) 285 W (366 W) Cena (doporučená) 47 990 Kč 36 100 Kč 27 100 Kč

Paměť je 24 GB GDDR6X s rychlostí 21 Gb/s a 384bitovým rozhraním, což dává celkovou propustnost 1 008 GB/s. To vše se podepsalo na zvýšené spotřebě a množství generovaného tepla. Zatímco základní TGP je 450 W, špičkově se může dostat až na 660 W.

A to mluvíme pouze o samotné grafické kartě. Nelze se tak divit tomu, že vzduchové chladiče pro tento model jsou obrovské, v některých případech je přímo na čipu dokonce 13 heatpipe trubic a chladič zabere čtyři sloty, tedy klidně takřka celou část základní desky od prvního PCI Express slotu dolů.

GeForce RTX 4080 je k dispozici ve dvou verzích, které ale trochu mohou zmást uživatele, protože se rozhodně neliší pouze kapacitou paměti 16 GB nebo 12 GB typu GDDR6X. Liší se totiž i konfigurací hlavního čipu a rychlostí pamětí.

16GB verze GeForce RTX 4080 má čip AD103-300 a 9 728 cuda jádry s boostovací frekvencí až 2 505 MHz, zatímco GeForce RTX 4080 s 12GB pamětí má čip AD104-400 s jen 7 680 jádry cuda, byť je boostovací frekvence mírně vyšších 2 610 MHz.

Rozdíly jsou také v použitém paměťovém rozhraní (256bit vs. 192bit) a efektivní frekvence pamětí 22,5 GHz vs. 21 GHz. Výsledná propustnost je tak 720 GB/s u 16GB verze a 504 GB/s u 12GB verze. Rozdíly ve výkonu jsou zřejmé i z TGP, které je 320 W (až 516 W) u 16GB varianty a 285 W (až 366 W) u 12GB modelu.

Pokud jde o porovnání výkonu s minulou generací, Nvidia se pochopitelně chlubí velkými rozdíly. U GeForce RTX 4090 například uvádí, že výkon oproti GeForce RTX 3090 Ti je 2× až 4× vyšší, přičemž dvojnásobek lze čekat u běžných her a čtyřnásobek tam, kde se hodně používá ray tracing. Uvidíme, co nám ukáží první nezávislé testy. Nvidia totiž opět hodně sází na to, že obrovský skok přináší i spojení s novým DLSS 3.

DLSS 3 s až čtyřnásobným zvýšením výkonu

Nová generace DLSS 3 funguje ještě více zázračně než druhá generace a Nvidia díky tomu slibuje zvýšení výkonu ve hrách až čtyřnásobně. První dvě generace upscalovaly rozlišení z nižšího na vyšší a díky strojovému učení to dělaly lépe než standardní škálovací metody. Trojka už nezlepšuje rozlišení, ale snímkovou frekvenci. Uměle totiž dopočítává mezisnímky, aby obraz byl plynulejší.

Přípomítá to technologii kompenzace pohybu v moderních televizorech, které převádějí obraz z 25 na 50 či 100 snímků za sekundu. To ale s sebou přináší artefakty, které jsou při bližším zkoumání patrné. Jak bude vypadat DLSS 3, ukáže až praxe.

Největší rozdíl byl prezentovaný jak na speciálním demu Nvidia Racer RTX, tak i ve hře Cyberpunk 2077 v módu Ray tracing Overdrive, kde je rozdíl opravdu čtyřnásobný – například z nehratelných 22 fps na 98 fps. V případě Flight Simulatoru od Microsoftu se výkon z 65 fps dostal s DLSS 3 na 135 fps, tedy přibližně na dvojnásobek.

Už v první vlně se Nvidia pochlubila 35 hrami, které oznámily podporu DLSS 3 a jako překvapení se chystá legendární hra Portal s RTX, kdy budou všechna světla postavená na ray tracingu. Tou nejlepší zprávou ale je, že bude toto DLC zcela zdarma pro majitele stávající hry. Technologie DLSS 3 bude dostupná jen na GeForce RTX 4000, majitelé řad RTX 3000 a 2000 mají smůlu.

Ceny a dostupnost

Nejdříve bude dostupný nejvýkonnější model GeForce RTX 4090 a to 12. října. Doporučená maloobchodní cena je 1 599 dolarů, což by v našich končinách mělo být něco kolem 47 990 korun.

Obě verze GeForce RTX 4080 budou dostupné až během listopadu, přičemž cena bude 1 199 dolarů (16GB varianta) a 899 dolarů (12GB varianta). Na české ceny to znamená přibližně 36 100 korun, respektive 27 100 korun.

Asi netřeba dodávat, že to poměrně nabourá stávající trh s modely GeForce RTX 3000, takže jsme zvědaví, jestli si prodejci zase nebudou chtít značně zvýšit zisky a nezvýší maloobchodní ceny nad takovou úroveň, aby nejdříve vyprodali starou generaci. To bude o to těžší, protože se spousta těžařů kryptoměn bude této i jiné generace zbavovat ve velkém množství (Ethereum už nelze těžit) a za nízké ceny. Nová generace má tak rozhodně velmi náročnou startovací pozici z pohledu situace na trhu.

AMD chystá novou generaci grafických karet Radeon RX 7000 na 3. listopadu, tak uvidíme, jak se architektura RDNA 3 předvede.

Video z celé prezentace