Dvakrát NV40: Recenze GeForce 6800 Ultra a GeForce 6800

Nedávno jsme vám přinesli recenzi Radeonu X800 Pro a nyní se konečně do ČR dostaly první karty s čipem NV40. Na recenzi jsme získali hned dva modely – GeForce 6800 Ultra a slabší, ale levnější GeForce 6800. Obě dvě i Radeon X800 Pro jsme podrobili mnoha herním i teoretickým testům, srovnali s předchozí vlajkovou lodí GeForce FX5950 Ultra i se současnými cenově dostupnými kartami – Radeonem 9800 Pro i GeForce FX5900 XT.

Jak už jsme si zvykli, každý čip společnosti NVIDIA, který nese označení NVx0, s sebou přináší mnoho nových prvků. GeForce 256 (NV10) byla první konzumní grafická karta s jednotkou pro zpracování geometrie (T&L), GeForce 3 (NV20) pak programovatelné pixel a vertex shader jednotky (verze 1.1) a GeForce FX (NV30) daleko převyšovala specifikaci pixel a vertex shader 2.0 a celá její architektura byla velice zajímavá (VLIW – Very Long Instruction Word – VLIW procesory využívají speciálním kompilátorem upravený zdrojový kód tak, že se místo několika instrukcí použije instrukce jediná o velké délce slova).

Obrázek 1. Elegantní mořská panna Nalu se stala následnicí kyprých vil Dawn a Dusk.  

NVIDIA ale při návrhu ustoupila od VLIW/SIMD architektury použité u GeForce FX (NV30) k tradičnější MIMD/SIMD (vertex/pixel shader, Multiple Instruction Multiple Data/Single Instruction Multiple Data). Ale místo, aby použila dvě texturovací jednotky v každé z pixel pipeline, tak používá efektivnější návrh (není plýtváno výkonem v situacích, kdy není použit multi-texturing, tedy na povrch je aplikována pouze jedna textura) s více pipeline a jen jednou texturovací jednotkou v každé z nich. A protože se rozšířil i počet jednotlivých vertex pipeline (na dvojnásobek oproti NV35 a trojnásobek oproti NV30), tak hlavním znakem NV40 je vysoká míra paralelismu.

Tabulka 1. Srovnání vybraných 3D čipů NVIDIA.

  GeForce 256 GeForce 3 GeForce FX5800 Ultra GeForce 6800 Ultra
Čip NV10 NV20 NV30 NV40
Datum uvedení Srpen 1999 Březen 2001 Leden 2003 Duben 2004
Počet transistorů 23 mil. 57 mil. 125 mil. 222 mil.
Výrobní proces 220 nm 150 nm 130 nm 130 nm
Frekvence čipu 120 MHz 200 MHz 500 MHz 400 MHz
Počet vertex pipeline 1 1 2 6
Počet pixel pipeline 4 4 4 16
Text. jednotek na pipeline 1 (tril.) 2 2 1
Max. fill-rate 480 MTexelů/s 1600 Mtexelů/s 4000 Mtexelů/s 6400 Mtexelů/s
Rychlost transformací 15 mil. vrcholů/s 40 mil. vrcholů/s 200 mil. vrcholů/s 600 mil. vrcholů/s
Frekvence pamětí 166 nebo 300 DDR MHz 230 (460) MHz 500 (1000) MHz 550 (1100) MHz
Paměťová sběrnice 128-bit SDR/DDR 128-bit DDR 128-bit DDR2 256-bit DDR3
Teoret. propustnost pamětí 2,66 nebo 4,8 GB/s 7,36 GB/s 16 GB/s 35,2 GB/s
Vertex shader TnL 1.1 2.0+ 3.0
Pixel shader - 1.1 2.0+ 3.0

Za další výrazný rys můžeme považovat i obrovské množství transistorů použitých v čipu. Počet 222 milionů jasně předstihuje i CPU s velikou cache jako například Intel Pentium 4 EE, který má o třetinu transistorů méně a pro srovnání ještě AMD Athlon 64 jich nemá ani polovinu (104 milionů). Počet transistorů společně s taktem, výrobní technologií (130 nm FSC firmou IBM) a rychlými GDDR3 pamětmi ústí ve spotřebu celé karty okolo 130 Wattů. Oproti čipům společnosti ATI nebo i svým levnějším řešením NVIDIA v čipu NV40 neintegruje žádný TMDS transmitter. Čip NV40 také dokáže pracovat na různých frekvencích podle situace (což už NVIDIA používá od NV30), a tak například může být (záleží na konkrétní implementaci) frekvence snížena ve 2D nebo při startu systému, kdy není třeba vysoký grafický výkon.

 Obrázek 2. 3D pipeline čipu NV40. Zdroj: NVIDIA Corporation

Z obrázku 2 je patrné, že čip NV40 obsahuje čtyři oddělené vertex shader procesory a šestnáct vykreslovacích pipeline. I přesto, že podle definice vertex a pixel shader 3.0 jsou k sobě tyto svou funkcionalitou velice blízko a mohl by se objevit návrh se sjednocenou ALU, tak se tento postup nevyužil, aby nedocházelo k zahlcení cache.

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,