Nedávno jsme vám přinesli recenzi Radeonu X800 Pro a nyní se konečně do ČR dostaly první karty s čipem NV40. Na recenzi jsme získali hned dva modely – GeForce 6800 Ultra a slabší, ale levnější GeForce 6800. Obě dvě i Radeon X800 Pro jsme podrobili mnoha herním i teoretickým testům, srovnali s předchozí vlajkovou lodí GeForce FX5950 Ultra i se současnými cenově dostupnými kartami – Radeonem 9800 Pro i GeForce FX5900 XT.
Jak už jsme si zvykli, každý čip společnosti NVIDIA, který nese označení NVx0, s sebou přináší mnoho nových prvků. GeForce 256 (NV10) byla první konzumní grafická karta s jednotkou pro zpracování geometrie (T&L), GeForce 3 (NV20) pak programovatelné pixel a vertex shader jednotky (verze 1.1) a GeForce FX (NV30) daleko převyšovala specifikaci pixel a vertex shader 2.0 a celá její architektura byla velice zajímavá (VLIW – Very Long Instruction Word – VLIW procesory využívají speciálním kompilátorem upravený zdrojový kód tak, že se místo několika instrukcí použije instrukce jediná o velké délce slova).
Obrázek 1. Elegantní mořská panna Nalu se stala následnicí kyprých vil Dawn a Dusk.
NVIDIA ale při návrhu ustoupila od VLIW/SIMD architektury použité u GeForce FX (NV30) k tradičnější MIMD/SIMD (vertex/pixel shader, Multiple Instruction Multiple Data/Single Instruction Multiple Data). Ale místo, aby použila dvě texturovací jednotky v každé z pixel pipeline, tak používá efektivnější návrh (není plýtváno výkonem v situacích, kdy není použit multi-texturing, tedy na povrch je aplikována pouze jedna textura) s více pipeline a jen jednou texturovací jednotkou v každé z nich. A protože se rozšířil i počet jednotlivých vertex pipeline (na dvojnásobek oproti NV35 a trojnásobek oproti NV30), tak hlavním znakem NV40 je vysoká míra paralelismu.
Tabulka 1. Srovnání vybraných 3D čipů NVIDIA.
|
GeForce 256 |
GeForce 3 |
GeForce FX5800 Ultra |
GeForce 6800 Ultra |
Čip |
NV10 |
NV20 |
NV30 |
NV40 |
Datum uvedení |
Srpen 1999 |
Březen 2001 |
Leden 2003 |
Duben 2004 |
Počet transistorů |
23 mil. |
57 mil. |
125 mil. |
222 mil. |
Výrobní proces |
220 nm |
150 nm |
130 nm |
130 nm |
Frekvence čipu |
120 MHz |
200 MHz |
500 MHz |
400 MHz |
Počet vertex pipeline |
1 |
1 |
2 |
6 |
Počet pixel pipeline |
4 |
4 |
4 |
16 |
Text. jednotek na pipeline |
1 (tril.) |
2 |
2 |
1 |
Max. fill-rate |
480 MTexelů/s |
1600 Mtexelů/s |
4000 Mtexelů/s |
6400 Mtexelů/s |
Rychlost transformací |
15 mil. vrcholů/s |
40 mil. vrcholů/s |
200 mil. vrcholů/s |
600 mil. vrcholů/s |
Frekvence pamětí |
166 nebo 300 DDR MHz |
230 (460) MHz |
500 (1000) MHz |
550 (1100) MHz |
Paměťová sběrnice |
128-bit SDR/DDR |
128-bit DDR |
128-bit DDR2 |
256-bit DDR3 |
Teoret. propustnost pamětí |
2,66 nebo 4,8 GB/s |
7,36 GB/s |
16 GB/s |
35,2 GB/s |
Vertex shader |
TnL |
1.1 |
2.0+ |
3.0 |
Pixel shader |
- |
1.1 |
2.0+ |
3.0 |
Za další výrazný rys můžeme považovat i obrovské množství transistorů použitých v čipu. Počet 222 milionů jasně předstihuje i CPU s velikou cache jako například Intel Pentium 4 EE, který má o třetinu transistorů méně a pro srovnání ještě AMD Athlon 64 jich nemá ani polovinu (104 milionů). Počet transistorů společně s taktem, výrobní technologií (130 nm FSC firmou IBM) a rychlými GDDR3 pamětmi ústí ve spotřebu celé karty okolo 130 Wattů. Oproti čipům společnosti ATI nebo i svým levnějším řešením NVIDIA v čipu NV40 neintegruje žádný TMDS transmitter. Čip NV40 také dokáže pracovat na různých frekvencích podle situace (což už NVIDIA používá od NV30), a tak například může být (záleží na konkrétní implementaci) frekvence snížena ve 2D nebo při startu systému, kdy není třeba vysoký grafický výkon.
Obrázek 2. 3D pipeline čipu NV40. Zdroj: NVIDIA Corporation
Z obrázku 2 je patrné, že čip NV40 obsahuje čtyři oddělené vertex shader procesory a šestnáct vykreslovacích pipeline. I přesto, že podle definice vertex a pixel shader 3.0 jsou k sobě tyto svou funkcionalitou velice blízko a mohl by se objevit návrh se sjednocenou ALU, tak se tento postup nevyužil, aby nedocházelo k zahlcení cache.