Test Radeonu HD 2900 XT: R600 je konečně tady!

Na novém Radeonu poháněném čipem R600 jsme změřili všechno, co se dalo – tedy i výkon pod Windows Vista.
Test Radeonu HD 2900 XT: R600 je konečně tady!

Už jsem zmínil, že ATI uvádí, že v R600 skloubila zatím to nejlepší z dosavadních architektur: Ze série X1000 to je rychlé dynamické větvení, možnosti proudového zpracování, plně asociativní cache pro textury a Fetch4. Z Xenosu pak unifikované pixel a vertex shadery, vyvažování zátěže (vertex/pixel) a stream out. K tomu všemu přidává rychlejší superskalární shader jednotky, nový návrh ultra dispatch procesoru, plnou podporu DirectX 10 včetně geometry shaderu a vyšší propustnost paměťových sběrnic danou také jejich návrhem.

Vpravo schéma Radeonu HD 2900 (512b sběrnice, 320 stream procesorů, 4 text. jednotky), uprostřed jeho „třetina až polovina“ v podobě Radeonu HD 2600 (128b sběrnice, 120 stream procesorů, 2 text. jednotky) a vlevo pak levná „osmina“ – Radeon HD 2400 (64/128 b sběrnice, 40 stream procesorů, 1 text. jednotka)

Jak to tedy v čipu jde po sobě? Command processor zpracovává proud dat pro grafický čip, spouští mikrokód s přístupem do paměti. Setup Engine připraví data pro zpracování stream procesory: sestavení vertexů, geometrie,řádková konverze a interpolace. Každá funkce odesílá vlákno dispatch procesoru. Každé vlákno obsahuje několik instrukcí, jež se mají provést nad blokem vstupních dat. Část dispatch procesoru, arbitr, rozhoduje, které vlákno se spustí. Jestliže má Radeon HD 2900 XT čtyři SIMD pole, má také celkem osm arbitrů (dva pro každé pole) a ještě dva speciální vyhrazené pro vertex/texture fetch. Kdykoli mohou přijít vlákna s vyšší prioritou, zpracovávané vlákno není ztraceno, ale uloženo.


Schéma dispatch procesoru a SIMD polí (klepnutím zvětšete)

K dispatch procesoru náleží dvě cache, jedna umožňuje neomezený počet instrukcí, druhá konstant. Dispatch procesor se také stará o snižování latence – jakmile vlákno čeká na data z paměti, je odloženo a pracuje se na jiném. Dispatch procesor shromažďuje stovky vláken, aby se stávalo co nejméně, že SIMD pole nebudou ideálně vytížena.

SIMD pole skládající se z 80 stream procesorů (mluvíme stále jen o R600) mají VLIW (very long instruction word) návrh, což evokuje vzpomínky na nešťastnou GeForce FX. Každé instrukční slovo může obsahovat až šest instrukcí (pět aritmetika, jedna pro řízení běhu). Instrukce fetch texture a fetch vertex jsou prováděny zvlášť.


Schéma stream procesoru, který je navržen jako superskalární pěticestný shader procesor. Za jediný takt dokáže provést tedy až pět MAD (Multiply-Add) instrukcí a jedna část umí provádět i transcedentní fuknce (sin, cos, log, exp apod.). Jednotky počítají s 32b FP přesností a před nimi vše řídí jednotka větvení.

Radeon HD 2900 má čtyři texturovací jednotky. Pokud se vám to ve srovnání s předchozími generacemi zdá málo, máte pravdu. To ale nevíte nic o jejich složitosti. Každá texturovací jednotka obsahuje 8 jednotek pro adresování textur, 20 jednotek pro vzorkování a 4 pro FP32 filtrování (každá umí bilineárně filtrovat jednu 64b barevnou hodnotu za takt). Ve spojení s 256 kB L2 cache pro textury by mělo být filtrování 64-bit HDR textur až 7× rychlejší než u Radeonů rodiny X1000 (HD 2600 má jen 128 kB L2 cache, HD 2400 má jen cache první úrovně). Texturovací jednotky podporují textury až do 8 192 × 8 192 px a jsou plně přístupné vertex, geometry i pixel shader kódu.

Na jednu zajímavost mě upozornil ještě Jirka Souček: R600 podle strohého výčtu funkcí podporuje i bikubické filtrování, tedy funkci, která by mohla přinést ještě lepší výsledky než anizotropní filtrování. Zatím ji známe jen ze zvětšovacích algoritmů bitmapových editorů, ale ATI/AMD je možná první, kdo nabízí její HW akceleraci (přestože se tím až podezřele nechlubí). Jak je to skutečně a zda bude mít funkce praktické využití, to nedokážu v tuto chvíli říct.

V části, která tvoří výsledné obraz ve frame bufferu a ATI ji nazývá RBE (Render Back Ends), došlo také k několika zlepšením. Radeon HD 2900 oproti minulé generaci stihne dvojnásobek testů hloubky/stencilu (až pro 32 pixelů, HD 2600 a 2400 pro 8 pixelů za takt) a MSAA je zase více programovatelné (umožňuje tak CFAA). RBE umožňuje zobrazit nové formáty ze standardu DirectX 10 a podporuje celkem osm render targets s MSAA (dvojnásobek oproti X1000).

ATI jako s každou novou generací vylepšuje i svůj hierarchický Z-buffer (paměť hloubky a algoritmus nad ní pracující – zahazuje ve výsledku neviditelné pixely před dalšími výpočty) i komprese Z- a stencil bufferu (pozitivní dopad je vidět třeba na výborném výkonu ve hře Quake 4). Do hier. Z-bufferu přibyla funkcionalita hier. stencil bufferu a Z-buffer nyní podporuje přesnost FP32.


Schéma paměťové sběrnice R600

ATI v R600 také dotáhla svou prstencovou sběrnici (ring-bus). Vnitřní šířka 1 024 bitů (rozděluje si ji čtení a zápis) a systém zastávek pro výměnu dat mezi zúčastněnými komponentami představuje to nejpokrokovější v oblasti grafických karet. Stejně tak skutečná šířka paměťové sběrnice (512 b) zaručuje Radeonu HD 2900 XT ještě o něco vyšší propustnost než má GeForce 8800 Ultra s mnohem výše taktovanými pamětmi. Taková šířka sběrnice byla dosud problém – I/O pads na okraji čipu se neškálují s výrobním procesem stejně snadno jako zbytek čipu a ATI musela navrhnout jejich zcela nový design. Jinak by bylo GPU příliš velké a příliš drahé. Momentálně se ATI vejde na stejný prostor jako dříve s 256b sběrnicí. Ring-bus se stal sběrnicí skutečně plně distribuovanou, u Radeonu X1000 se jednalo ještě o hybridní řešení (předchozí generace byly plně crossbar).

Témata článku: Windows, Decathlon, Přímý dotaz, VLIW, Call of Duty 2, Gothic 3, Široká oblast, Obraz, Produkovaný hluk, Výhrada, Verze, Quake, Radeon, Vertikální synchronizace, Velká ztráta, Sousední pixel, Nová jednotka, Chaos, PC, Call of Duty, Kaliforňan, Použitá hra, Far Cry, Call, Detail


Určitě si přečtěte

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 3

Nové názvy, upravený vývoj. Microsoft ukázal, jak teď bude vydávat Windows 10

Nové názvy, upravený vývoj. Microsoft ukázal, jak teď bude vydávat Windows 10

** Podzimní vydání Windows 10 přinese jen minimum novinek ** Aktualizace ponese formální označení 20H2 ** Microsoft mění názvy v programu Windows Insider

Lukáš Václavík | 17

Je lepší hrát na PC, či na konzolích? Nebo jsou i jiné možnosti?

Je lepší hrát na PC, či na konzolích? Nebo jsou i jiné možnosti?

** Jaké jsou výhody a nevýhody hraní na počítači? ** Co mají společného a v čem se liší Xbox One, PS4 a Switch? ** Na čem hrát, když nemáte výkonné PC ani konzoli?

Lukáš Václavík | 124

Co přijde po Netflixu a Amazonu? Tohle jsou streamovací služby, na které v Česku čekáme

Co přijde po Netflixu a Amazonu? Tohle jsou streamovací služby, na které v Česku čekáme

** Rozhodujete se mezi Netflixem a HBO Go? Věřte, bude hůř ** Na trhu je mnohem víc ambicióznějších streamovacích služeb ** Některé by mohly do ČR zamířit ještě letos

Lukáš Václavík | 45


Aktuální číslo časopisu Computer

Megatest: nejlepší notebooky do 20 000 Kč

Test 8 levných IP kamer

Jak vybrat bezdrátová sluchátka

Testujeme Android 11