NVIDIA nForce útočí

Největším překvapením letošního Computexu není Palomino, ani VIA P4X266, ani čipset i845, ale paradoxně čipová sada giganta v oblasti grafiky - společnosti NVIDIA. Překvapením pochopitelně není to, že NVIDIA bude vyrábět čipové sady (to jsme již věděli), ale to, jak k celé věci přistoupila. Zatímco se všichni výrobci čipsetů „patlají“ s klasickou koncepcí, přináší nForce (alias Crush) řadu velice zajímavých vylepšení. Pokud se podaří vše zrealizovat v rozumném čase a za rozumnou cenu, bude ostatním výrobcům velice horko.
Kapitoly článku

Čipset nForce je, ač se to nezdá, vysoce integrované řešení. Základ tvoří dva čipy - IGP (north bridge) a MCP (south bridge).

Integrated Graphics Processor

Jak se vlastně NVIDIA dostala k designování čipových sad? Po té, co získala převahu v oblasti grafických karet, se na ní obrátil Microsoft a začala tak spolupráce na vývoji herní konzole X-BOX. Microsoft se pochopitelně nechce nechat zahanbit, takže X-BOX má být zcela převratná technologie - velcí hráči v oblasti PC převálcují Sony Playstation 2. NVIDIA v tomto plánu hraje úlohu hlavního designéra zodpovědného za grafiku a je také pověřena tvorbou čipsetu. Nezní to divně, čipset a konzole? Ono totiž výpočty bude v X-BOXu provádět procesor Pentium III, jehož výroba je poměrně levná (čip o velikosti 90 mm2) a hlavně Intel je schopen dodat ho v požadovaném množství.

Microsoft bere celou akci velice vážně a „napumpoval“ do společnosti NVIDIA velkou finanční injekci na design čipsetu. NVIDIA si tak mohla dovolit licencovat některé technologie, aniž by je musela sama vymýšlet. Dále využila nově nabyté zkušenosti z vývoje GeForce 3.

Integrated Graphics Processor (IGP)

Schéma IGP

IGP bychom mohli nazvat severním mostem. Tento severní most je skrz FSB sběrnici EV6 napojen na procesor architektury AMD K7. Tato sběrnice může operovat v režimu DDR na dnešním standardu 133MHz. Potuď vše stejné s konkurencí....

Integrovaná grafika - GeForce 2

Ano, je to tak - v IGP se nachází upravená verze čipu NV11 alias GeForce 2 MX, obsahující dvě pipelines taktované na 175MHz a doplněné o 300MHz RAMDAC. To může některým připadat jako již zastaralé a málo výkonné řešení, ovšem MXko je radikálně výkonnější než jakýkoliv jiný integrovaný grafický čip! Tento čip pochopitelně obsahuje Transformation & Lightning (T&L) jednotku a navíc je vnitřně propojen se zbytkem IGP pomocí AGP 8x!

Toto je možné díky integraci čipu. Dnešní AGP totiž z důvodu kompatibility operuje na frekvenci 66MHz a režimy 2x a 4x jsou dosahovány pomocí přenosu více dat v jednom hodinovém cyklu (technologie DDR, resp. QDR). Zde ovšem čip nekomunikuje přes AGP, ale přes speciální sběrnici, která má propustnost jako AGP 8x, tj. 2GB/s.

Je dost dobře možné, že integrovaná grafika zcela převálcuje starší generaci grafických karet založených na čipech jako Voodoo 2 / Banshee nebo Riva TNT. Pokud se vám přesto nebude zdát MXko dost dobré, je možné použít externí AGP 4x (včetně Fast Writes). NVIDIA vám bude určitě vděčná, pokud si koupíte např. GeForce 3 ;-).

TwinBank

... je nejzajímavější částí nového čipsetu. Proč? Dovoluje totiž paralelní přístup ke dvěma SDR / DDR DIMM modulům zároveň!

V praxi to znamená vynikající propustnost pamětí, lepší než 128bit DDR! Jak je to možné? V čipu se nacházejí dva memory controlery, první obsluhuje DIMM0, druhý pak DIMM1 / DIMM2. Pokud uživatel obsadí DIMM0, použije se pouze controller 1 a zařízení se chová jako standardní 64 bit. Pokud ale obsadí DIMM0 a zároveň DIMM1 nebo DIMM2, pak se použijí oba controlery a propustnost pamětí se radikálně zvýší. Každý controller může obsluhovat paměť rozdílné velikosti, ale také rozdílného časování!

Co je ovšem důležité, je fakt, že je možné provádět čtení a zápisy do paměti souběžně! Takže zatímco AGP přistupuje do paměti přes controller 2, může procesor přistupovat přes controller 1. Toto je velice důležité, protože to umožňuje efektivní práci s pamětí. Takže např. procesor může vyslat příkaz na dodávku dat do controleru 1 a zároveň si vyžádat jiná data od controleru 2! V klasické koncepci musí procesor počkat minimálně 6 hodinových cyklů na dodání prvního bloku dat z paměti a pak teprve je možné žádat znovu, což ovšem trvá opět 6 hodinových cyklů. V tomto případě lze dosáhnout situace, kdy zatímco se zpracovává první požadavek, lze začít zpracovávat požadavek další. O tom, co bude kde rozmístěno, rozhoduje Arbiter.

Rozdíl mezi klasickou koncepcí a TwinBank

Toto rozdělení paměti na dva bloky je výhodnější než dvoukanálový DIMM, přestože teoretická propustnost 4,2GB/s u 133MHz DDR je u obou stejná! Problém klasické koncepce je v tom, že procesor musí počkat na vyřízení požadavků ostatních zařízení jakými jsou AGP, PCI, EIDE apod., zatímco zde je možné obsloužit procesor i ostatní zařízení současně (za předpokladu, že data jsou v jiném modulu). Výhoda tohoto řešení se projeví především při použití externí grafické karty, jelikož integrovaná grafika bude mít na systémovou paměť takové požadavky, které mohou controller(y) doslova zahltit a na procesor už tolik propustnosti nezbude.

Architektura TwinBank bude obsažena pouze v čipsetu nForce 420, levnější varianta nForce 220 bude mít pouze jeden 64 bit controller. Propad výkonu bude s největší pravděpodobností zdrcující.

Ještě dodám, že nForce podporuje 64MB až 1,5GB unbuffered RAM bez ECC. Možné je použití jak SDRAM, tak DDR SDRAM ve třech DIMM slotech a konfiguracích 64, 128, 256 nebo 512Mbit x8 nebo x16.

Dynamic Adaptive Speculative Pre-processor (DASP)

DASP je patentovanou technologií a v zásadě se nejedná o nic jiného než o hardwarový prefetch. DASP sleduje přístupy do paměti a sám se rozhodne, která data nakopíruje do rychlé paměti SRAM. Pokud si zařízení přistupující do paměti vyžádá data a tyto jsou již přítomny v SRAM, jsou načtena odsud. Tak se zabrání zdlouhavým čekáním na nalezení požadovaných dat v systémové RAM. NVIDIA zatím nechce říci bližší informace ohledně toho, podle čeho se určuje, jaká data načíst do SRAM ani např. na jaké frekvenci a s jakou latencí tyto SRAM pracují. V každém případě lze počítat se zlepšením oproti klasické koncepci. Podle poskytnutých údajů můžeme při použití Thunderibrdu počítat se zlepšením o 5% nebo více. Otázkou zůstává, nakolik se toto projeví při použití Palomina, jelikož tento procesor již sám o sobě obsahuje hardwarový prefetch, který klade velké nároky na systémovou paměť.

Témata článku: , , , , , , , , , , , , , , , , , , , , , ,