Nvidia uvádí první Tesla karty s novým „Fermi“ čipem

První výpočetní karty Tesla C2050 a C2070 s dlouho očekávaným „Fermi“ čipem nové generace byly „papírově“ představeny, a s nimi i podrobnější informace o výkonu.

O nové generaci grafických i výpočetních karet jsme vás již podrobně informovali v obecném článku „Nvidia: Končí éra grafických karet, přivítejte Fermi“, výpočetní možnosti v superpočítačích jsme pak rozebrali v článku „Nvidia Fermi: stvořeno pro novou generaci (super)počítačů“. Nvidia dosud neuvedla žádné bližší specifikace ani o teoretickém výkonu, takže očekávání byla stále velkou neznámou. Včera ale Nvidia oficiálně představila nové výpočetní karty Tesla C2050 a C2070, které jsou založeny na novém jádře NV100, které je však známo především pod názvem „Fermi“. Na povrch se dostalo i několik důležitých informací.

Nvidia Tesla C2050 a 2070: tady počítá Fermi

Výpočetní karty Nvidia Tesla se dočkaly inovace v podobě dvou nových modelů C2050 a C2070, jejichž čipy jsou založeny na nové architektuře Fermi, která je více uzpůsobena právě pro výpočty například pomocí CUDA. Výpočetní možnosti byly ale v případě nového čipu značně rozšířeny, podporovány jsou různé API i jazyky, mezi kterými nechybí C, C++, Fortran, OpenCL či DirectCompute.

Nvidia sice stále tají podrobnější informace o frekvencích (stream „CUDA“ procesorů by mělo být 512), ale některé důležité hodnoty a informace odkryla. Karty Tesla 2050 a 2070 se liší především ve velikosti paměti, v případě C2050 až 3 GB GDDR5 a u C2070 maximálně 6 GB GDDR5 paměti. Rozdíly budou pravděpodobně i ve frekvencích jader, zveřejněné specifikace zatím však mlčí. Oba modely jsou určeny do klasického PCI Express ×16 (2.0) slotu, měří přibližně 25 cm na délku (dvouslotový chladič), vyžadují přídavné napájení PCI Express (6pin a 8pin) a jsou připraveny i pro výpočetní 1U systémy Tesla S2050 a S2070 (lze propojit do clusteru), které obsahují až 4 karty s celkovou kapacitou pamětí 12 GB, respektive 24 GB. Pokud ale využijete ECC, počítejte pouze s 2,625 GB paměti u C2050 a 5,25 GB s kartou Tesla C2070.

Tesla_C2050-C2070_1929-3qtr_large.jpg 

Nvidia Tesla C2050/C2070

Díky technologii Nvidia GigaThread Engine nabízí rychlejší přepínání mezi jednotlivými úlohami, včetně lepšího řazení vláken. O podporovaných technologiích si ale můžete přečíst v našem starším článku, pojďme se tedy konečně podívat na výkon, alespoň z teoretického hlediska.

Výkon a spotřeba

Nvidia zveřejnila pouze výkon v základních srovnávacích hodnotách, konkrétně maximální teoretický výkon v plovoucí desetinné čárce (Single/Double precision). Hodnoty jsou překvapivé v dobrém i ve špatném slova smyslu:

tabulka1.PNG

Srovnání s grafickou kartou ATI Radeon HD 5870 a 5970 berte sice s rezervou, ale vzhledem k tomu, že výpočetní karty ATI FirePro s novým čipem ještě nebyly uvedeny a budou určitě obsahovat stejná jádra, lze to považovat za částečně srovnatelné hodnoty. Soustředění na výpočty Nvidia skutečně potvrdila, ve výkonu v plovoucí desetinné čárce si v double precision oproti starší generaci polepšila téměř osminásobně. Nynější generace Radeonu HD 5870 však dosahuje výkonu podobného, v případě pomalejšího modelu Nvidia Tesla C2050 je dokonce mírně vyšší a o dvoujádrovém Radeonu HD 5970 ani nemluvě. V single precision se výkon takřka nezvýšil a nová generace čipů RV870 od ATI je v tomto případě téměř třikrát výkonnější.

Sama ATI kdysi uvedla, že výkon v double precision není pro hry důležitý, což ale samozřejmě neplatí pro výpočty, pro které bylo jádro Fermi navrženo. Zmíněné tvrzení umocňuje i fakt, že dle ATI Stream Computing SDK ve verzi 2b4 nepodporují double precision některé levnější modely karet Radeon, jak zjistili na serveru PCInpact:

amd_opencl_supported_devices.jpg

Spotřeba jedné karty je při zátěži přibližně stejná jako u předchozí generace, tedy kolem 190 W, spotřebu v klidu Nvidia zatím neuvedla. Koncová cena za základní model profesionální výpočetní karty Nvidia Tesla C2050 s 3 GB paměti činí 2 499 USD (přibližně 58 000 Kč s DPH) a u modelu Tesla C2070 s 6 GB paměti počítejte s cenou 3 999 USD (přibližně 92 000 Kč s DPH).

Tesla_S2070__Front_Elevated_no_cover_large.jpg

Systémy se čtyřmi kartami v podobě Tesla S2050 a S2070 jsou prodávány za cenu 12 995 USD (přibližně 300 000 Kč s DPH), respektive 18 995 USD (přibližně 437 000 Kč s DPH) za Tesla S2070. V prodeji se objeví až ve druhém čtvrtletí roku 2010 (grafické karty pro desktop by měly dorazit už v prvním čtvrtletí).

První informace o výkonu nových karet s Fermi čipem jsou tak možná pro někoho překvapující, takřka stejný výkon v single precision jako u předchozích modelů, a osminásobné zvýšení výkonu v double precision vlastně vyrovnalo výkon stávajícího jednojádrového modelu Radeon HD 5870, přičemž nadcházející dvoujádrový model Radeon HD 5970, který bude uveden již tento měsíc, nabídne ještě navíc téměř dvojnásobný výkon. I když z těchto hodnot nelze přímo vyvodit výkon ve hrách, hlavní zvýšení výkonu v double precision se her takřka vůbec netýká.

Nvidia však již dlouhou dobu tlačí především na výpočty a Fermi je prvním čipem, který byl vytvořen právě pro hromadné nasazování v profesionální oblasti, z které má Nvidia takřka 75 % všech zisků. Tomu odpovídá i velká podpora nových a důležitých technologií, které jsou pro tuto oblast jakýmkoli způsobem důležité.

image_AMAX_clusters.jpg  

Navíc se CEO Nvidie Jen Hsun Huang nechal slyšet, že Nvidia je „softwarová společnost“, což dokazuje i opravdu velké zázemí a dostupný software pro vývojáře (CUDA Zone) výpočetních aplikací, které je v mnohých oblastech na značně vyšší úrovní, než u konkurenční ATI (AMD). Důležitý tak není jen produkt, ale i služby a software.

gpu_computing_clusters.jpg

Jaký tedy můžeme čekat výkon ve hrách u dosud nepředstavených grafických karet GeForce GF100 se stejným čipem? ATI nasadila opravdu vysokou laťku a vzhledem k teoretickému výkonu a zcela novému jádru, které má před sebou jistě ještě několik dalších generací vývoje, nemusí být výkon tak závratný, jaký budily teoretické předpoklady.

Video

Jak vypadají clusterové systémy či propojení jednotlivých systému s Tesla kartami (na videu starší modely) do racku si můžete prohlédnout zde:

Pro vyšší kvalitu přepněte na HD

 

Diskuze (25) Další článek: Nová Opera 10.10 RC3: opravy webového serveru a vyšší výkon

Témata článku: , , , , , , , , , , , , , , , , , , , , , , ,