Intel Penryn: 45nm odveta za Barcelonu

AMD uvedlo v pondělí oficiálně novou generaci procesorů. Intel už má ale připravený drtivý protiútok.

Asi vám neuniklo, že AMD oficiálně uvedlo první nativní čtyřjádrový procesor Opteron třetí generace postavený na architektuře K10. Intel už dal jasně najevo, čím bude novým Barcelonám čelit. Informací o plánovaných 45nm procesorech postavených na architektuře Intel Core je, snad s výjimkou oficiálních testů, už několik měsíců dost a dost. Sesbírali jsme tedy většinu útržkovitých zpráv a drbů, které se kolem nových procesorů z rodiny Penryn v posledních měsících nadělaly, a nabízíme vám ucelený náhled na odvetu, kterou plánuje společnost Intel. Samozřejmě platí, že některé z informací nejsou oficiální a mohou se ještě s aktuálnějšími informacemi změnit.

Intel podle prezentovaných plánů hodlá při uvádění nových procesorů pokračovat ve dvouletých životních cyklech. Pravidelně bychom se tedy měli vždy zhruba rok po uvedení nové architektury dočkat procesorů postavených na stejné architektuře a vyráběných menším výrobním procesem. U Intelu tomu říkají „Tick-Tock“ cyklus.

tick-tock.png

V loňském roce se objevily 65nm procesory Core 2 Duo s architekturou Intel Core, nyní je tedy na řadě „tik“ a přechod ze 65nm výrobního procesu na proces 45nm. Další generace 45nm procesorů postavených na nové architektuře, tedy „taku“, s kódovým značením „Nehalem“ se tedy dočkáme ve druhé polovině příštího roku.

O 45nm procesorech z rodiny Penryn se hovoří především jako o vylepšeném die-shrinku, tedy zmenšené verzi stávajících procesorů Core 2 Duo a Core 2 Quad přepracované pro nový výrobní proces. Termín die-shrink ale není v tomto případě zcela na místě, menší procesory se totiž dočkají i řady dalších úprav. Orientaci v problematice ztěžuje fakt, že se pro procesory vyráběné lepším procesem vžilo označení Penryn či procesory z rodiny Penryn, ale skutečným Penrynem je jen jejich mobilní varianta. Některé technologie, o kterých se v souvislosti s procesory rodiny Penryn mluví, se však týkají právě jen mobilní varianty procesorů – příkladem jsou technologie Dynamic Acceleration Technology či hlubší úsporný režim C6 – ty by navíc měly fungovat jen na nejnovější mobilní platformě Centrino Pro, známé také jako Santa Rosa.

45ngmain-l.png eicm.png

O polovinu větší L2 cache

S lepším výrobním procesem následuje logicky i zmenšení plochy čipu. A když se vám podaří ušetřit na velikosti jádra, je mnohem jednodušší přidat něco navíc. V případě procesorů z rodiny Penryn nabobtná jádro díky navýšení velikosti sdílené vyrovnávací paměti L2 ze 4 na 6 MB, v případě čtyřjádrových z 8 na 12 MB. I přesto se plocha čipu zmenší ze stávajících 143 mm2 na 107 mm2, a počet tranzistorů naroste z přibližně 293 na 410 milionů u dvoujáder, u čtyřjáder, která stejně jako v případě Core 2 Quad vzniknou spojením dvou dvoujádrových čipů, to bude dvojnásobek, tedy 820 milionů tranzistorů. Se zvětšením cache se zvýší i její asociativita ze 16cestné na 24cestnou.

 hpc.png

A nějak takto vypadá přechod z 65 na 45 nm naživo pod „lupou“, větší cache je krásně vidět:

 conroedie.jpg PenrynDiePhoto.jpg

Nižší ztráty, nižší spotřeba, vyšší frekvence

Při výrobě by se mělo využívat nové technologie využívající High-K dielektrika a kovových hradel. Díky tomu by se měly snížit úniky proudu (leakage current) a zvýšit rychlost tranzistorů. Při stejné spotřebě má pak být možné navýšit frekvenci procesoru asi o 20 %, nebo naopak provozovat procesor na stejné frekvenci při nižší spotřebě. S novou výrobní technologií se má také snížit napájecí napětí o 0,1 V – to by mělo znamenat pokles spotřeby asi o 15%. Oproti současným 65nm procesorům by měla navíc výrazně klesnout spotřeba při taktech vyšších než 3,0 GHz.

hmgt.png hmtt.png

Nová instrukční sada SSE4

Dalším významným vylepšením by měla být nová instrukční sada SSE4 se 47 instrukcemi. Ve značení instrukčních sad byl po uvedení Core 2 Duo trochu zmatek. Řada článků totiž stávajícím Core 2 Duo přisoudila podporu SSE4. Ve skutečnosti je u prodávaných Core 2 Duo, Quad, Extreme a Xeonů vylepšená sada SSE3, označená jako SSSE3 a SSE4 dorazí skutečně až s Penryny. Čtrnáct nových instrukcí by mělo urychlit práci s videem, některé z nich mají výrazně pomáhat v HD rozlišení, zbývající instrukce by měly urychlovat operace s plovoucí desetinnou čárkou, grafické výpočty, vektorové počty, hry, multimédia, výpočty fyziky či různé kompresní algoritmy.

isse4i.png isse42.png 

Jako z teleshopingu: nárůst výkonu až o 105 %

Díky instrukcím SSE4 se už prý podařilo navýšit rychlost kódování videa v alfa verzi připravovaného enkodéru DivX s podporou těchto instrukcí asi o 70 %. Započítáme-li další změny, je při srovnání nedávno ještě nejvýkonnějšího čtyřjádra QX6800 (2,93 GHz, 2×4MB L2 cache, 1066MHz FSB) s plánovaným 45nm top modelem (3,33 GHz, 2×6MB L2 cache, FSB 1333 MHz) nárůst výkonu procesoru při této (podotýkáme, že úzce specifické) činnosti těžko uvěřitelných 105 %. Nezapomínejte ale, že nejde o procesory na stejné frekvenci.

divx.png

Ostatně, podobného čarování s frekvencí se využívá i u dalšího obrázku, na kterém Intel prezentuje nárůst výkonu při srovnání 45nm a 65nm procesorů v dalších aplikacích.

epfpi.png

Novinka, označovaná jako Fast Radix-16 Divider, by měla zaručit rychlejší dělění – v jediném taktu je díky ní možné dělit čtyři bity namísto dosavadních dvou. Znamená to dvojnásobnou rychlost dělení při výpočtech s celočíselným dělením i plovoucí desetinnou čárkou, a až čtyřikrát rychlejší odmocňování.

fr16d.png

Super Shuffle Engine se má postarat o to, aby bylo možné provádět 128bitové operace, které doposud bylo nutné rozdělit na dva cykly, najednou. Výrazně by se měla urychlit i virtualizace.

sse.png vpi.png

U mobilní verze Penryn se objeví nový úsporný režim C6, nazývaný také „Deep Power Down Technology“. Před přechodem do tohoto režimu se uloží stav celého jádra a odpojí se napájení jader a L2 cache. V režimu C6 čipová sada nadále obsluhuje operační paměť, ale nepotřebuje procesor. Jakmile je jádro zapotřebí, čipset obnoví napájení jádra, nastartují se hodiny, resetuje se procesor a obnoví stav procesoru a provádění instrukcí.

dpdt.png

S hlubšími úspornými režimy se ale prodlužuje doba, za kterou jádro znova naběhne. Aby se zabránilo příliš častým a zbytečným přechodům do hlubších úsporných režimů, využívá Penryn inteligentní heuristické analýzy, která podle vytížení procesoru pozná, zda se přepnutí do hlubšího úsporného režimu vyplatí. V případě, že jsou intervaly kratší, než je to vhodné, přepíná se procesor jen do režimu C4.

K navýšení výkonu u aplikací vytěžujících jen jediné jádro má dopomoci další nová technologie Enhanced Intel Dynamic Acceleration. Způsob, jakým se toho dosahuje, je jednoduchý – po uspání jednoho jádra se druhé jádro přetaktuje. Výkon jádra se může navýšit v případě, že druhé jádro v úsporném režimu C3 či hlubším. Díky odpojení jednoho jádra pak nedojde po přetaktování k přeročení maximální spotřeby TDP, přičemž se zvýší výkon u aplikací vytěžujících jedno jádro.

edat-1.png edat-2.png

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,