Malá exkurze do nitra architektury K10

Nových Opteronů, prvních procesorů AMD s architekturou K10, známých jako Barcelona, se dočkáme už 10. září.

Nová architektura AMD K10 je pokračováním předchozí 64bitové architektury s integrovaným paměťovým řadičem AMD K8, kterou známe z procesorů Athlon 64 a Sempron. Dlouho očekávané nové jádro pro serverové procesory Opteron je známé pod kódovým označením Barcelona, pro stolní počítače přijde jádro Phenom. Následovat bude ještě řada dalších jader postavených na architektuře K10.

Podíváme se na některé zajímavé změny, které s sebou nová architektura přináší.

Klepněte pro větší obrázek

Klepněte pro větší obrázek

Šířka instrukční L1 cache se od architektury K8 zdvojnásobila na 256bitů (32B). Technologie Wide floating-point accelerator ve zkratce znamená oproti architektuře K8 dvojnásobnou, tedy 128bitovou šířku datových cest pro výpočty s plovoucí desetinnou čárkou, takže delší 128bitové instrukce již není nutné dělit na dvě 64bitové operace, jako tomu bylo v případě K8. Přibyly i 128 bitové SEE instrukce a instrukční soubor. Vylepšeno je i předpovídání větvení (branch prediction), díky čemu by měly programy napsané ve vysokoúrovňovém objektově orientovaném kódu běžet mnohem rychleji. Pokud vás zajímá, co všechno se změnilo z programátorského hlediska, doporučujeme prostudovat anglický článek zveřejněný na serveru X-bit Laboratories, kde tuto problematiku probírají podrobněji.

Každé jádro má mít vlastní L2 cache o velikosti 512 kB (u pozdějších modelů i 1 024 kB). Oproti sdílené L2 cache to má své výhody i nevýhody. Výhodou je, že se vytížená jádra procesorů nemusí o cache přetahovat a nedochází ke konfiktům, jako v případě Core 2 Duo, nevýhodou ale je, že v případě, že některé z jader L2 cache nevyužívá, nemůže ji přenechat k dispozici těm ostatním.

Oproti předcházejícím generacím procesorů navíc přibyla sdílená L3 cache o velikosti 2 MB, která může být dále zvětšena. Například pro 45nm výrobní proces už se uvažuje o velikosti až 6 MB. Vyrovnávací paměť třetí úrovně slouží ke sdílení dat mezi jednotlivými jádry a k výměně dat mezi L2 cache jednotlivých jader. Jakmile si jedno z jader vyžádá data od jiného, příslušné jádro zkopíruje modifikovaná data do L3 cache, ze které je možné je přečíst rychleji, než při přenosu přes paměťovou sběrnici. Latence L3 cache bude určitě větší než u L2 cache, a má se měnit v závislosti na zatížení procesoru. V případě, že zátěž nebude příliš vysoká, by měla být nižší, a při vytížení procesoru poroste. Zatím není jasné, jak se to má s frekvencí L3 cache v případě, neboť jednotlivá jádra mohou běžet na různých frekvencích, jak se dočtete dále.

Rozdíly mezi používanými zapojeními L1, L2 a L3 cache u dvou a čtyřjádrových procesorů AMD a Intel jsou zřejmé z následujícíh schémat.

Starší dvoujádrová Pentia postavená na architektuře Netburst vznikla umístěním dvou jednojádrových procesorů do jediné patice. Obě jádra spolu komunikovala přes pomalou sběrnici. Současné dvoujádrové procesory AMD Athlon 64 X2 a Opterony fungují podobně. 

S architekturou Intel Core přišla sdílená L2 cache.

Klepněte pro větší obrázek

Podobně jako v případě dvoujádrových Pentií se u čtyřjádrových Core 2 Quad a Core 2 Extreme QX využívá spojení dvou tentokrát už dvoujádrových procesorů v jedné patici. Jádra spolu opět musí komunikovat přes pomalou systémovou sběrnici. 

Klepněte pro větší obrázek

Dvoujádrové procesory postavené na architektuře K10 mají sdílenou vyrovnávací paměť podobně, jako dvoujádrové Core 2 Duo, navíc má ale každé jádro k dispozici vlastní 512kB L2 cache.

Klepněte pro větší obrázek

U čtyřjádrových procesorů, které AMD označuje jako nativní, neboť nejsou „slepené“ ze dvou nezávislých procesorů, jsou pak spolu všechna jádra na jediném kousku křemíku a krom 512kB L2 cache pro každé jádro sdílejí taktéž společnou L3 cache. Vzájemná komunikace mezi jádry nemusí probíhat přes systémovou sběrnici.

Klepněte pro větší obrázek

Témata článku: Barcelona, Blok, Dynamic, Floating, Independent, Budapest, Montreal, Shanghai, Split

42 komentářů

Nejnovější komentáře

  • Federmann 7. 9. 2007 12:32:35
    AMD mělo 5% trhu? a tomu úměrný vliv!
  • Mandarinka 7. 9. 2007 11:46:02
    Chyba lávky. MMX = pouze celočíselné SIMD. 3Dnow = první SIMD i pro...
  • Federmann 7. 9. 2007 11:12:17
    Doplnění: Ten čas od počátku nebyl příliš jasný, zda budou Američané či...
Určitě si přečtěte

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

** Gary Kildall pochopil, že levné výpočetní čipy mohou posloužit jako univerzální počítače pro všechny ** Připravil pro ně proto první operační systém ** Později mu systém vyfoukl Microsoft a nazval ho MS DOS

23.  4.  2017 | Pavel Tronner | 57

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

** Už je to tady, lidé přestávají chápat počítače ** Systémy neuronových sítí začínají pracovat tak, že ani jejich tvůrci přesně neví, co se uvnitř děje ** Do budoucna to může být závažný problém

24.  4.  2017 | Jakub Čížek | 112

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

** Slavný osmibitový počítač Sinclair ZX Spectrum byl uveden právě před 35 lety ** Připomeňte si tento průkopnický počítač v tematických článcích ** Podívejte se, jak funguje dnes

23.  4.  2017 | Pavel Tronner | 13

Acer chrlí novinky: levný a tenký Predator, nové Switche a další notebooky

Acer chrlí novinky: levný a tenký Predator, nové Switche a další notebooky

** Acer na konferenci v New Yorku představil velkou spoustu novinek z oblasti počítačů, notebooků i monitorů ** Notebookové novinky se dotkly řad Predator, Swift, Switch i Aspire ** Herní notebooky dostaly nový typ chlazení

27.  4.  2017 | Karel Javůrek | 7

Správný počítač má alespoň dva monitory. Anebo je to jinak?

Správný počítač má alespoň dva monitory. Anebo je to jinak?

** David si nedokáže představit práci bez dvou a více monitorů ** Kubovi naopak stačí jeden a ve více displejích se ztrácí ** Jaký přístup je lepší?

23.  4.  2017 | Jakub Čížek | 59


Aktuální číslo časopisu Computer

Supertéma: moderní cestování

Kdy opravdu přijdou nové baterie?

Velké testy: 6 herních notebooků a 8 volantů

Recenze: AMD Ryzen řady 5