Intel Penryn: 45nm odveta za Barcelonu

Diskuze čtenářů k článku

snake  |  15. 09. 2007 15:02

Musím autora pochválit za opravdu pěkný článek. Žádný bezesmyslné bulvarizování známé od jednoho nejmenovaného kolegy, citace zdrojů včetně linků a čtivý styl s dostatečným množstvím informací. Nutně pak vyčuhuje z běžné šedi průměrnosti ostatních článků na živě. Děkuji a jen tak dál!

Souhlasím  |  Nesouhlasím  |  Odpovědět
AZOR...  |  14. 09. 2007 01:08

Článek vyníkající,... až na japonce a jejich divnou/dobrou tabulku !

Ta tabulka je dobrá, takovhle si představuji testy .. a slinal jsem na ni než jsem uviděl tohle :

Cpu1: 50,33s Cpu2:38,1s zrychleni : 6,30% ?? Nehodlam to pocitat, ale uz od polehledu to je jine zrychleni nez 6,3% - by mi zajimalo kolik takovejchle bugu tam je....

Souhlasím  |  Nesouhlasím  |  Odpovědět
AZOR...  |  14. 09. 2007 01:10

tak jsem si dal tu praci je to neco kolem 24-25 procent.

Souhlasím  |  Nesouhlasím  |  Odpovědět
14. 09. 2007 02:19

bacha ... to je vysledok "Microsoft Office 2007 - Word merge" ... tam sa tomu necudujem :) mozno to pocital ten m$ word

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
13. 09. 2007 19:29

Když jsem si přečetl o nové architektuře AMD, málem mi zaskočilo. S L3 souhlasím a beru to jako dobrý krok. No, ale když jsem si přečetl o Intelu, tak mi huba upadla až pod stůl. Sice jsem zastánce AMD, ale tohle je fakt síla. Pokud to bude i fungovat a bude to za přijatelnou cenu, Intel vyhrál. Akorát mě štvou některé věci u Intelu, jako je absence int. p. řadiče, divnému marketingu a navyšování výkonu (většinou) pouze v optimalizovaných aplikací...

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 21:01

„když jsem si přečetl o Intelu, tak mi huba upadla až pod stůl“ a co tak převratného jste objevil?

Souhlasím  |  Nesouhlasím  |  Odpovědět
Bob  |  13. 09. 2007 23:42

Objevil vysvetleni principu tranzistoru. Stejne jsem tedka cetl ze procesor Zilog Z80 strci vsechny stavajici intely v mnoha ohledech do kapsy. Americky vyrobce techto cipu nasadil tak drsnou cenovou politiku ze plnohodnotny procesor sezenete za zlomek ceny tech nejvykonejsich CORE 2 DUO. O specialnich instrukcnich sadach SSE zde nemuze byt ve srovnani s timto procesorem rec. Optimalizace aplikaci pro tento procesor z nej dokaze dostat maximum,diky vyuziti jis dnes velmi vykoneho ASM programovaciho jazyka. Potencialu tohoto procesoru muze byt diky nemu vyuzito aplikacemi na plno. Navic tyto procesory dosahuji ve srovnani s core architekturou zlomkoveho ztratoveho vykonu TDP,tudiz nebude nutny ani aktivni chlkadic,s mensim pasivem s heatpipe technologii ho nebude nutne jiz vice chladit. Vyrobni technologie mu zajistuje dokonalou miniaturizaci , a plocha cipu jiz dnes muze byt i 20x mensi nez u core architektury.

Souhlasím  |  Nesouhlasím  |  Odpovědět
MarcelL  |  13. 09. 2007 12:33

Ten testovany Wolfdate je presne procesor jaky se mi libi. Konecne nejaka rozumna spotreba a rozumny vykon. Neco takoveho bych chtel do domaciho pocitace. Mohlo by to bezet skoro porad a nezruinoval by me ucet za elektriku

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
13. 09. 2007 14:51

Taky se mi líbí.

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 15:15

Sežeňte si nějakej starší notebook, kterej má třeba špatný LCD. Starý dobrý Pentium M mělo odběry kolem 20W.

Souhlasím  |  Nesouhlasím  |  Odpovědět
Paegas  |  13. 09. 2007 19:49

Já bych zas tolik neulpíval, dnešní Core 2 Dua mají ještě nižší příkon pokud to vydělíš dvěma (dvě jádra) a výkon je naprosto někde jinde. A pokud řekneš, že je ti jedno, kolik to má jader, ale záleží ti jen na příkonu, pak tě potěším nově uvedenými procesory, budou Core 2 Solo, které by měli mít kolem těch 20w ;)

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
13. 09. 2007 22:53

sak uz jsou core 2 celerony

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 16:54

Ucet za elektriku je v pohode, ale kdo ma kupovat/udrzovat UPSky

Souhlasím  |  Nesouhlasím  |  Odpovědět
phanatic  |  13. 09. 2007 12:30

Na to, jak bude drtivý si radši počkáme, až to za těch několik měsíců uvedou. On současný soket a lpění na FSB může být pro Intel docela limitující. AMD je v tomhle směru o krok napřed, což je vidět zejména na víceprocesorových serverech. Nakonec ale drtivost bude stejně záležet na tom, jak se nastaví ceny.

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 12:55

Socket a FSB?

O krok na před? A kam? Jestli jsem se koukal dobře, tak AMD přešlo z AM2 na něco, co se strašlivě podobá LGA775, akorát to má jeden vymezovací zářez navíc. TAkže bych řekl že spíš dokročili Intel.

A pod tím "lpění na FSB" si předtsavujete co?

Souhlasím  |  Nesouhlasím  |  Odpovědět
Mountin  |  13. 09. 2007 13:48

To že v určitém čase přestane být FSB dostatečně propustné na to aby zvládalo to co procesory vypočítají...

Ale v dohledném čase se nás to netýká

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 14:36

Já vím co je to FSB. Jenom nějak nerozumím tomu, že AMD na FSB nelpí.

A jestli si někdo myslí, že integrovaný paměťový řadič je nějaká výhra, tak to se šeredně plete. In Intel moc dobře ví, proč to nedělá. Ale na to aby to člověk pochopil si musí jít na nějakou tu dobu sednout na servis a vyzkoušet si peklo rozhodování: "Je to v desce, pamětech a nebo v CPU?"

Souhlasím  |  Nesouhlasím  |  Odpovědět
peto  |  13. 09. 2007 15:39

Integrovany radic je pre NUMA klucovy a teda pre skalovanie

Barcelona je serve chip pre nominlane 8 CPU systemy

Most VMMs can pin processes to a CPU an then to local memory, so with this box you get about 100 per cent scaling from two to four CPUs, and about 350 per cent from two to eight.

(url)http://www.theinquirer.net/?article=4...

ppvedane inak 8 Barcelona ma vykon 4,5 nasobku vykonu dvoch Barcelon

4 barcelony maju vykon 2x taky ako dve Barcelony

a preto sa pouizva v superpocitacoch

Supercomputer users were among Opteron's earliest adopters, and that is one piece of Opteron history that may be repeated with release of the quad-core Barcelona. What may well become the world's largest supercomputer is now being built at the Texas Advanced Computing Center with Barcelona chips.

More than 15,000 Barcelona processors will be used in this system, capable of computer power in excess of 500 teraflops. A teraflop is 1 trillion floating-point operations per second.

Tommy Minyard, assistant director of the Austin-based computing center, said that when the US$30 million system is finished early next year, it will have 63,000 cores in total. This supercomputer, called "Ranger," is using Sun Microsystems Inc.'s Sun Blade 6000 servers

http://www.pcworld.com/article/id,137025-c,amd/article.html

Cray XT4(TM) Systems With New Quad-Core AMD Opteron(TM) Processor to Provide Petaflops Capability

Global supercomputer leader Cray Inc. (NASDAQ: CRAY) today reported that it expects to begin shipping its industry-leading Cray XT4(TM) systems with new, ultra-powerful Quad-Core AMD Opteron(TM) processors by year-end.

The Cray XT4 system is a massively parallel processor (MPP) system that provides unrivaled sustained performance by balancing performance between powerful processors, memory, interconnect, and IO. Both hardware and software are designed to scale to more than 120,000 processor cores and over one petaflops of peak performance. Both the Cray XT3 and Cray XT4 systems can be upgraded to Cray XT4 systems with quad-core support.

"We upgraded from single-core to dual-core in the field very smoothly, and we anticipate being able to do the same with the Cray XT4 system with quad-core support," said Buddy Bland, Project Director of the Leadership Computing Facility at Oak Ridge National Laboratory. "We are already running machines with 23,000 processor cores, and we have high expectations about our impending quad-core delivery."

http://investors.cray.com/phoenix.zhtml?c=98390&p=irol-newsArticle&ID=1049549&highlight=

zoznam najvykonnejsich superpocitacov sveta v mesiaci jun 2007

Rank Site Computer Processors Year Rmax Rpeak

1 DOE/NNSA/LLNL

United States BlueGene/L - eServer Blue Gene Solution

IBM 131072 2005 280600 367000

2 Oak Ridge National Laboratory

United States Jaguar - Cray XT4/XT3

Cray Inc. 23016 2006 101700 119350

3 NNSA/Sandia National Laboratories

United States Red Storm - Sandia/ Cray Red Storm, Opteron 2.4 GHz dual core

Cray Inc. 26544 2006 101400 127411

4 IBM Thomas J. Watson Research Center

United States BGW - eServer Blue Gene Solution

IBM 40960 2005 91290 114688

http://www.top500.org/list/2007/06/100

Rmax and Rpeak values are in GFlops

No intel 1. a 4. miesto IBM Power/PowerPC 2. a 3. meisto AMD Opteron

Lenze v top vedecky pocitacovh sa Windows neinstaluje

Operating System Count Share %

Linux 347 69.40 %

SuSE Linux Enterprise Server 8 1 0.20 %

HP Unix (HP-UX) 15 3.00 %

MacOS X 3 0.60 % 32989

Solaris 4 0.80 %

http://www.top500.org/stats/list/29/os

A simple mathematical model for the approximate theoretical performance of a multi-processor system relative to the single processor base is as follows:

Pn / P1 = S ** (log2(n))

Pn is the performance with n processors, P1 is the performance with one processor, S is the scale factor and n in the number of processors. In the ideal situation, S = 2. In practice S is less than 2 and hopefully (but not always) greater than 1. A more transparent interpretation of the above formula is: for every doubling of the number of processors, performance increases by a factor of S.

aby sme mali vzorec na S z 2 CPU

(Pn1/P1)/(Pn2/P1)=Pn1/Pn2=(S**log2(n1))/(S**log2(n2))

log(n1)/log(n2)

za predpokladu, ze sa kvalita skalovania nemeni

lenze pre skalovanie z 2 na 8 pre Barcelonu

je to scestne

4,5 !=3

t.j pri zvyseni poctu CPU z 2 na 8 by mal narast vykon 3x, ale u Barcelony narastol 4,5 teda S pre 8 CPU je vacsie ako pre 2 CPU a to 1,5

lenze skalovanie z 2 na 4 CPU je podla nomry

2!=2

ak berzie sklaovanie z 4 na 8

2,25 namiesto teoretickeho 1,5!!!!!

toto je zahada

kedze AMD sa skaluje lepsier nez je idealny stav!!!

http://osr507doc.sco.com/en/PERFORM/multiprocessor_systems.html

re 1 na 8

9=S*log2(8)/log2(1)=S*3 cize S u Barcelony je 3

In the ideal situation, S = 2

to znamena, ze s pohladu skolavanie s poctom CPU je Bracelona lepsia nez idealna

The scale factor for Itanium 2 is in the range of 1.60, which is considered very good. IBM has not released sufficient information to derive the scaling factor for the Power 4 processor used in the pSeries 690 systems, but it is probably is the range of 1.7, which is exceptionally high

The scale factor from 4 to 8 CPUs is 1.54. Beyond 8 CPUs, the scale factor falls to 1.41

takze o com sa bavime 2,25 namiesto 1,54 u Intel Xeon scaling faktor zo 4 na 8

Souhlasím  |  Nesouhlasím  |  Odpovědět
snake  |  15. 09. 2007 14:32

Ten nárůst výkonu více než dvojnásobný u dvakrát většího počtu procesorů či jader je skutečně něco možného. Ale jen pro určité konkrétní hodnoty procesorů a jen pro určité druhy výpočtů. Říká se tomu tuším superlineární nárůst, a ve zkratce jde o to, že spolupracující jádra si dokáží poskytovat výsledky rychleji než kdyby jedno či několik málo jader mělo např. nejdříve spočítat výsledky procesu 1, zastavit se, spočítat výsledky druhého, ty použít pro první a tak dále. To samé ale platí i pro ten druhý proces, který v každém třeba pátém kroku potřebuje podvýsledky z prvního procesu. Režie je v context switchi, a je-li tento nutné vykonávat kvůli nedostatečnému počtu procesoru příliš často, tráví procesorově "poddimenzovaný" systém většinu času nikoli počítáním, ale přepínáním mezi úlohami - samotné přepnutí totiž trvá odhaduji nejméně stovky, daleko spíše ale tisíce taktů procesoru, jinými slovy gigahertzový CPU jich zvládne dejme tomu milion, a tak musí-li procesy komunikovat mezi sebou velmi často, je dobré mít procesorů či jader nejméně tolik, kolik bude těch zároveň běžících a spolu intenzivně komunikujících procesů...

Tohle škálování ale samozřejmě bude fungovat jen do určitého počtu procesorů, a dál bude výkon růst pouze lineárně či podlineárně. A uvedené samozřejmě neplatí pro úlohy, jejíž procesy sice musí běžet paralelně, ale nepotřebují spolu mezivýsledky příliš sdílet. U takových úloh bude nárůst s počtem procesorů pak vždy přinejlepším lineární, daleko spíše ale sublineární (úzkými hrdly bude vždy přístup ke sdíleným prostředkům, typicky samozřejmě RAM apod.).

Souhlasím  |  Nesouhlasím  |  Odpovědět
mr.x  |  15. 09. 2007 18:08

95% FSB je pouzivano pro prenosy do pameti a zpet.. integrovany pametovy radic je reseni jak FSB / HT hodne odlehcit - u AMD muzete HT snizit i na 200Mhz a skoro nepoznate rozdil

Souhlasím  |  Nesouhlasím  |  Odpovědět
PJ  |  13. 09. 2007 14:52

Ano to je pravda a vi to i Intel, proto planuje u pristi generace serverovych CPU zalozenych na architekture Nehalem (tj. za rok ?) a Tukwila (budouci Itanium) pouzivat misto FSB tzv. QuickPath coz je jakasi obdoba HyperTransportu. Desktopovych CPU se to zrejme zatim tykat nebude.

Souhlasím  |  Nesouhlasím  |  Odpovědět
yogi007  |  13. 09. 2007 13:56

... pokial si nepostrehol, AMD ma nativny 4 jadrovy 64-bitovy procesor, Intel stale lepi dokopy dva 2 jadrove procesory s podporou EMT64, u Intel je L2 cache spolocna pre jedno dvoj-jadro, pri AMD ma kazde jadro zvlast L2 cache, takze Intel ma co dobiehat.

A co si myslis, preco ma AMD implementovane aj najnovsie 128 bitove SSE5 instrukcie (ktore vsetkymi pravami vlastni Intel uz od procesorov P5MMX) a Intel prezentuje v Penryn len SSE3 a SSE4? Zeby Intel stale splacal dlzobu za know-how na 64-bitovu podporu, ktoru sami nezvladli a museli ju "kupit" od AMD vymenou za sucasne a buduce moznosti plnej podpory SSE na AMD procesoroch?

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
13. 09. 2007 14:14

"Nativní quadcore" je jen marketing na neznalce a lamy.. Rovněž to, že není společná L2 je špatně, protože procesory komunikují přes mnohem pomalejší L3. FSB také není žádná brzda, frekvence HT je 1GHz, quadpumped FSB jede na 1333MHz

Absolutně nezáleží na tom, zda se quadcore vyrábí jako jeden chip, či jako dva spojené dualcore chipy, nelze říci, že by první způsob byl výkonnější (jak je vidět z testů, není), zato lze 100% říci, že druhý způsob je levnější.

I proto Intel může nabízet fantastický Q6600 za 6t Kč + DPH.

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 15:38

Trochu se vám to plete takt HT, FSB, L2, L3, RAM komunikace mezi všemi jádry přímo či přes základní desku …

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 14:46

No o těch nativních 64bit jádrech by se dalo polemizovat. Ale budiž. EMT64 zatím stačí.

Nevím co je tak fantastického na tom, že u AMD má každé jádlo svoji vlastní L2 cache, zatím co u Intelu je L2 chache společná pro dvě jádra. Když už nic tak to jádro co zrovna nepracuje půjčí svoji část společné cache tomu druhému jádru, což u AMD nejde. A co bude rychlejší L2 nebo L3?

Add SSEx. To je zajímavý názor.

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 16:05

"Když už nic tak to jádro co zrovna nepracuje půjčí svoji část společné cache tomu druhému jádru, což u AMD nejde"

ale jde, od toho je L3

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 16:35

Můj předchozí příspěvek: "A co bude rychlejší L2 nebo L3?"

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 19:11

nechci to nějak hrotit, ale vždy je to hodně relativní zda je lepší "sdílená" L2 s teoreticky poloviční propustností na jedno jádro, nebo fallback na L3, zato s fullspeed L2. Řekl bych, že to je pak už hodně záležitost inteligence prefetche dat a rozhodně bych se při neznalosti ať té či oné technologie, resp. aplikačních testů, nebyl ochoten přiklonit se na tu či onu stranu.

Tak jako tak asi bude hodně záležet na typu aplikací, které se budou zpracovávat. Pokud např. bude hlavní zátěží na thready bez problémů rozdělitelný stream dat, na který se aplikuje předem daná sekvence instrukcí, pak na tom asi model AMD bude lépe..

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 19:27

„nebyl ochoten přiklonit se na tu či onu stranu.“

Tak nějak to bude, měly by být stejné, ale kdyby náhodou nebyly, vždy budou rychlejší jak předávání informací přes FSB na základní desku a zpět do sousední poloviny CPU.

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 16:42

Každopádně uvidíme příští rok. AMD usnulo s K8 na vavřínech a Intel teď už ví, že s Net Burst šlápnul do ho...a. Takže se dal jinou cestou a AMD se nestihlo chytit. Teď se ho snaží dohnat až předehnat, ale Intel to vyložene dávkuje po kapkách a na každou jejich novinku nadhodí něco svého, protože se už podruhé nenechá vyšachovat.

Buďme rádi za ty dary a bylo by dobré, kdyby se stejným směrem vydaly i gr. karty.

Souhlasím  |  Nesouhlasím  |  Odpovědět
Bob  |  13. 09. 2007 23:06

Jo a kdyz uz cache neni tak nedostatek vlastni cache brzdi druhe jadro :D A navic se musi davat pozor aby jedno jadro neprepisovalo v jeden moment stejne data jake potrebuje jadro druhe , tzv predpovidani kolizi ,AMD dobre vedelo proc ma kazde jadro svoji L2 cache, L3 je pouze rychlejsi cestou ke spolecnym datum. Podle me je sice hezke ze kdyz jedno jadro cachce nepouziva da ji jadru druhemu ale za cenu ze kdyj ji potrewbuje jadro druhe neni volna .D Tudis ztrati vykon kdyz sou obe jadra vytizena...

Souhlasím  |  Nesouhlasím  |  Odpovědět
14. 09. 2007 02:14

tie jadra nenavrhovali ludia, co sa tomu nerozumeju - logicky to funguje tak, ze L2 je adresne rozdelena na 2 casti a kazde jazdro si adresuje do svojej casti ... jedine v pripade, ze potrebuje viac, zisti u druheho jadra kolko si moze pozicat, odkial a na ako dlho ... takze nepredpokladam, ze by tam dochadzalo ku koliziam a nedajboze k prepisovaniu, priapdne k poklesu vykonu...

Souhlasím  |  Nesouhlasím  |  Odpovědět
MV  |  14. 09. 2007 08:15

A co v okamžiku, kdy to jádro co půjčilo část paměti jí potřebuje zpět? Přesun dat nebo omezení výkonu dokud pamět druhé jádro neuvolní? To asi taky sezere výkon

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
13. 09. 2007 14:50

U AMD by hlavně měli implementovat kompletní SSE4 sadu a ne se vrhat do SSE5.

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 23:16

"aj najnovsie 128 bitove SSE5 instrukcie (ktore vsetkymi pravami vlastni Intel uz od procesorov P5MMX)"

http://www.zive.cz/default.aspx?section=44&server=1&article=137873

Souhlasím  |  Nesouhlasím  |  Odpovědět
wU  |  12. 12. 2007 14:12

coze? to ta propaganda fakt tak dobre funguje?

Dyt je to UPLNE zbytecny!

Souhlasím  |  Nesouhlasím  |  Odpovědět
13. 09. 2007 11:49

... ale čekal jsem to. U Intelu nejsou blbci a docela by mě zajímalo, co za zázraky mají kluci na "rýsovacím prkně".

Pak je ještě druhá možnost, že C2D byl mezikrok na generování většího zisku. "Nedáme jim to hned všechno, oni si rádi koupí každé malé vylepšení."

Souhlasím  |  Nesouhlasím  |  Odpovědět
Zasílat názory e-mailem: Zasílat názory Můj názor