Ať už jde o desktopové počítače, notebooky, tablety nebo chytré mobilní telefony, ve všech těchto moderních elektronických zařízeních se o hlavní, respektive většinu výpočtů starají pouze dva „čipy“.
V poslední době již pomalu dochází k přelomu, kdy se procesor, který si poradí se vším a dlouho dobu velmi specializovaný grafický čip, jež se postupně učí dovednostem obecného procesoru, postupně spojují.
Legendární žebříček nejrychlejších superpočítačů TOP500 má nového vítěze. Jmenuje se Sequoia, obsahuje 1,6 milionů CPU jader a vyrobil ji IBM. Do domu se vám ale nevejde.
Důvodem je jejich nutná spolupráce, která je nyní a v budoucnu jistě jen tak nezmizí. Všechny informace nelze paralelizovat a tak stejně jako má náš mozek dvě hemisféry se specializací na jiné druhy výpočtů (práce s informacemi), budou i budoucí hybridní čipy vybaveny odlišnou architekturou pro zpracování různých druhů výpočtů.
Efektivita procesorového a grafického čipu
Výpočetní výkon se pokusíme porovnat pomocí základních FLOPS, tedy výpočtů s plovoucí desetinou čárkou, která je standardem i v oblasti superpočítačů.
Doba jednojádrových procesorů pomalu doznívá, standardem se pomalu stávají vícejádrové procesory a také programovatelné grafické čipy. Jaká nás čeká budoucnost?
Nebude nás ale zajímat samotný výkon, jako jeho porovnání v rámci spotřeby. Tedy kolik energie čip spotřebuje k tomu, aby dosáhl daného výkonu. V daném případě přesně jaký výkon je schopen poskytnout za jeden watt.

Procesor vs. grafický čip ve zjednodušeném podání počtu výpočetních jader (Zdroj: Nvidia)
Abychom viděli vývoj v této oblasti, který naznačuje i složitost čipů a jejich exponenciální vývoj dle Moorova zákona, porovnáme čipy i z minulosti. Pro větší pestrost nebudou chybět i specializované procesory. Například Sparc64 VIIIfx, který se nachází v bývalém nejvýkonnějším superpočítači na světě – K s celkovým výkonem 10 PFLOPS.
Pozici nejvýkonnějšího superpočítače na světě obsadil nový model „K“ od společnosti Fujitsu. Má větší výkon než pět dalších nejlepších superpočítačů světa dohromady.
V každém případě nesmíme zapomínat, že výpočetní výkon není nějaká forma dokonalého všeobjímajícího čísla. Konkrétní druhy výpočtů ovlivňují i další vlastnosti a parametry čipu a jeho spolupráce s celým systémem.

Podrobnější porovnání CPU a GPU (Zdroj: Nvidia)
Pokud jde o data, u některých modelů lze zjistit maximální výkon a maximální spotřebu například v přehledech na Wikipedii grafické karty od AMD i modely od Nvidie.
Nová éra grafických karet začala před deseti lety, kdy byly uvedeny první grafické karty, které známe i dodnes – ATI Radeon a Nvidia GeForce. +VIDEO
V grafu můžete vidět přehled vybraných grafických karet od Nvidie a AMD, stejně tak procesorů.

Výpočetní výkon čipů za jeden watt (GFLOPS)
Nejlepší výkon za jeden watt nyní poskytuje architektura grafických čipů od AMD, v tomto případě prezentována nejvýkonnější jednojádrovou grafickou kartou Radeonem HD 7970.
V případě karet od Nvidie jsou hodnoty výkony v double precision nízké, důvodem je omezení desktopových modelů. Nvidia si totiž „nechává“ tyto výpočty hlavně pro své výpočetní karty Tesla a jak je vidět u modelu M2090, je výkonem na watt velmi blízko AMD.

Přehled základních parametrů modelů grafických karet od AMD
I u nejnovější generace procesorů s architekturou Ivy Bridge lze vidět více než dvakrát menší výkon čipů za jeden watt. Tento trend navíc ukazuje, že se výkon grafických karet vzhledem ke spotřebě stále zvyšuje, jsou tak v těchto výpočtech stále efektivnější a postupují rychleji, než procesory.
Nástup pokročilejších architektur a výrobních technologií
Nejnovější grafické čipy jsou vyráběny 28nm technologií, v případě procesorů pak nejpokročilejší Intel používá 22nm technologii. V obou případech jde ale postupný pokrok stále takřka přesně dle Moorova zákona.
Intel představil pokročilou 3D Tri-Gate tranzistorovou technologie, která umožní vyrábět úspornější a výkonnější procesory. Pomůže mu to v boji proti ARMu?
Grafické čipy mají více tranzistorů než procesory, ale z pohledu paralelního výkonu poskytují lepší efektivitu. To si uvědomuje nejen Intel, ale i AMD, Nvidia a výrobci superpočítačů.

Maximální výpočetní výkon - starší srovnání procesoru a grafiky od Nvidie
Všichni začínají využívat dříve pouze grafické čipy, dnes již velmi univerzální výpočetní paralelní čipy pro různé systémy. Intel i AMD mají hybridní čipy pro mobilní i desktopový segment, kdy jsou oba odlišené čipy na jednom kusu křemíku.
Apple v případě úsporných a malých zařízení sází na platformu ARM a grafické čipy PowerVR. Jaký byl postupný vývoj a co můžeme čekat od další generace?
Jak ukazuje Intel například u převodu videa, dokáže grafická část akcelerovat výpočty výrazně rychleji, než by zvládly samotná procesorová jádra a tento směr bude ještě více pokračovat i v rámci dalších programů a úloh, které lze paralelizovat.

Ukázka zrychlení u některých aplikací (Zdroj: Nvidia CUDA)
Intel chystá vlastní výkonnou výpočetní kartu, která by měla v DP dosáhnout na slušných 1 TFLOPS. Oproti AMD a Nvidii sice nemůže ohromit pokročilou architekturou, která vychází i z dlouholeté zkušenosti, ale má k dispozici o jednu generaci lepší výrobní proces a kompatibilitu s x86, což by mu mělo pomoci vrátit se na náročný a velmi výdělečný trh superpočítačů.
Připravovaný superpočítačový akcelerátor MIC od Intelu se objeví již příští rok. K dispozici jsou další informace, podaří se Intelu porazit grafické karty v HPC segmentu?
Intel totiž sice stále dodává své serverové procesory pro superpočítače, o vysoký paralelní výkon se ale stará Nvidia, případně AMD a Intelu tak unikají obrovské zisky. Poměr procesorů a výpočetních grafických čipů je totiž v superpočítačích stále vyrovnanější.
Zajímavé informace z oblasti superpočítačů naleznete v článku Superpočítače počítají každý den, celý rok. Ale co počítají? nebo případně i historii v článku Výpočetní výkon: od mozku až k superpočítačům na serveru VTM.cz.