Apple v případě úsporných a malých zařízení sází na platformu ARM a grafické čipy PowerVR. Jaký byl postupný vývoj a co můžeme čekat od další generace?
V poslední době si Apple prošel mnoha velkými změnami, mezi kterými hrály velkou roli i použité platformy. V oblasti klasických počítačů, ať už se jedná o desktopy nebo notebooky, bylo největší proměnou přechod na platformu Intel, která jistě znamenala krok správným směrem. Intel patří ve výkonném segmentu mezi lídry a díky nejmodernějším továrnám na výrobu čipů si jistě tuto vlastnost ještě nějakou dobu udrží.
Samostatnou kapitolou jsou ale nová a úsporná zařízení, které jsou také velmi malá. U těchto zařízení již nehraje roli maximální výkon, ale především efektivita při minimálních rozměrech a spotřebě energie.
Za vším stojí Imagination Technologies
Společnost Imagination Technologies byla pod původním názvem VideoLogic založena v roce 1985 a již od začátku byla zaměřena na vývoj grafických systémů. Kolem roku 2000 se začala soustředit na licenční model prodeje pro různé výrobce, podobně jako to dělá ARM.
V její nedávné minulosti (několik pouhých let zpátky) lze nalézt opravdu zajímavé byznysové věci, od velkého kupování akcií společnostmi jako Intel nebo Apple, také mimo jiné nákup společnosti Caustic Graphics zabývající se ray tracingem.
To co odlišuje Imagination Technologies a její architekturu grafických čipů PowerVR od současných výrobců jako AMD nebo Nvidia, je výrazné použití techniky Tiled rendering, která umožňuje obraz rozdělit na menší části a efektivně si poradit například s vynecháním vykreslování objektů, které nejsou v danou chvíli vidět. Na této technologii staví i Xbox 360 nebo starší Dreamcast.
Čipy PowerVR se staly hlavními grafickými čipy v úsporných zařízeních Apple, vše je samozřejmě kombinováno do jednoho křemíkové SoC čipu v kombinaci s dalšími částmi jako je procesor či operační paměť.
Přehled čipů v mobilních zařízeních Applu
V moderních zařízeních Apple používá čipy PowerVR řady 5, které se pyšní největším výkonem a efektivitou v této kategorii úsporných mobilních čipů. I když má Nvidia značné zkušenosti a dobré produkty v desktopové oblasti (včetně notebooků), v oblasti těchto nejúspornějších čipů, kde hraje řádově více nutnost efektivity spotřeby a výkonu a tedy co možná největší využití „každého tranzistoru“, je však nováčkem, který se zatím rozkoukává.
Při uvedení nového iPadu se Apple vytasil s jednoduchým srovnáním výkonu grafického čipu, který má tentokrát již čtyři jádra. Jedná se o model PowerVR SGX 543MP4 a oproti předchozímu modelu PowerVR SGX 543MP2 je jednoduše dvakrát výkonnější.
Apple: grafický čip v novém iPadu má čtyřikrát vyšší výkon, než poskytuje Tegra 3
Nvidia se sice snaží se svou značkou Tegra i v rámci nejnovější série 3 vzbudit dojem obrovského grafického výkonu, realita je ale taková, že Imagination Technologies jsou v této oblasti značně napřed.
Pro jednoduché srovnání si ukážeme starší měření výkonu ze serveru Anandtech, kde proti sobě stojí první iPad (PowerVR SGX 535) a iPad 2 (PowerVR SGX 543MP2), kde se Apple chlubil až 9× výkonem. Samozřejmě, takový rozdíl je pouze při určitých výpočtech, ale ukazuje to, jak moc velké výkonové skoky (900 %) dokáže Imagination Technologies vyvinout.
Srovnání výkonu (Zdroj: Anandtech)
Obrovský rozdíl je vidět například při použití vyhlazování, kde je rozdíl ve výkonu sedminásobný, další srovnání mezi iPhone 4S (SGX 543MP2) a iPhone 4 (SGX 535) ukazuje osminásobný rozdíl výkonu.
Jak je vidět na dalších grafech, Nvidia Tegra 3 nabízí „pouze“ přibližně dvojnásobný výkon oproti Tegra 2 a PowerVR SGX 543MP2 je skutečně dvojnásobně výkonnější, než Tegra 3. Zatímco na desktopu by byl mezigenerační dvojnásobný výkon obrovský rozdíl, v této úsporné oblasti je vše na začátku a skoky jsou možné mnohem větší.
Apple by se rozhodně nevytahoval s něčím, co není předem jasné. Čtyřnásobek výkonu PowerVR SGX 543MP4 oproti Tegra 3 je sice asi maximální možný rozdíl, nicméně takový určitě je.
Imagination Technologies ale chystá mnohem revolučnější architekturu, která i tu současnou, jež patří mezi to nejlepší, nechá v zapomnění minulosti a s ní na nějakou dobu i všechny ostatní hráče v oblasti úsporných mobilních čipů.
PowerVR série 6 „Rogue“: až 20× vyšší výkon a 5× lepší efektivita oproti současnosti
Zatímco současné čipy PowerVR operují v oblasti desítek GFLOPS výpočetního výkonu, nová generace přinese posun do oblastí stovek GFLOPS. Samotný procesor ARM se i ve čtyřjádrové verzi a frekvencí nad 1 GHz přitom stále pohybuje v oblasti nižších stovek MFLOPS. O řád nižší výpočetní výkon je v současnosti i u desktopových čipů. Procesor a grafický čip jsou však dva odlišné světy pro zpracování informací, takže jejich koexistence bude i nadále pokračovat, především ve stále bližším měřítku.
Tím se samozřejmě vysvětluje, proč se příliš nevyplatí přidávat nová procesorová jádra, ale spíše vsadit na grafický čip. Ten se totiž začíná starat o stále více věcí od akcelerace veškeré grafiky až po enkódování videa.
Čipy PowerVR šesté série s kódovým označením „Rogue“ byly zatím oznámeny ve dvou modelech – G6200 a G6400. Zatím nebyly zveřejněné přesné specifikace, ale podpora DirectX 11.1 a OpenGL 4.2 je již očekávaná.
Srovnání výpočetního výkonu grafických čipů
Dle informací již byly finální návrhy těchto čipů odeslány jednotlivým partnerům, jejich nasazení se tak dočkáme koncem tohoto roku, případně během toho příštího. Hlavní zaměření nové architektury je v oblasti bezztrátové komprese dat v rámci čipu, což má být hlavně z důvodu displejů s vysokým rozlišením. Díky výrazné kompresi lze snížit rostoucí datový tok v celém čipu i ve spolupráci s pamětí.
Celý čip je rozdělen na menší bloky (clustery), podobně jako to známe ze současných grafických čipů pro desktop. Unifikovaná architektura s maximální optimalizací využití tranzistorů při každé výpočetní operaci je nutností, s čímž souvisí i velká flexibilita. Výsledkem je snížení místa i spotřeby na křemíkovém čipu. Pokud nejsou využívány některé bloky, jejich spotřeba je na naprostém minimu, což vede k nižší spotřebě při nenáročných operacích, kdy je velká část čipu v klidu.
Imagination Technologies se chlubí tím, že nová generace poskytne výkon v rozmezí 100 GFLOPS až neuvěřitelných 1 TFLOPS. A proč je to neuvěřitelné? Stále se totiž bavíme o čipu, jehož spotřeba je v rámci stovek miliwattů až jednotek wattů. Nová architektura je přitom kompatibilní s aplikacemi vytvořenými na čipech páté řady, takže vývojáři mohou velmi snadno své systémy překlopit na zcela novou architekturu.
Architektura Rogue byla vyvíjena se zaměřením na obecné výpočty, ještě více tak půjde použít vysokého paralelního výkonu čipu pro jiné druhy výpočtů, než pouze z grafického světa. Obecně vše co lze paralelizovat, bude pomocí grafického čipu rychlejší a efektivnější (výkon/spotřeba, GFLOPS/mW, GFLOPS/mm2).
Šestá série Rogue přinese velké změny architektury a ještě vyšší výkon a efektivitu
S příchodem pokročilejších výrobních technologií přitom stačí po nějakou dobu pouze zvyšovat počet jednotlivých clusterů a výrazně zvyšovat výkon bez nutnosti změny a extrémního vylepšování architektury. U paralelního čipu totiž není problém jako u procesoru, který je určen především pro jednovláknové aplikace a přidáním dalších jader většinou nelze v těchto aplikacích zvýšit výkon.
U paralelního čipu ale platí, že čím větší počet těchto malých výpočetních jednotek (u AMD se v podobném duchu jedná o stream procesory, Nvidia to nazývá CUDA procesory) je k dispozici, tím se také zvýší výkon zpracování dat.
Imagination Technologies se také pyšní výbornou podporou vývojářů a tvorbou ovladačů, které mají pověst velmi stabilní platformy. To vše jsou samozřejmě věci, které se v tomto segmentu cení asi nejvíce.
Paralelní výkon pro post-PC éru
Nové grafické čipy PowerVR série 6 můžeme jistě očekávat nejen od Applu s jeho příští generací čipu (Apple A6), ale také od dalších výrobců platforem. Své řešení, které využívají Rogue čipů představily již společnosti Texas Instruments (OMAP 5xxx/6xxx) a ST-Ericsson (Nova A9600 by měla poskytnout 210 GFLOPS, 350 milionů polygonů za sekundu a 13 GPix/s), na trhu by se měly objevit taktéž tento rok.
Můžeme se tak těšit na další skoky v oblasti výkonu, který budou mobilní zařízení poskytovat a využívat pro nejrůznější účely. Zpracování obrazu z kamery pro rozšířenou realitu je například jednou takovou oblastí, kde je vysoký paralelní výkon extrémně nutný.
S další generací čipů ale můžeme očekávat i zvýšení výkonu klasického procesoru. Dvoujádrový procesor Cortex-A15 má totiž nabízet stejný či o trochu vyšší výkon, než čtyřjádrový Cortex-A9. S příchodem 28nm technologie výroby se tak můžeme těšit na skutečně výrazně výkonnější mobilní platformy.