Intel Larrabee: detaily o připravované grafice

Intel zveřejnil některé detaily o plánované řadě akcelerátorů, které mají využívat jádra odvozená od první generace Pentií. Larrabee tak může fungovat i jako mnohojádrový procesor.
Kapitoly článku

Už za pět dní má v Los Angeles odstartovat konference Siggraph 2008, na níž se předvádí novinky z oblastí počítačové grafiky a interaktivních technologií. Při této příležitosti se Intel rozhodl zveřejnit detaily o chystané architektuře s Larrabee, která má být první mnohojádrovou x86 architekturou Intelu.

Přestože by se mohlo zdát, že Intel o architektuře Larrabee prozradil hodně podrobností, prakticky nevíme stále nic – jakkoliv mohou vypadat obrázky čipů a uspořádání jejich součástí a popis toho, jak to má fungovat, zajímavě, nevypovídá to o reálném výkonu ve hrách či aplikacích, spotřebě, dostupnosti, ani ceně tohoto řešení. Právě to nás u většiny komponent zajímá mnohem víc, než to, co je na pozadí a jak se dané řešení liší od toho, co se používá a nakolik je revoluční.

Klepněte pro větší obrázek

Intel se kdysi k výrobě grafických karet dostal koupí společnosti Real3D. Se svými Intel 740 pro AGP ale díru do světa neudělal. Poznatky z konstrukce samostatných grafických karet pak Intel zúročil u integrovaných grafik ve vlastních čipových sadách, které ale co do výkonu ve 3D ve srovnání s konkurenčními produkty pokulhávají.

Mnohojádrový procesor nebo grafika?

Připravovaný Larrabee ale nemá být čistokrevný grafický čip, spadá spíše do oblasti tera-scale architektury, se kterou Intel vyrukoval před dvěma lety na IDF. Má jít o mnohojádrový CPU optimalizovaný pro paralelní zpracování dat, doplněný jednotkami používanými u grafických karet, jejichž realizace pomocí softwaru pro procesory by nebyla efektivní.

Zatímco klasické GPU prodělávají vývoj, při němž se z jednodušších jednoúčelových čipů a jader stávají univerzálnější řešení s programovatelnými částmi (jako jsou stream procesory), Intel na to chce jít z opačné strany a nabídnout komplexní čipy sestavené z velkého počtu složitějších jednotek podobných historickým procesorům.

Klepněte pro větší obrázek

Co to znamená v praxi? Zatímco u klasických GPU je spousta funkcí čipu „zadrátovaná“, v případě mnohojádrových CPU je možné dovednosti a funkce čipu do velké míry ovlivňovat úpravou softwaru. To, co je dnes běžnou praxí, tedy že téměř každá změna specifikace DirectX či OpenGL vyžaduje novou generaci GPU, by šlo do velké míry řešit softwarovou cestou a jediným omezením by byl výkon procesoru.

Larrabee má využívat velké množství x86 jader, která nemají svůj původ u složitých moderních procesorů s out-of-order vykonáváním instrukcí, ale vycházejí z první generace Pentií s dual issue in-order architekturou. Jsou ale upravena tak, aby mohla díky podpoře multithreadingu (hyperthreadingu) počítat až čtyři vlákna najednou, dovybavena širokou vektorovou jednotkou (zvládne šestnáct 32bitových operací za takt), instrukcemi pro 64bitové výpočty, mají větší L1 cache (32 kB pro data a 32 kB pro instrukce) a navíc 256 kB L2 cache, která byla v éře Pentií ještě mimo procesor na základní desce a přibyly i sofistikované prefetch algoritmy, které mají pomáhat inteligentnějšímu rozkládání zátěže mezi jednotlivá jádra.

Klepněte pro větší obrázek 

Obdobnou strategii zvolil Intel u procesorů Atom. Od Atomů se ale Larrabee také liší – zatímco Atom je optimalizovaný na rychlé provádění jednoho vlákna a má šestnáctistupňovou pipeline, jádro Larrabee má mít mnohem blíže k pětistupňové pipeline prvních Pentií. Larrabee navíc podporuje SMT pro čtyři vlákna, zatímco Atom zvládá současný běh dvou vláken a Pentium jen jedno.

Srovnání toho, jak by vypadal hypotetický desetijádrový procesor z jednotek Larrabee o zhruba stejné velikosti, a při zhruba stejné spotřebě, jako současné Core 2 Duo, vyráběný stejnou architekturou, je v následující tabulce.

Klepněte pro větší obrázek

Uvedené srovnání ale není přesné – na hypotetickém čipu není započítán prostor nutný na zmiňované specializované hardwarové jednotky pro grafické výpočty.

CPU v Larrabee má softwarově provádět operace jako rasterizaci, interpolaci či alpha blending aplikovaný po operacích se shadery. Některé operace jako filtrování či dekomprese textur ale nelze na použitých CPU efektivně provádět (Intel uvádí, že by filtrování trvalo dvanáctkrát a v případě nutnosti dekomprese textur až čtyřicetkrát déle), proto Larrabee obsahuje i samostatnou logiku podobnou typickým GPU. Ta se bude využívat pro operace, jako je komprese textur, mipmapping, anizotropní filtrování apod. a bude schopná přistupovat k datům v L2 cache jednotlivých jader. Komunikace mezi jádry a jednotkami má přes cache probíhat pomocí dvousměrné 512bitové sběrnice s topologií ringbus, jíž jsou všechna jádra propojena.

Klepněte pro větší obrázek 

Funkce druhé „fixed“ jednotky na schématu není blíže specifikovaná, spekuluje se o tom, že by mohlo jít o teselátor (zjednodušeně jednotka, která zjemní polygonovou síť 3D modelů rozdělením plošek na několik menších trojúhelníků a vyhlazením modelu), který by měl být součástí specifikace DirectX 11.Klepněte pro větší obrázek

 

Kapitoly článku

Témata článku: Hardware, Order, Tera, Fixed

4 komentáře

Nejnovější komentáře

  • Jan Komárek 7. 8. 2008 11:20:26
    Intel možná Larabee necílí do herního prostoru, kde je sice největší...
  • Adam Vágner 6. 8. 2008 23:35:21
    pravda. TZ...
  • Jan Tomášek 6. 8. 2008 22:25:58
    Podrobný popis architektury a filozofie, se kterou ke grafice u Larabee...
Určitě si přečtěte

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

Operační systém běžným počítačům nedal Bill Gates, ale Gary Kildall

** Gary Kildall pochopil, že levné výpočetní čipy mohou posloužit jako univerzální počítače pro všechny ** Připravil pro ně proto první operační systém ** Později mu systém vyfoukl Microsoft a nazval ho MS DOS

23.  4.  2017 | Pavel Tronner | 51

Původní Starcraft: Brood War je nyní zdarma. Konec práce! Jde se pařit

Původní Starcraft: Brood War je nyní zdarma. Konec práce! Jde se pařit

** Legendární hra Starcraft je nyní k dispozici zdarma ** Chystá se i nová remasterovaná verze s hezčí grafikou

19.  4.  2017 | Jakub Čížek | 25

Brno otevřelo největší českou dílnu pro bastlíře. Kladívka, vrtačky, 3D tiskárny, laserové řezačky. Je tu vše

Brno otevřelo největší českou dílnu pro bastlíře. Kladívka, vrtačky, 3D tiskárny, laserové řezačky. Je tu vše

** Máte nápad, ale chybí vám stroje a pořádná dílna? ** Chcete postavit ptačí budku, nebo krabičku pro Arduino? ** Brno otevřelo svůj FabLab – laboratoř pro bastlíře

19.  4.  2017 | Jakub Čížek | 31

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

Umělá inteligence je sice v plenkách, už teď ale přestáváme rozumět, jak vlastně funguje. To je problém

** Už je to tady, lidé přestávají chápat počítače ** Systémy neuronových sítí začínají pracovat tak, že ani jejich tvůrci přesně neví, co se uvnitř děje ** Do budoucna to může být závažný problém

Včera | Jakub Čížek | 109

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

Před 35 lety měl premiéru legendární počítač ZX Spectrum. Připomeňte si „Gumáka“

** Slavný osmibitový počítač Sinclair ZX Spectrum byl uveden právě před 35 lety ** Připomeňte si tento průkopnický počítač v tematických článcích ** Podívejte se, jak funguje dnes

23.  4.  2017 | Pavel Tronner | 13

Český Google Překladač začal používat umělou inteligenci. Konec „drahoušků zákazníků“

Český Google Překladač začal používat umělou inteligenci. Konec „drahoušků zákazníků“

** Google ve svém překladači roky používal statistickou technologii ** Nyní zavádí strojové učení a neuronové sítě ** Rozdíl by měl být zvláště na větších textech patrný už nyní

20.  4.  2017 | Jakub Čížek | 31


Aktuální číslo časopisu Computer

První test AMD Ryzen

Velké testy: 22 powerbank a 8 bezdrátových setů

Radíme s koupí Wi-Fi routeru

Co dokáží inteligentní domy?