Technologie | Umělá inteligence | Čipy

Jeden wafer, jeden čip. Nová generace Cerebras WSE-2 má 850 tisíc jader

  • Nová verze čipu Cerebras WE-2 má dvakrát více jader
  • Jde o jeden čip o velikosti celého waferu
  • Unikátní výkon je ideální pro nejnáročnější úlohy s velkým množstvím dat

V roce 2019 se na trhu objevila nečekaná „konkurence“ v oblasti čipů, která přinesla na svět něco, co se doposud považovalo za nemožné. Jeden jediný čip, který se rozprostírá na ploše celého waferu. Abyste měli představu – na wafer se obvykle vejdou stovky čipů, které se rozřežou a umístí do balení, které si osadíte přímo do patice na základní desce.

Protože je nutné zpracovávat stále větší množství dat, omezení vznikají nikoli na straně výpočetních jader, ale na přenosových linkách, řadičích, serverových propojeních a dalších částech. Čip o velikosti waferu řeší problém tím, že jsou všechna jádra a spoje na jednom kusu křemíku.

Cerebras WSE-2: dvakrát více jader

Zatímco první generace byla vyráběná 16nm technologií, u druhé s označením Cerebras WSE-2 už byla k výrobě „waferočipu“ použitá moderní 7nm technologie od TSMC. Díky tomu bylo možné značně zlepšit všechny parametry.

Klepněte pro větší obrázek

Plocha čipu zůstala stejná – 46 255 mm2 (pro porovnání, velký grafický čip u Nvidia A100 má 826 mm2), avšak počet tranzistorů se více než zdvojnásobil. Z původních 1,2 bilionu tranzistorů už má druhá generace 2,6 bilionu tranzistorů. Nvidia A100 má oproti tomu jen 54 miliard tranzistorů, tedy takřka 50× méně.

Díky tomu se zvýšil i počet výpočetních jader ze 400 tisíc na 850 tisíc jader. Rychlá paměť SRAM přímo na čipu zvedá kapacitu z 18 GB na 40 GB. Paměťová propustnost se dostala z již tak vysokých 9 PB/s na 20 PB/s. Datová propustnost skrze dvourozměrné spoje v rámci celého čipu vzrostla z 100 Pb/s na 220 Pb/s.

Klepněte pro větší obrázek

A co je na tom to nejlepší? Spotřeba zůstala zcela totožná jako u první generace. Samotný jeden čip si řekne o 15 kW a celý systém včetně propracovaného vodního chlazení s obřím blokem přímo na waferu s přímým napájením  potřebuje 20 kW. Externí konstrukce zůstala relativně stejná jako u CS-1.

Vyřešené nedokonalosti

Stejně jako u první generace, i v tomto případě je již v samotné architektuře zapracován mechanismus automatické opravy a odklonění poškozených částí čipu a jader. To je samozřejmě nutností, protože zatímco výrobci normálních čipů jednotlivé kousky vyhodí nebo je použijí pro nižší řady s menším počtem jader, čip Cerebras WSE-2 musí běžet jako celek.

Klepněte pro větší obrázek

Čip má tak spoustu redundantních jader a částí tak, aby při dané výtěžnosti byl vždy použitelný a funkční v celé velikosti. U první generace se počítalo s poškozením až 1,5 % polovodičové struktury.

Vysoký výkon pro umělou inteligenci

Zmíněných 850 tisíc jader je optimalizováno pro jednodušší výpočty vhodné pro umělou inteligenci, Aby bylo možné systém zapojit do stávající infrastruktury, obsahuje i rychlé externí síťové spojení, které je zajištěné pomocí 12 portů ethernet s rychlostí 100 Gb/s.

Klepněte pro větší obrázek

Celý systém má i redundantní obvody pro napájení, chlazení i vodní pumpy. Velikost celé skříně odpovídá formátu 15U. Cerebras WSE-2 je více než dvakrát výkonnější než první generace a je zpětně kompatibilní se softwarem a aplikacemi vyvinutými pro první verzi (standardní PyTorch, TensorFlow).

Klepněte pro větší obrázek

Cena bohužel nebyla oznámena a nelze se tomu příliš divit – toto řešení je určené pro velmi náročné zákazníky, kteří se nebojí ani inovativních technologií a jsou schopni si za to připlatit.

Klepněte pro větší obrázek
Přepočet počítačových latencí vůči rychlosti světla. Čím kratší vzdálenost musí elektron, respektive náboj urazit, tím lze výrazně zvyšovat výkon díky nižší latenci a mnohem menším prostojům (Zdroj: FormulusBlack)

Cerebras WSE-2 otevírá nové možnosti efektivity, protože u něj odpadá spousta omezení (včetně rychlosti světla), problémů a zbytečné spotřeby částí a struktur, které jsou nutné při zapojení velkého množství klasických procesorů a výpočetních grafických karet. Pro specializované použití má tento systém velkou šanci na to, že se stane novým standardem, který bude konkurovat zavedeným systémům od Intelu nebo AMD.

Diskuze (6) Další článek: Spotify spolupracuje s Facebookem. Hudbu přehrajete přímo uvnitř sociální sítě

Témata článku: Technologie, Umělá inteligence, AMD, Intel, Procesory, Nvidia, Strojové učení, Moorův zákon, Nanotechnologie, Čipy, TSMC, Servery, Neuronová síť, Superpočítače, Datacentra, Výroba, TensorFlow, Tranzistory, Tranzistor, Velké množství, Jádro, Sram, Jade, Generace, Množství dat, Procesory na Heureka.cz



Cetin zrychlí upload i u optického připojení. Až na gigabit bude vše symetrické
Lukáš Václavík
Optické kabelyCETINPřipojení k internetu
Nová volitelná aktualizace systému Windows 10 opravuje 38 problémů
Karel Kilián
Windows UpdateAktualizaceWindows 10
Recenze Windows 11. Microsoft nás opíjí rohlíkem a omezuje použitelnost

Recenze Windows 11. Microsoft nás opíjí rohlíkem a omezuje použitelnost

** Oproti Desítkám významně stouply hardwarové požadavky ** Windows 11 mají nový vzhled, ale výrazně narušují workflow. ** Potěší vyhledávání, multitasking i rychlejší aktualizace

Petr Urban
Windows 11Testy