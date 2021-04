V roce 2019 se na trhu objevila nečekaná „konkurence“ v oblasti čipů, která přinesla na svět něco, co se doposud považovalo za nemožné. Jeden jediný čip, který se rozprostírá na ploše celého waferu. Abyste měli představu – na wafer se obvykle vejdou stovky čipů, které se rozřežou a umístí do balení, které si osadíte přímo do patice na základní desce.

Protože je nutné zpracovávat stále větší množství dat, omezení vznikají nikoli na straně výpočetních jader, ale na přenosových linkách, řadičích, serverových propojeních a dalších částech. Čip o velikosti waferu řeší problém tím, že jsou všechna jádra a spoje na jednom kusu křemíku.

Cerebras WSE-2: dvakrát více jader

Zatímco první generace byla vyráběná 16nm technologií, u druhé s označením Cerebras WSE-2 už byla k výrobě „waferočipu“ použitá moderní 7nm technologie od TSMC. Díky tomu bylo možné značně zlepšit všechny parametry.

Plocha čipu zůstala stejná – 46 255 mm2 (pro porovnání, velký grafický čip u Nvidia A100 má 826 mm2), avšak počet tranzistorů se více než zdvojnásobil. Z původních 1,2 bilionu tranzistorů už má druhá generace 2,6 bilionu tranzistorů. Nvidia A100 má oproti tomu jen 54 miliard tranzistorů, tedy takřka 50× méně.

Díky tomu se zvýšil i počet výpočetních jader ze 400 tisíc na 850 tisíc jader. Rychlá paměť SRAM přímo na čipu zvedá kapacitu z 18 GB na 40 GB. Paměťová propustnost se dostala z již tak vysokých 9 PB/s na 20 PB/s. Datová propustnost skrze dvourozměrné spoje v rámci celého čipu vzrostla z 100 Pb/s na 220 Pb/s.

A co je na tom to nejlepší? Spotřeba zůstala zcela totožná jako u první generace. Samotný jeden čip si řekne o 15 kW a celý systém včetně propracovaného vodního chlazení s obřím blokem přímo na waferu s přímým napájením potřebuje 20 kW. Externí konstrukce zůstala relativně stejná jako u CS-1.

Vyřešené nedokonalosti

Stejně jako u první generace, i v tomto případě je již v samotné architektuře zapracován mechanismus automatické opravy a odklonění poškozených částí čipu a jader. To je samozřejmě nutností, protože zatímco výrobci normálních čipů jednotlivé kousky vyhodí nebo je použijí pro nižší řady s menším počtem jader, čip Cerebras WSE-2 musí běžet jako celek.

Čip má tak spoustu redundantních jader a částí tak, aby při dané výtěžnosti byl vždy použitelný a funkční v celé velikosti. U první generace se počítalo s poškozením až 1,5 % polovodičové struktury.

Vysoký výkon pro umělou inteligenci

Zmíněných 850 tisíc jader je optimalizováno pro jednodušší výpočty vhodné pro umělou inteligenci, Aby bylo možné systém zapojit do stávající infrastruktury, obsahuje i rychlé externí síťové spojení, které je zajištěné pomocí 12 portů ethernet s rychlostí 100 Gb/s.

Celý systém má i redundantní obvody pro napájení, chlazení i vodní pumpy. Velikost celé skříně odpovídá formátu 15U. Cerebras WSE-2 je více než dvakrát výkonnější než první generace a je zpětně kompatibilní se softwarem a aplikacemi vyvinutými pro první verzi (standardní PyTorch, TensorFlow).

Cena bohužel nebyla oznámena a nelze se tomu příliš divit – toto řešení je určené pro velmi náročné zákazníky, kteří se nebojí ani inovativních technologií a jsou schopni si za to připlatit.



Přepočet počítačových latencí vůči rychlosti světla. Čím kratší vzdálenost musí elektron, respektive náboj urazit, tím lze výrazně zvyšovat výkon díky nižší latenci a mnohem menším prostojům (Zdroj: FormulusBlack)

Cerebras WSE-2 otevírá nové možnosti efektivity, protože u něj odpadá spousta omezení (včetně rychlosti světla), problémů a zbytečné spotřeby částí a struktur, které jsou nutné při zapojení velkého množství klasických procesorů a výpočetních grafických karet. Pro specializované použití má tento systém velkou šanci na to, že se stane novým standardem, který bude konkurovat zavedeným systémům od Intelu nebo AMD.