Stále více systémů začíná integrovat funkce strojového učení a v poslední době i pokročilejší hluboké neuronové sítě. Umělá inteligence dokáže vyřešit spoustu problémů jednoduše a mnohem efektivněji, obzvláště pokud jde o zpracování velkého množství dat a vzorů.
Klasické univerzální procesory nejsou v tomto směru příliš efektivní a i když jsou na tom grafické čipy výrazně lépe a vznikají pro ně i specializované knihovny, nastává nová éra specializovaných čipů právě pro umělou inteligenci, které jsou z pohledu výkonu a spotřeby ještě mnohem efektivnější.
Wave Computing jde na to jako Google
Startup Wave Computing vyvíjí vlastní hardwarový čip DPU (DataFlow Processing Unit) a zároveň i kompletní počítač, který bude moci být součástí datacenter.

Masivně paralelní a zároveň programovatelná dataflow architektura, je dle tvrzení nejefektivnější na světě a to i ve srovnání se specializovanými FPGA čipy.
Podobnost tak lze nalézt spíše se stále poměrně tajemným TPU od Googlu, který je určen pro akceleraci knihovny TensorFlow (taktéž od Googlu), která je k dispozici jako opensource.
Wave Computing se ale nesnaží o prosazení nějaké další vlastní knihovny, v tom by asi proti Googlu neměl sebemenší šanci, ale naopak podporuje jak zmíněný framework TensorFlow, tak i CNTK (Computational Network Toolkit) od Microsoftu.
Z pohledu hardwaru jde tak o konkurenci TPU od Googlu, ale znáte pořekadlo – „Nepřítel mého nepřítele je můj přítel“? Tak přesně v tomto případě to sedí právě pro DPU a TPU. A kdo je nepřítel? Nvidia, AMD, Intel a další.
Podporuje klasické i rychlé 3D paměti
Tvůrci by již brzy měli představit bližší detaily o architektuře, ale nyní je k dispozici jen pár dalších informací. Jednotlivé čipy jsou kompatibilní jak s běžnými paměťmi DDR, tak i druhou generací rychlých 3D pamětí HMC (Hybrid Memory Cube), které vyvíjí společnost Micron.

Spojit půjde desítky tisíc uzlů a vytvořit tak vysoký výkon v datacentru i pro nejnáročnější použití. Efektivity spotřeby a výkonu bude přitom dle tvrzení nejlepší na světě (Zdroj: Wave Computing)
Vysoká propustnost dat mezi jednotlivými čipy (HMC 2.0 nabízí až 480 GB/s) je právě klíčovou vlastností pro efektivní zpracování velkého množství dat, který je nutné pro analýzu a učení hlubokých neuronových sítí.

Hybridní složené paměti HMC 2.0 poskytují propustnost až 480 GB/s (Zdroj: Micron)
Jak je vidět na obrázku základní architektury spojení několika DPU, jednotlivé čipy mají k dispozici samostatné paměti DDR a v rámci společné sběrnice pak využívají paměti HMC. Už v roce 2013 se tvůrci pochlubili funkčním prototypem, který v rámci 28nm výroby pracoval na frekvenci přes 10 GHz.
Wave Computing oznámilo, že bude možné spojit až desítky tisíc výpočetních uzlů s DPU, takže půjde vytvořit skutečně obří datacentra s obrovskými možnostmi a výkonem v oblasti umělé inteligence. Podobným směrem jde ale i Google s TPU, který například spojením nespecifikovaného množství dokázal vytvořit systém AlphaGo, který porazil i toho nejlepšího lidského hráče Go na světě.
Padesátka patentů a možná akvizice
Hotové počítače postavené na čipech DPU by měly být dostupné během roku 2017, vybraní vývojáři ale dostanou přístup k hardwarové platformě už koncem tohoto roku.
Wave Computing má ve vedení zkušené experty. Šéfem je Derek Meyer, který dříve působil ve společnostech jako Sun Microsystems, Phillips, MIPS Technologies, ARC a dalších, technický ředitel Chric Nicol pak dříve založil a působil v australské pobočce Bell Labs Research.
Startup už se pyšní padesátkou patentů a prvními investory za zády. I když je hardwarový startup poměrně nákladnou záležitostí, Wave Computing má velmi slušnou naději do budoucna.
Podle odhadů trhu se totiž umělá inteligence dostane do budoucna takřka do všech segmentů služeb a produktů jak v soukromé, tak i komerční sféře. Wave Computing se tak může stát novým Intelem nebo také být v budoucnu odkoupen právě některým z velkých hráčů jako je Intel, Nvidia, AMD nebo případně i Googlem, Microsoftem či dokonce Applem.
V oblasti umělé inteligence se totiž ukazuje, že velké technologické společnosti začínají držet všechny kritické částí celé skládačky a dávno už se nejedná výhradně například o softwarové společnosti. Pro lepší konkurenceschopnost se snaží vytvářet vlastní optimalizované servery, celá datacentra a teď už i vlastní čipy.
Apple na tuto strategii v rámci mobilních zařízení přešel už poměrně dávno (Apple A4) a vzhledem k tomu, že se snaží udržet většinu umělé inteligence v samotném zařízení a nikoli v cloudu jako třeba Google, lze čekat i nějaké specializované akcelerační obvody ať už v rámci nových generací čipů Apple AX nebo jako samostatné čipy na hlavní desce budoucích iPhonů nebo iPadů.