A k čemu to je? Na zamachrování? Každý, kdo někdy studoval architekturu procesorů a HW s registrovou a míšenou architekturou (stack+accumulator) ví, že zvýšení frekvence není zrovna nejlepší cesta zvyšování výkonu. Abychom provedli nějakou operaci 2x rychleji, tak zdvojnásobíme frekvenci CLK signálu, ale zároveň nehorázně zvedneme spotřebu a musíme chladit.Zatím co dobrým návrhem architektury, registrů a instrukční sady můžeme mnohem lépe dosáhnout vyššího výkonu. Proto je lepší udělat více jader na menší frekvenci a kratší instrukce a raději se snažit o CPI co nejblíže jedné a to i za cenu přidání registrů, sčítaček, rozpracování instrukcí, bypassingu nebo prediktorů skoku. Jistě, zesložití se tak procesor, ale nárůst výkonu spolu se zavedení paralelismu je veliký.Navíc další problém u procesorů x86 je to, že mají spousty instrukcí, ale kompilátory (ani ty nejmodernější) je nedokáží všechny efektivně využít. Navíc se tak kazí pipelining, když jsou instrukce jinak dlouhé.