Neni to slozitejsi. Jen to vyzaduje jine uvazovani. Tedy je nutny masivne paralelni pristup. Tedy misto toho aby jsme napsali "for" cyklus a v nem pouzili nejakou operaci na nekolik prvku, tak musime pouzit onen Paralelni pristup a spustit stejnou operaci na vsech prvcich soucasne. Teda v pripade ze to jde a ty data jsou na sobe nezavisla.
Tohle je obecne ten problem. Ikdyz dnes jsou vicejadrove procesory, tak zakladat na nich dalsi vlakna je casove dost narocne, a programatori to stale pisi tim forem, ikdyz ty data treba rozdeli na 4 casti, a udelaji 4 vlakna, tak v kazdem je stale ten for a prochazi to urcitou cast dat.
Ale tohle u tech superpocitacu zas tak neplati, tam se nastesti ten paralelni pristup pouziva normalne (protoze ty stroje maji desetitisice jader) takze pro toho programatora to psani na GPU a CPU superpocitace moc velky rozdil neni.