( geza42 | 2020. 03. 08., v – 02:18 )

"Tán ettől olyan gyors.". Nem, nem gyors. Azonos órajel mellett az akkori intel simán gyorsabb volt. FPU-ban erős, igen (pláne ha hozzáveszed az SPU-kat, akkor nagyon durván), de ezen kívül az in order jelleg miatt labdába se rúghat az intel mellett. Értem ezt úgy, hogyha nem állsz neki kézzel optimalizálni a kódot, hogy pont úgy tálald a dolgokat a PPU-nak, ahogy jó neki (és még ilyenkor se tudod kihasználni a lehetőségeket általában). Ha csak simán fogsz egy nem FPU-ra kihegyezett kb. bármilyen programot, cell-en lassabban fog futni, nem is kicsit. Az OoO jelleg nagyon sokat számít.

De egyébként elég, ha csak megnézed a tranzisztorszámot: a teljes cell olyan 200m tranzisztor (amiből a PPU mindössze olyan 30m-40m lehet max.). Nekem akkoriban Q6600-am volt, ami 580m tranzisztor, most bután leosztva 4-gyel a 4 mag miatt: 145m. Cache-ben is sokkal gyengébb a PPU: 0.5MB vs. 4M (2 magra). PPU meglehetősen buta egy intel proci mellett. Ravaszabb szervezésű? Dehogy. Pont az ellenkezője. Sok mindent kihagytak belőle. A kedvencem az, hogy nincs direkt átjárás a floating point és integer regiszterek között. Csak a memórián (cache-en) keresztül lehet megoldani. Amire bejön ugye a load-hit-store penalty.