Hát nem is tudom erre a tudományos elemzésre mit mondjak.
Inkább tudomásul veszem, hogy mondjuk a
- 8 végrehajtó egység, és
- a vektor egység (mondjuk 4 db 32 bites összeadást végez párhuzamosan), szóval
a fenti 12 utasítás egy órajel alatt, az nem más mint soros végrehajtás. :)
A gyakorlatilag hardveres memóriaszegmens védelmet jelentő védett üzemmód esetén a Neumann architektúra memória egyes blokkjai nem írhatók, és csak program van benne. Akkor ez milyen modell?
A cache leírásod nem rossz, csak az I-cache maradt ki. A mai CPU-k "egy kicsit előre lefuttatják" a programot, megelőzve a a végrehajtóegységeket, aztán egyszer csak jön a branch prediction, ami manapság roppant ravasz és több szintű. Ez is soros végrehajtásra utal, vagy inkább a bejövő lyukszalagból néha ki kell tépni egy-egy darabot, mert feleslegessé vált?
Sőt a sorosnak írt és vélt program helyes sorrendjét igen gyakran nem csak a CPU, hanem a fordító is biztosítja. Olyan 12 éve a Motorola G5-ös processzorhoz írt fordító sikersztorijáról olvastam, hogy háromszoros sebességét értek el a rename regiszterek tudatosabb kihasználásával. A wikipédia így kezdi a magyarázatot: In computer architecture, register renaming refers to a technique used to avoid unnecessary serialization of program operations imposed by the reuse of registers by those operations.
Általában azt hányják a szememre, hogy 20-30 éves (elavult!) tudásommal okoskodok. Sajnos a rename regisztrek használata több mint 20-30 éves múltra tekint vissza (már pl. a PentiumPro is tudott ilyet), és abszolút nem felel meg a Neumann modellnek, hanem pont az ellenkezője.