- A hozzászóláshoz be kell jelentkezni
- 2140 megtekintés
Hozzászólások
Mi van itt, csak kapkodom a fejem.
Nagy a verseny, mióta az Intel észbekapott. Félek hosszú távon az Amd húzza majd a rövidebbet, hiszen lényegesen kevesebb tartalékkal rendelkezik (ha rendelkezik egyáltalán). Egy 50-50 körüli piaci részesedés megnyugtatóbb lenne már a erseny szempontjából is.
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
A verseny jó, de csak egy szintig. Amikor már oda jutnak, hogy ki tud nagyobbat mondani, ki tud előbb szállítani, aztán majd jönnek ki a félig, háromnegyedig kész termékekkel csak azért, mert verseny van, az már nem jó.
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni
Oprendszerek piacan meg is latszik. Sot a vidkari gyartok is szopatjak a nepet, de van meg egy-ket kirivo cucc amivel csak szivni lehet, es nem a porszivora gondolok.
--
A nyúl egy igazi jellem. Ott ül a fűben, de akkor sem szívja!
- A hozzászóláshoz be kell jelentkezni
talán a merevlemezek a legkényesebbek ilyen szempontból. Ott sztem tényleg nem jó a nagy verseny, mert sokkal többet bukhat a fogyasztó mint nyerhet.:-(
- A hozzászóláshoz be kell jelentkezni
Ez hozzászólás kis módosítással elmehetne egy politikai fórumba is...
Így viszont ideillik Churchill idézetének egy átirata:
A versény még mindig jobb, mint a többi alternatíva...
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
Churchill azt is mondta, hogy a hosszú élet titka, a szivar és semmi sport.
De ha már itt tartunk sokkal jobban tetszik Einstein egyik mondása:
"Két dolog van a világon ami végtelen, az egyik maga a világegyetem, a másik az ember ostobaság! De a világegyetemben nem vagyok biztos."
- A hozzászóláshoz be kell jelentkezni
Einsteintől ez a legütőseb:
"Ha ezt tudom, inkább órásnak megyek."
Ez is Churchill:
"Műveletlen ember számára nagyon hasznos idézetgyűjteményt olvasni." :)
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
Tehát, ha jól értelmezem itt most arról van szó, hogy amikor az Intel szállítani fogja az egy tokban 2x2 processzormagos megoldást, akkor az AMD demózni fogja az 1x4 magosat.
Hááát ez azért így nem túl meggyőző...
---
Az ember mindig szerepet játszik. Ha másnak nem, hát saját magának.
- A hozzászóláshoz be kell jelentkezni
Jól értem? Az Intel most 2 magos, HT képes prociról beszél, míg az AMD négy teljesen különálló magból álló prociról beszél? Mert ebben az esetben azért van különbség bőven.
- A hozzászóláshoz be kell jelentkezni
Nem. Az Intel olyan processzorról beszél, amiben négy mag van. Azonban nem négy független mag, hanem nagyon valószínű, hogy két dual-core Allendale, vagy négy single core Millwille lesz egy tokba csomagolva. Ennek a neve lesz Kentsfiled. Így a négy mag nem teljesen független egymástól. Az AMD olyan processzort fog demozni, amiben 4 _független mag_ lesz. Az Intel-nek is lesz olyan CPU-ja majd, ami már igazi quad-core lesz. Az lesz a Whitefield. Ahogy én tudom.
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni
Most kicsit nem értem mit értesz függetlenség alatt.
Az intel megoldása olyan mint amit Pentium D-nél is alkalmazott kezdetben, hogy két single-core die volt egybe tokozva.
Így kell elképzelni:
http://img230.imageshack.us/img230/9730/preslerandsmithfieldjp5.jpg
"Dual-die dual-core Pentium D 900 (balra)
single-die dual-core Pentium D 800 (jobbra)"
Most tehát megint két die lesz, amik mindketten dual-core-osak, így jön ki a quad-core. Persze később az intel is átáll az egy die-os megoldásra.
Az AMD meg most is kihagyja ezt a köztes lépcsőfokot, és rögtön "valódi" quad-core megoldást ad ki.
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
"Most kicsit nem értem mit értesz függetlenség alatt."
Ezt:
"Most tehát megint két die lesz, amik mindketten dual-core-osak, így jön ki a quad-core."
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni
Itt még tudom értelmezni a függetlenséget, mert két független dual-core mag van egymás mellett.
De:
" Az AMD olyan processzort fog demozni, amiben 4 _független mag_ lesz."
Az AMD procija valódi quad-core lesz, és nekem ez pont, hogy nem független.
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
Jaaa, értem. Azt elírtam. Ok.
Szerk: az eredeti angol cikk, ezt írja:
"AMD has stressed that its quad-core design will be a "true quad-core," meaning it will contain four separate cores on a die."
Azaz egy die-on, de elkülönített magok. Míg a Kentsfiled, az "multichip package" lesz, azaz, két die, és die-onként két mag.
Az hogy ennek mi lesz a hátránya az "igazi" quad-core processzorokhoz képest, az nekem egyelőre nem tiszta. Az is igaz, hogy sokat nem agyaltam rajta :-D
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni
Az hogy ennek mi lesz a hátránya az "igazi" quad-core processzorokhoz képest, az nekem egyelőre nem tiszta. Az is igaz, hogy sokat nem agyaltam rajta
Feltételezem az, hogy az L2 cache nem lesz közös. Ugyebár az Intel Yonah és Conroe processzoraiban egy közös L2 cache van a 2 magnak, ami a page-eit találati arány függvényében osztja ki a két magnak. Tehát szélsőséges esetben, ha csak az egyik mag futtat valamit, a másik idle, akkor az első mag a teljes L2-vel gazdálkodhat. Nyilván az egy IC-n 4 magos megoldásnál a 4 mag használna egy közös nagy L2 cache-t, míg a 2db 2magos IC esetén az 1-2 és 3-4-es magoknak van közös L2-jük. És mondjuk ez itt már többet számítana, mint 2 mag esetén, mert 4 magot sokkal kevesebb alkalmazás tud egyenletesen terhelni, mint 2-t.
A másik elméleti lehetőség, hogy a magok közötti kommunikációt felgyorsítja, ha 1 IC-n vannak, mert így a közösen használt adatot nem kell az FSB-n keresztül a rendszermemóriába minden alkalommal kimenteni és onnan visszaolvasni, hanem a közös L2 cache-en keresztül is adatot cserélhetnének. Ez tényleg nagyon jó dolog lenne a multithreadelt alkamazásoknál, ahol ugyanazon az adathalmazon dolgozik két szál, csakhogy az a bökkenő vele, hogy nem oly régen egy benchmarkban kimérték, hogy, hiába közös az L2 cache és hiába az Intel minden marketinganyaga, a Core processzorok is csak memóriába mentéssel tudnak adatot mozgatni a magok között.
---
Az ember mindig szerepet játszik. Ha másnak nem, hát saját magának.
- A hozzászóláshoz be kell jelentkezni
"Feltételezem az, hogy az L2 cache nem lesz közös."
Az intel esetében igen, az AMD X2-n viszont nem közös az L2 cache, pedig egy die-on vannak. De az igaz, hogy könnyebb összedrótozni a magokat. Talán a gyártási költségek is alacsonyabbak...
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
beszélt itt valaki az AMD-ről?
Az Opteron esetén más miatt jobb az egy IC-re szerelt több processzormag. Ott ugyanis minden IC-n egy közös memóriavezérlő és az adott IC magjainak így saját lokális memóriája van. Ha a folyamat olyan magon fut, amelyiknek a lokális memóriájában van a folyamatnak lefoglalt memóriaterület is, akkor az elérés gyors. Ha viszont át kell nyúlnia a másik IC-re kötött memóriába, akkor a késleltetési időt megnöveli az, hogy a hypertransport linkeken keresztül a másik IC memóriavezérlőjétől el kell kérni az adatot. Tehát jobb az, ha sok mag van egy közös IC-n egy közös lokális memóriával, mint ha át kéne nyúlkálniuk egymás memóriájába az adatokért.
Ugye itt megint lehet variálni az kernel ütemező CPU affinitásával, hogy lehetőleg az CPU futtassa a taszkot, amelyik lokális memóriájába van allokálva a taszk memóriaképe, csak akkor van baj, ha a taszkok egyenetlenül terhelik a memóriát és az egyik folyamat nem fér bele az őt futtató CPU-ra akasztott memóriába. Meg aztán a többszálú alkalmazásoknál meg semmi sem segít, mert ott ugyanazt a memóriaterületet kell, hogy piszkálja a két CPU, tehát esélytelen, hogy megússzák az egymás memóriájába kotorászást.
De az igaz, hogy könnyebb összedrótozni a magokat. Talán a gyártási költségek is alacsonyabbak...
Ez nem igaz. A két mag egyszerű összedrótozását az Intel csinálta a Pentium D esetén, csak, hogy elmondhassa, hogy megelőzték az AMD-t kétmagos processzor kiadásában. A Pentium D-t inkább nem is kommentálnám, egy rohammunka volt az egész, tervezési szempontból úgy ahogy van egy nagyon rossz példa.
Az AMD esetén a memóriavezérlő és a Hypertransport vezérlők közösek. Tehát messze nem két összeragasztott magról van szó. Az L2 cache azért nem osztott náluk, mert többportos memóriát elég nehéz implementálni. Igazából már eleve egy nagyon nagy teljesítmény az Intel részéről, hogy mindössze ~20%-os hozzáférési idő növekedéssel (ha jól emlékszem a dothan 2MB-os nem osztott L2-je esetén 10 órajel, a Yonah 4MB-os osztott L2-je esetén 12 órajel a latency) sikerült megoldaniuk úgy, hogy közben ráadásul még meg is kétszerezték a cache teljes méretét. Ennek sajnos az volt az ára, hogy úgy néz ki továbbra is a régi elavult M/E/S/I cache koherencia protokollt használják, ami esetén az adat módosítás után a másik magnak átadása csak a memórián keresztül writetrough invalidate módon történhet. Ez meg gyakorlatilag olyan, mintha ott sem lenne az L2 cache. Az AMD ezzel szemben még az Athlon MP-nél bevezette (vagy inkább az EV6-os busszal együtt "örökölte" az Alpha-tól) a M/O/E/S/I protokollt, ami külön "Owned" állapottal jelzi, hogy az egyik L2 cache-ben módosított érték van, míg a többiben még az eredeti. Egy Snoop művelettel az értéket módosító CPU frissíteni tudja a többi processzor cachében tárolt értéket anélkül, hogy előbb a memóriába kellen írnia és a többi magnak onnan újra ki kellene olvasnia az új értéket. Namost ezt a protokollt elég nehéz adaptálni megosztott L2 cache-re, ráadásul az AMD exkluzív L1/L2 cache vezérlőt használ, ami szintén nehezíti a témát. Feltételezem az AMD ezért nem eröltette. Sőt, tudtommal nem is fogja, hanem helyette egy közös L3 cache-t akar bevezetni majd valamikor. Nyilván az L3 cache annyi előnnyel jár, hogy kevésbe kell gyorsnak lennie, mint az L2-nek, így több a mozgásterük a protokoll implementálása terén.
---
Az ember mindig szerepet játszik. Ha másnak nem, hát saját magának.
- A hozzászóláshoz be kell jelentkezni
"beszélt itt valaki az AMD-ről?"
Igen, rajtad kívül mindenki, sőt ez a cikk témája is. :)
A könnyebb összedrótozhatóságot úgy értettem, hogy két külön dieon kb lehetetlen lenne megoldani komolyabb összedrótozást mint pl amit te is leírtál az Opteron kapcsán.
Tehát gyakorlatilag egyre gondoltunk.
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
"és rögtön "valódi" quad-core megoldást ad ki."
Hát azért nem rögtön. Majd úgy egy év múlva :))
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni
:)
rögtön=első körben
Így korrekt? Már fordul?
(A "valódira" semmi Warning? :))
"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o
- A hozzászóláshoz be kell jelentkezni
"A "valódira" semmi Warning? :))"
Benne van cikkben is. "igazi" jelzővel.
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni