Megérkezett az IBM Power6

Címkék

Az IBM tegnap Londonban bemutatta a régóta várt Power6 processzorát. A dual-core Power6 processzor dupla akkora maximális órajelen képes üzemelni, mint a Power5+-os testvére. A chip 4.7 GHz-en dolgozik (eredetileg 5 GHz-esre várták, de "csak" ennyi lett belőle, szemben a Power5+ 2.3 GHz-es maximális sebességével), és 4-szer akkora (8MB-nyi) L2 szintű cache-t tartalmaz, mint a korábbi Power5-ök. A processzor belső sávszélessége 300 GB / sec.

A Power6-ot az IBM 65 nm-es gyártástechnológiával gyártotta. A méretek csökkentése lehetővé tette a chipgyártó számára, hogy az energiafelhasználást mintegy 30%-kal csökkentse. A cég szerint Power6 processzor dupla akkora teljesítményre képes, mint az egy generációval idősebb társa, miközben azzal megegyező mennyiségű energiát fogyaszt. A bejelentéskor nagy hangsúlyt fektettek arra, hogy kiemeljék az új CPU energiatakarékossággal összefüggő szolgáltatásait.

Az IBM bejelentette, hogy néhány héten belül megkezdi a Power6-ra épülő System p és System i rendszereinek árusítását. A vásárlók június 8-től férhetnek hozzá a frissített rendszerekhez, de egyes cégek (mint például az Oracle) már tesztelik a stuffot. A szerverek ára ~ 60 000 dollártól indul.

A bejelentésen az IBM képviselői elmondták, hogy a Power6-tal szerelt rendszereikben megvan a lehetőség arra, hogy "szétszedjék" a konkurenciát - például a HP Itanium és a Sun SPARC rendszereit - a UNIX piacon. Példaként említették, hogy a Power6-tal szerelt rendszereik háromszor gyorsabbak, mint a HP Itanium-os rendszerei, és az előzetes benchmarkok alapján egy Power6-tal szerelt System p 570-es rendszer 25 különböző sebességrekordot döntött meg eddig.

Bővebben a Power6 bejelentésről:

Hozzászólások

Alomszep.

---
pontscho / fresh!mindworkz

wow

--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.

Jójó, ez mind szép, de azt nem írják, hogy hány fps-el fut a csé wine alatt? :DDD

-- pgergely --

En arra lesze kivancsi az Apple vissza ter-e :-D. Mar nem nagyon hinnem, de paran nalunk biztos acsoljak a bitot :-D
<#
<<<#######>>>
\ /
||
MACi

Azért ez a 4.7 Ghz nincs ám ingyen. Nem véletlenül pakolták tele eddig a procikat out-of-order végrehajtással... (Ja, aki nem olvasta: Power6-ban csak FP-re van OOO)

Tehát az szép és jó, hogy a Power5-öt alázza (milyen meglepő ugye?), engem az jobban érdekelne, hogy ezért az árért kapható konkurenseivel szemben mit produkál.
Mondjuk pár nap/hét, és erre is választ kapunk...

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o

Semmit. 60e USD-ből kb. 10 darab kétprocesszoros quad core xeonos gépet lehet kapni, 3GHz körüli órajelen. Az 80 darab processzor, bár memóriában (20-40 GB) nem sok, bár kétlem, hogy 60e-ért ennél többet adnának IBM-ék.

Megfelelő alkalmazással esélye sincs az IBM kütyünek. Legalábbis ami a feldolgozási (CPU, IO) teljesítményt és a hibatűrést illeti.

Én nem vagyok valami hardverguru, de nálam a többmagos proc az még 1 db proc marad, attól, hogy több mag van benne, persze növekszik a teljesítménye, de azért ne felejtsük el, hogy az ilyen procban egy csomó dolgot közösen használ a 2/4/akárhány mag, ami azért nem ugyanaz, mintha teljesen különállóak lennének, és gondolom, hogy ez bizonyos esetekben a teljesítményen is meglátszik.

Én azért nem temetném a Powert. Lehet, hogy "kilóra" ezért az árért kapsz 10 db dualquadxeon csudát, de azt is vedd figyelembe, hogy ahhoz, hogy ugyanazt a teljesítményt leadják, már klaszterezni/virtualizálni/stb. kell (ami már bonyolítja a dolgokat), mert 1 db ilyen szerver szerintem elbújhat egy Power6-os mögött. Arról nem is beszélve, hogy ha a xeonokból hegeszted össze ugyanazt a teljesítményt, akkor szinte biztos, hogy több áramfelvétellel fog járni a dolog. Ráadásul még egy érdekes terület a HPC, ahol eddig is szívesen használták a Power és PPC prockat, pl. az altivec miatt, meg állítólag lebegőpöttyös mulatságokban is szépen muzsikáltak. Nem hiszem, hogy a Power6 roszabb lett volna ezen a téren, mint az elődök. Ráadásul, ha pl. még ezt is ápdételik power6-ra, akkor van egy potenciális vásárlójuk :) Szóval, szerintem elég összetett a kép..

"Lehet, hogy "kilóra" ezért az árért kapsz 10 db dualquadxeon csudát, de azt is vedd figyelembe, hogy ahhoz, hogy ugyanazt a teljesítményt leadják, már klaszterezni/virtualizálni/stb. kell."

Azért maradjunk a földön. Egy ilyen proci biztosan nem ér fel egy 2 processzoros quad Xeonnal. Az ugye már 8 mag. 2 ellen. Nem gondolnám, hogy 4x olyan gyors, ez azt jelentené, hogy a power5 is 2x olyan gyors magonként...
10 darabról már ne is beszéljünk.

Macerásabb több magra/processzorra programozni? Így van. Csak azért ezt ne felejtsük el, hogy ez a Power6 is 2 magos, magonként két utasításszállal, ami 4 logikai magot jelent. Amit mindenképp el kell látni munkával, mert az in-order végrehajtásnak hála a proci maga nem tudja megoldani ezt a problémát.

Egyébként engem nem csak a mostani Xeon érdekel, sokkal inkább az idén még szintén megjelenő új Intel/AMD procik. Mert várhatóan ezek is vernek minimum 10-15%-ot az elődeikre azonos órajelen, plusz ezek is minimum 15%-kal magasabb órajelen futnak majd.

És akkor a Sun-t még nem is említettem.

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o

MINDIG attól függ mire használod.
A cluster sajnos nem mindig megoldás a dolgokra.
Fura módon egy Oracle RAC 2 node-dal nem feltétlen lassabb mint 3-mal.
S ha már a pénznél tartunk.
A beszerzési költség egy dolog.
A TCO egy másik.
Fogj egy P5+-szal szerelt p595-öt és kezdj el rá LPARokat és sok kicsi különböző célra használt alkalmazást pakolni.
(Mondjuk különböző ügyfelekre.)
Majd csináld ezt meg N+1 quad Xeonból.
A helyzet nagyjából a következő lesz:
A p595 egy rack.
Az N+1 Xeon valszeg több lesz mint egy rack. A rackek költsége és a szerverterem helye azért nem elhanyagolható. (Még ha tied is a terem azért a légkondinak nem mindegy mekkora légtért kell átmozgatnia. Tűz-, vibráció-, EMP-, biztonságtechnikai, *.* védelem nem két fillér.)
Az N+1 Xeon-ba (N+1)*400+W-os táp kerül. A p595-nek max 4 darab tápja van a redundancia miatt.
S ha már redundancia. A pSeriesek többnyire túlélnek egy processzorhibát. Mármint a rajta futó AIX is. Az alkalmazás... nos az már nem biztos.
1 pSeries = több LPAR = több rendszer és dinamikusan lehet a processzort és a memóriát pakolni egyik LPARból a másikba. S mindez automatizálható. (pl: minden este vegye el az A LPARtól a 2 procit és tolja hozzá a B-hez)
Ja és maga a Power architektúra azért elég erősen hegyezett DB-khez, vállalatirányítási rendszerekhez és hasonló dolgokhoz.

A többmagos programozásról:
Az IBM megalkotá a Cellt és látá annak gondjait.
Az IBM megalkotá az XBox processzorát is és annak is látá ütemezési gondjait.
Az IBM megnézé a 8-16-32 magos rendszerek esetében fellépő ütemezési problémákat és felüvölte:
Legyen egy processzor brutális, de maximum 4 maggal. Mert ahhoz még nem kell AI, hogy átlásd a szálkezelést.
A mérnökök meg fúrtak-faragtak és kijöttek egy processzorral amiről azt mondják, hogy dupla órajelen kisebb az áramfelvétele mint a Power 5-nek.

Az Apple meg többek közt azért ment át Intelékhez, mert ugyan megvolt a Power 5 architektúra és látszott már a Power5+ is, de nem akkora energiafelvétellel amit az egyszeri felhasználó tolerált volna. (A vörös izzásban lévő laptopok kevéssé vonzóak.)

S nem vagyok nagy guru de tudom:
Megvan a helye ennek a rendszernek, a HP és a Sun felkötheti a gatyót.
Igen valószínű, hogy a pSeries és iSeries mellett az OpenPower architektúrában is bemutatkozik.
S igen, az imádott(?), de mindenképp sztárolt AMD/Intel rendszereknek is megvan a maguk helye. Csak nem biztos, hogy egy nemzetközi multi teljes logisztikai folyamatait ellátó clusterben...

"A többmagos programozásról:
Az IBM megalkotá a Cellt és látá annak gondjait.
Az IBM megalkotá az XBox processzorát is és annak is látá ütemezési gondjait.
Az IBM megnézé a 8-16-32 magos rendszerek esetében fellépő ütemezési problémákat és felüvölte:
Legyen egy processzor brutális, de maximum 4 maggal. Mert ahhoz még nem kell AI, hogy átlásd a szálkezelést."

:))
Már bocs...

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o

Igen. Lehet rajta mosolyogni.

A sok szál és sok processzor a nem párhuzamosítható feladatoknál értelmetlen.
A programozó feladata, hogy a feladatot sok párhuzamosítható részfeladatra bontsa. S akkor egy tipikus feladat:
Előre nem tervezhető számú tábla inner joinos SQL lekérdezése szűréssel és csoportosítással 16 egyidőben befejeződő párhuzamos szálra bontása.
Ha bármelyik szál később fejeződik be a többi szál a "későre" vár.

Majd ehhez vedd hozzá, hogy megintcsak megjósolhatatlan számú SQL művelet párhuzamosan esik be és ezeknek is egyszerre kellene végetérnie, mert ugye a tranzakció atomi művelet.

S akkor még csak az adatbázisról szóltunk két szót. E fölött még hever egy alkalmazás amelyik használja az adatbázist.

Tessék...

S még mondja valaki, hogy nem kell fekete kakas az informatikához!

Félreértesz...
Nem a többszálas programozás nehézségeit becsülöm le.

De ez a "megalkotá a Cell"-t stb szöveg, hát.... hogy is mondjam, nevezzük naív-nak. :)
Egyszerűen pl a power6 illetve a Cell jószerivel összehasonlíthatatlan.
Kb annyi közük van egymáshoz, mint egy trolinak egy villamoshoz.

(Mellesleg a fejlesztés nyilván párhuzamosan folyt...)

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o

A CELL és a Power6 fejlesztésében elég erős párhuzam van. Pl. a CELL-t 5.2 GHZ-es órajelre fejlesztették ki (igen a Sony csak a 3.2-es változatot használja, gondolom kihozatal, fogyasztás, stb.) és azért megizzadtak érte rendesen, a Power6 innen már csak egy csíkszélesség váltás lehetett és persze a proci újratervezése az új technológiai lehetőségekkel.

"A CELL és a Power6 fejlesztésében elég erős párhuzam van."
"Power6 innen már csak egy csíkszélesség váltás lehetett és persze a proci újratervezése az új technológiai lehetőségekkel."

"Csak"?
Akkor hol a párhuzam?
Ugyanazt az eljárást (SOI, magas k állandó, stb. stb.) használják?
Ezzel az erővel az új Opteron, és a Cell, Power6 között is erős a párhuzam...

"Csak egy csíkszélesség váltás"? Az a bizonyos csíkszélesség váltás jelent kb mindent ami technológiai fejlesztés.

"és persze a proci újratervezése"
Tehát te ezt úgy gondolod, fogták a Cell-t, kidobálták belőle az SPE-ket, az EIB-t, a memória vezérlőt, tehát mindent kivéve a PPE-t, azaz a mag 80%-át, majd fogták ezt a Power4 like PPE-t, kivették belőle a Cell specifikus dolgokat, szélesítették, megduplázták a magok számát, és beleraktak mindent ami ehhez kell, új memóriavezérlő, cache meg amit akarsz...
Gondolom egy délután alatt megvolt...

Szerintem felejtsd el a cell-t, mint közvetlen elődöt...

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o

Adott árért. Erről szólt a kérdés. Én pedig erre azt mondtam, hogy adott árért -amennyiben megfelelő alkalmazásod van- nagyobb teljesítményt tudsz elérni egy x86-os összeállítással.

Persze nyilván a feladat határozza meg az eszközt, és vannak olyan területek, ahol ez jobb választás lehet. De az én meggyőződésem attól még az, hogy az alkalmazások egyre inkább készek az ilyen többgépes működésre és ha ez teljesül, jobban járhatsz vele.

Ezeknél a gépeknél alapvetően processzor poolokban kell gondolkozni mivel az estek döntő többségében egy ilyen gépen több logikai partíció (LPAR) megy. Ezeknek pedig 0.1 -es lépésekben lehet a pool-ból processzort adni akár a terhelés függvényében dinamikusan is. Mindamellett egy p vagy i sorozatú gép (mivel ezek már lényegében ugyan arra a vasra épülnek) skálázhatóságban, rendelkezésre állásban messze felülmúlnak akármilyen xeon -os gépet. Arról nem is beszélve hogy ugyan abból az árból lehet zsákszám pakolni a xeonokat, de majd nézzük meg utána az alkalmazás liszenszköltségét.

Ismétlem: megfelelő szoftverkörnyezettel skálázhatóságban és rendelkezésre állásban semmi nem veri a sok gagyi PC-t. És árban sem.
Minden csak alkalmazás kérdése.

Ez sehol sem jelenti azt, hogy nincs olyan hely, ahol életképtelen egy ilyen megoldás. Vannak ilyen helyek, vannak ilyen elavult szoftverek. :)

Természetesen lehet a rendelkezésreállást javítani különböző alkalmazásokkal, csak ilyenkor már erőssen felmerül a költségtényező, mivel ezekre a liszensz és support költség nem egyszeri hanem folyamatos kiadást jelenthet. A különböző GNU -a megoldások meg enterspájz környezetben általában eléggé esélytelenek pontosan a support hiánya miatt, és azért nem sok vállalat fog még pluszban fejlesztőket tartani hogy ezeket karbantartsák. Köztudott hogy egy projektnél általában a vas költsége a legkisebb. A vas karbantartási költsége is optimálisabb egy nagyobbnál mint több kisebb gépnél.