Új szuperszámítógép-rendszert vásárolt az Egyesült Államok az időjárás-előrejelzés támogatására

 ( trey | 2009. szeptember 14., hétfő - 9:38 )

Az Amerikai Egyesült Államok frissítette azt az időjárás-előrejelzési modellek készítésére használt szuperszámítógép-rendszerét, amelytől a meteorológusok munkája oly mértékben függ, hogy a kiesés nem engedhető meg. Éppen ezért két, teljesen egyforma rendszert állítottak üzembe. A nevük: Stratus és Cirrus.

Az amerikai kereskedelmi minisztérium kötelékébe tartozó Nemzeti Éghajlati Adatközpont (NOAA) (angolul: National Oceanic and Atmospheric Administration) rendszere augusztusban állt munkába. Két szuperszámítógépből álló rendszer körülbelül 5 000 IBM Power6 processzort tartalmaz és AIX operációs rendszert futtat.

A két különböző földrajzi helyen felállított rendszer egymásnak tökéletes tükörképe. Ha a Stratus valamilyen oknál fogva meghibásodik, a Cirrus perceken belül képes képes átvenni a munkáját.

A rendszer egy, az IBM-mel kötött 180 millió dolláros szerződés eredményeként került a NOAA-hoz, ahol egy Power5-alapú rendszert váltott le.

A rendszer körülbelül 70 TFLOPS-ot képes teljesíteni és ezzel valahol az 50. helyre került a világ leggyorsabb szuperszámítógépeit összesítő listán.

A részletek itt olvashatók.

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Ez mind szép. Amit nem értek: "körülbelül 5 000 IBM Power6 processzort tartalmaz". (Az angol változatban is ez szerepel.) Segítsek megszámolni?

A cikk végén van egy utalás, amiből arra következtetek, hogy a rendszer még nem került teljes egészében kiépítésre ("Stratus/Cirrus will be delivered"). Lehet, hogy még nincs meg a végleges szám?

--
trey @ gépház

És hogy csinálod? Beírod, hogy htop és számolsz? ;)


-- "Bízzál Istenben és tartsd szárazon a puskaport!" - Cromwell --
-- Sayusi Ando - http://sayusi.hu --

A hagyományos módszerre esküszöm: kártyákat kihúzom és számolok :-)

Egyébként a top500-ban a mostani 50. kb. 6600 processzort tartalmaz. Ebből úgy saccolom, hogy a kb. 5000 db a mostani 70 TFLOPS rendszerre vonatkozik.

[hscroot@noaa-hmc]$ lslpars |grep Running|wc -l :)
____________________________________
Az embert 2 éven át arra tanítják hogyan álljon meg a 2 lábán, és hogyan beszéljen... Aztán azt mondják neki: -"Ülj le és kuss legyen!"..

lslpars parancs Power4 (HMC 3.X) ota nincs.

--
As above, so below

[hscroot@noaa-hmc]$ for i in $(lssyscfg -r sys -F name);do lssyscfg -r lpar -m $i -F name;done|sed -n "$="

* Rájöttem, hogy wc parancs sincs :))
____________________________________
Az embert 2 éven át arra tanítják hogyan álljon meg a 2 lábán, és hogyan beszéljen... Aztán azt mondják neki: -"Ülj le és kuss legyen!"..

man grep

mi a bajod a sed-el? :)
____________________________________
Az embert 2 éven át arra tanítják hogyan álljon meg a 2 lábán, és hogyan beszéljen... Aztán azt mondják neki: -"Ülj le és kuss legyen!"..

,,Stratus/Cirrus will be delivered as part of the final phase of a nine-year contract with IBM.

Separately, Cray Inc. said today that it has signed a $40 multi-year contract to provide the Korea Meteorological Administration with a Cray XT5, which uses Linux and Advance Micro Devices (AMD) Opteron chips.

That system is expected to have a peak performance of 600 TFLOP, which would make it one of the fastest systems in the world.''

Külön cikk lesz a tervek szerint.

--
trey @ gépház

Oké, akkor nem szóltam :)

Én adok érte 50 dollárt is, megkapom? :-)

copy-pasteltem, szóval vagy kimaradt vagy tényleg elírták az eredeti cikkben is :-)

Izmos gép. Mostanában már nem, de annó én is írtam olyan progit ami egy átlag pc-n hetekig futott (volt olyan kezdeti feltétel ahonnan hónapokig is, de annak sok haszna nem volt mert egy csomó dolog 1-2 perc gondolkodással kiszűrhető), ami erre az 5000+ procit tartalmazó rendszerre totál alkalmatlan lenne mert teljesen thread-eletlen, de kíváncsi lennék, hogy erre a gépre megírva hány perc/másodperc lenne.

Én is írtam anno olyan progikat, amik pc-n turbo pascalban nem futottak le a 64k-s szegmenslimit miatt, vaxon meg igen:)))

Hely a régi szép idők :) 64K felső limit. x.com kapásból csak 64 k max. De rég volt.

Meg milyen jó, hogy vége! :)

Azt én nem mondtam, hogy baj lenne, hogy vége, de azért volt egy érzése ennek az időszaknak. Asm tudás nélkül mozdulni sem tudtál. Ott még tényleg kellet tudni gondolkodni.

viszont sajna most, hogy "nincs korlát", a programozók egy része (és növekvő) szarik az erőforrásokra. "majd lesz gép, amin fut" jeligére. szóval azért annyira nem jó, hogy vége (nem a kis erőforrásnak, hanem annak, hogy szorít a cipő egy új kódsor beírása előtt)

--
xterm

Azért aki manapság igényesen kódol, az tud írni kisebb erőforrás igényű dolgokat. Az egy más kérdés, hogy a szoftverfejlesztés is iparággá vált és itt is a minél gyorsabban, minél többet elv érvényesül évek óta.

az iparban a hatékonyság nem kerülendő szempont :) szerintem sokkal inkább az van, hogy már a hülye is programozik (nálunk egy beszállító "programozója" pl. egy földmérő. hát lehet, hogy földet mérni tud, de ordas nagy baromságokat csinál a programja...).

--
xterm

Adatot kell keresni (vagy mérni) a percore / percpu teljesítményre a PC-n amit használtál ill. erre a Power6 -os procira. Aztán saccolni. De attól függ mit csinál a progid, lehet hogy más dolgok is játszanak (memória sávszél, mittomén). Vagy írj nekik egy könnyező hangvételű levelet, "I'm a poor hungarian developer" kezdettel ;)

********************
"...ha nem tévedek!" (Sam Hawkens)
http://holo-media.hu

> Vagy írj nekik egy könnyező hangvételű levelet, "I'm a poor hungarian developer" kezdettel ;)

Azt a Jugene projektnek irhatsz. Ha eleg szep a level, naluk 'barki' kaphat gepidot.

Nagy konfigokat altalaban tobb lepcsoben szerelik ossze, es a vegleges valtozat pontos parameterei csak korulbelul ismertek....

Vizionálom magam előtt: "Te Pista! Hozz még egy zsák procit, ide még fér..." :)))

szerintem egyáltalán nem állsz messze a valóságtól, simán el tudom képzelni hogy a termet nem a géphez építik, hanem keresnek egyet, akkor meg ugye mindig marad egy szabad hely plusz egy szekrénynek a sor végén (vagy eleve odatesznek egypárat teljesen üresen, hogy jobban nézzen ki a sor:) ) , a projekt vége felé megnézik hogy alakultak a költségek és ha belefér még egy zsák alkatrész had szóljon :D

Én meg azt vízionálom, hogy egy ilyen szörneyeteg pontos teljesítményét nem bírják előre megmondani. A meteorológusoknak vannak bizonyos programjaik, amelyeknek bizonyos idő alatt le kell futniuk rajta.

Kipróbálják, aztán ha lefutott, akkor talált süllyedt, ha meg nem, akkor jöhet a következő zsák proci.

---
Science for fun...

Úgy érted, hogy a holnapi időjárás szimulációjának még ma le kellene futnia, különben mit sem ér? :)


suckIT szopás minden nap! István, a király - avagy az Apple rövid története képekben

Látom, sikerült ráérezned a dolog marketingértékére. :-)

---
Science for fun...

"a unix halott" vagy mi

desktoplinux vagy mi.

Azt irja a
http://www.emc.ncep.noaa.gov/annualreviews/2008Review/presentations/Kyger_EMC%20model%20reviewNCO.ppt
hogy:
69.7 Tflops
4992 darab cpu (156 darab 32 procis szerver)
4.7 Ghz power6
19712 gbyte ram (szamolva: 126.3 Gbyte/szerver)

Megjegyzes.
Ezek iszonyu nagy SMP rendszerek. (32 procis szerver). A metemokusok azt szoktak mondani, hogy az alkalmazasaik "termezetuknel fogva" rosszul skalazodnak MPP rendszerben (pvm/mpi programozasi modellben) emiatt igenyelnek jooo nagy SMP gepeket. Ez azert lenyeges kerdes, mert 16 darab 2 procis szerver sokkal-sokkal-sokkal olcsobb, mint 1 darab 32 procis szerver. Ha kiderulne, hogy az alkalmazas "termeszetenel fogva" megiscsak jol skalazodik egy sima 2 procis szerverekbol allo clusteren, akkor olcsobb lenne hozza a hardver (vagyis nagyobb gepet lehetne ugyanebbol a penzbol venni).
Pl a magyar metemokusok is egy jooonagy smp (jellegu:-) szervert vettek, meres es teszt utan.

Mellesleg, amiota kijott az intel nehalem, nem a 4.7 GHz power6 a leggyorsabb cpu, bar az az orajel megtevesztoen impozans ;) Viszont ez a power6 skalazodik a legjobban nagy SMP rendszerben (vagyis 32 cpu-bol kihozhato 1 cpu erejenek 31.8 -szorosa) gondolom ugyes numa ez is, de nem tudom.

Nezzunk egy specFP_rate erteket (spec.org, linpacknal pontosabb eredmeny a lebegopontos szamolasra, de csak 1 szervert jellemez)
1 szerver = 32 darab 4.7 Ghz power6 = 64 mag (dualcore)
specFP_rate2006 = 2100
iszonyu nagy ertek ez, xeon.opteron nem rug labdaba.

hogyan szoktam szamolni?

egy cpu (egy mag, egy szal) lebegopontos teljesitmenye a specFP2006. Azert, mert ez a legpontosabb meroszam, jobb mint a flops, palne, mint a hertz. Egy gep teljesitmenye meg a specFP_rate. mindkettot a spec.org publikalja. Amit a spec.org nem publikalt, azt nem veszem figyelembe, ezzel altalaban csak par honapot vesztek.

Nezzuk egy szalra:
csucs intel-nehalem: 50.8 specFP (xeon X5570)
csucs ibm-power6: 24.9 specFP (5.0 GHz power6)
csucs amd: 28.3 (opteron 8435)

lathatoan az intel-nehalem durvan a legerosebb. Mellesleg olcsobb is (durvan olcsobb), mint a power6.

Most nezzuk SMP gepekre: (specFP_rate2006 ertekek)

csucs intel-nehalem 4mag: 106 (xeon W3580)
csucs intel-nehalem 8mag: 211 (xeon W5590)
csucs intel-nehalem 16mag: 372 (xeon X5570, sgi altix krealmany)

[24mag nem jatszik, mert nehelembol nincs 6 magos, 32 mag nem jatszik, mert meg nincs nehalem-MP kiadva, es csak specialis NUMA-k vannak ilyen magszammal, amik nem igazan SMP kepesek. Mar a 16 mag sem teljesen smp]

csucs amd 4 mag: 60.4 (opteron 2389)
csucs amd 8 mag: 125 (opteron 2393)
csucs amd 12 mag: 147 (opteron 2439)
csucs amd 16 mag: 228 (opteron 8393)
csucs amd 24 mag: 287 (opteron 8439)
csucs amd 48 mag: 513 (opteron 8439)

csucs ibm 2 mag: 58 (4.7 Ghz power6)
csucs ibm 4 mag: 116 (4.7 Ghz power6)
csucs ibm 8 mag: 222 (5.0 GHz power6+)
csucs ibm 16 mag: 544 (5.0 GHz power6+)
csucs ibm 32 mag: 839 (4.7 GHz power6)
csucs ibm 64 mag: 2184 (5.0 GHz power6)

Ertekeles:
Ugyan az intel cpu-ja egy szalon erosebb, mint barmi mas, azonban egy SMP gep teljes ossz teljesitmenyeben az opteron megelozi, egyszeruen azert, mert opteronbol sokkal nagyobb gepet lehet osszerakni. Az ibm fele power6 meg egyszeruen leallazza mindket x86-64 cpu-t. Erre azt szoktul mondani, hogy az intel-nehalem a leggyorsabb cpu, azonban az opteron skalazhatosag szempontjabol jobb. A power6 meg az opteronnal is (sokkal) jobban skalazhato.

Mit ertunk skalazhatosag alatt?
Az SMP gep ossz teljesitmenyet osztjuk a magok szamaval, es igy megkapjuk az egy magra juto teljesitmenyt. Ezt hasonlitjuk ossze a tenyleg egy mag teljesitenyevel (illetve annak hianyaban a legkisebb tobbmagos gep teljesitmenyevel)

Skalazhatosag nezetek: (specFP_rate2006)
Intel xeon X5570:
4 mag: 103
8 mag: 203 (1.97 szeres javulas 2.00 helyett)
16 mag: 372 (3.61 szeres javulas 4.00 helyett)

AMD opteron 8439
12 mag: 146
24 mag: 287 (1.97 szeres javulas 2.00 helyett)
48 mag: 613 (4.20 szeres javulas 4.00 helyett)

IBM power6 5.0 Ghz
8 mag: 222
16 mag: 544 (2.45 szeres javulas 2.00 helyett)
64 mag: 2184 (9.84 szeres javulas 8.00 helyett)

Erre azt mondjuk, hogy 1) az opteron jobban meretezheto, skalazhato (ertsd nagyobbat lehet belole osszerakni) mint a xeon, es 2) architekturalisan jobb (kisebb a skalazasi veszteseg). Az IBM power6 jobban is meretezheto es architekturalisan is jobb, mint az opteron.
Egyebkent az architecturalis josag jelentkezik a meretezhetosegben, nem fuggetlen ez a ket fogalom.
Ha kijon a nehalem-MP, akkor lehet, hogy ebben a tekintetben is beeri/megelozi az opteront. Par ev mulva skalazhatosagban/architecturalis minosegben lehet, hogy az x86-64 verni fogja az itanium/sparc64/power processzorokat, azonban ezek meg egyenlore skalazhatosag szempontjabol sokkal jobbak, mint barmely opteron/xeon.