[MEGOLDVA] HP P410i Raid Controller error

Fórumok

Hali,

olyan problemam van kozel 2 napja a szerveremmel, hogy egyik pillanatrol a masikra eldobja a diskeket a raid kartya. A jelenleg futo ESXI verziom 6.0.0 (Build 3620759) es egy HP Proliant DL380G6os szerverben uzemel.Battery van hozza, 512MB cache van rajta.

Reboot utan visszaall minden a rendes allapotra megy kb 1orat aztan ujra eldobja a diskeket.

6DB disk van rakotve, ebbol 4db raid5, es masik 2db csak siman. A raid5os diskek hp SAS lemezek, a masik 2 sima 2,5"os hdd.

https://www.dropbox.com/s/pk0z6bfmgnmqaeg/Screenshot%202016-11-02%2012…

Hozzászólások

Firmware ugye frissítve van 6.64-re, és a diszkeken is a legújabb firmware van?

Van valami halvány emlékem kb. 5 évvel ezelőttről, hogy az 5.x-es verziónál volt valami olyan nagyobb változtatás, hogy több lépésben kellett frissíteni, nem lehetett átugrani bizonyos verziókat. De ez már k.rva régen volt :)

Az a "2 sima diszk" egyébként SAS vagy SATA? Mert a 6.62 verzióig bezárólag volt például olyan bug, hogy bizonyos SATA parancsok (beleértve pl. SMART lekérdezést) garantált controller panic-ot okozott.

1.x-ről talán fel bírsz mászni 3.x-re, onnan talán 5.x-re, és arról 6.x-re, de ez csak tipp. Az utóbbi időben több tucat használt-bontott G6-os gépet láttam, de mindegyikben legalább 5.x verzió volt, talán egy olyat láttam, amiben 3.x.

Az biztos, hogy el kellene jutnod a 6.64-es firmware-ig, mert még az egyes 5.x verziókban is többszázas mennyiségben voltak kritikus hibajavítások.

Ha van nem-HP diszk, akkor azokat első körben dobd ki a gépből. Frissítsd a HP diszkek firmware-ét is, és ha minden naprakész, és a rendszer stabil, akkor próbálkozz be a két nem-HP diszkkel.

Úgy egyébként az a két SATA diszk az mi? Valami notebook diszk? Azt lehet, hogy mindenképpen ki fogja dobni, mert a desktop/notebook diszkeknek általában nagyobb az error correction és command timeout értéke, mint amit a RAID vezérlők tolerálnak. (Vegyél használtan szerverbe szánt diszkeket, mégpedig lehetőleg HP-t, mert a RAID vezérlő és a diszk firmware "összejátszik".)

60%os CPU loaddal 6lemezzel meg 85%os ram hasznalat mellett 210-230Wot fogyaszt,

Ha mar ennyien irtatok, megkerdeznem hogy erdemes e penzt olnom ebbe a vasba es upgradelnem a 6magos xeonokra, meg 72GB ramra, vagy erdemesebb lenne egy G7et beszerezni, hosszutavon az jobban megerne-e

freeoli: az éves költségem rá kb 200-250kHUF korul van, nemtudom mennyi egy G7 de utananezek, koszonom a tanacsokat

G6-ról G7-re már ne upgrade-elj. Ha fontos a több CPU, akkor érdemes a 6 magos X-eseket megpróbálni, de ott a TDP is 95W lesz per cpu, minimum és szintén minimum a BIOS frissítés is. Amire érdemes esetleg pénzt áldozni, az mondjuk a 750-es vagy 1200-es goldos tápok helyett 460W-os platinások. Memóriát is érdemes L-esre cserélni ha van keret, bár az is relatív komoly kiadás.

L-es memóriánál csak annyit kell számításba venni, hogy nem megy velük a BIOS szintű memória sparing, mirroring és lockstep redundancia. Azt csak a nem L-es memóriákkal hajlandó csinálni. Bár ha arról van szó, hogy ki kell maxolni a memóriát, akkor meg nem fogja használni ezeket a redundancia feature-öket.
Van pár 2Gb-os L-es memóriám elfekvőben, bár az túl kicsi kapacitású a kimaxoláshoz.
Kimaxolásnál még azt is kell nézni, hogy milyen a ranking-je a memóriának. Pl. Xeon 5600-as sorozatnál quad rank modulból csak 6-ot képes kezelni processzoronként. 18 modulhoz dual rank modulok kellenek.
https://www.kingston.com/us/business/server_solutions/best_practices/ma…

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

Igen, a linked aktuális a delikvensnek.

3 csatornás memória vezérlővel rendelkező processzorokkal szerelt szerverekhez volt jó pdf-je is a HP-nak, ahol le is volt írva, hogy milyen kombinációkban milyen sebességgel hajtja a memóriákat. Vagy lehet, hogy az Dell volt...

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

Az első dologgal kapcsolatban elbizonytalanodtam, mert visszagondolva egy olyan rendszeren tapasztaltam ezt, ahol a processzor és a memória is low voltage változat volt. A BIOS-ban nem volt elérhető ez a rész. Ugyanolyan alaplap rendes processzorral és memóriával pedig mutatta. Kisebb nyomozás után derült ki, hogy a low voltage miatt van. De már bizonytalan vagyok, hogy a processzor, vagy a memória volt ebből a szempontból a döntő. Vagy mindkettő.

A ranking-gel kapcsolatban is elég rendszerfüggő, hogy mit enged és mit nem.

http://www.dataram.com/blog/?p=32
"Each channel supports no more than 8 ranks of memory. Simply put, no more than 12 quad-rank DIMMs can be installed in these servers. To utilize all available slots in servers with 16 or 18 DIMM slots, the use of dual-rank DIMMs is required."

https://www.dell.com/downloads/global/products/pedge/poweredge_12th_gen…
9. oldalon, 2. táblázat: RDIMM (4R) - Limited to 8 ranks in a channel
Mivel rendszer függő, meg kell nézni, hogy az adott gépre vonatkozik-e esetleg hasonló korlátozás. Mondjuk a korábbi posztban linkelt memória konfigurátor segít abban, hogy invalid kombinációt ne válasszon az ember.

Mielőtt a sinlge rank-et tartanánk a legjobbnak, egy IBM dokumentum szerint:
"Dual-rank DIMMs offer better interleaving and hence better performance than single-rank DIMMs."

Disclaimer: nem vagyok hivatásos mérnök

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."