Controller Memory Soft ECC Error Corrected

Controller Memory Soft ECC Error Corrected

Hozzászólások

Üdv!

Egyik távolról felügyelt szerveren a következő üzenetet kapom pár napja:

kernel: DAC960#0: Controller Memory Soft ECC Error Corrected

A vas egy Mylex AcceleRAID 352. Naponta 3-10 kozott mozog a hibaszám. Mivel eddig ilyen nem volt, ezért aggaszt a dolog. Mennyire számít ez kritikusnak? Rohanjak memóriát cserélni?

[quote:ee6c6503ce="xoraxax"]Üdv!

Egyik távolról felügyelt szerveren a következő üzenetet kapom pár napja:

kernel: DAC960#0: Controller Memory Soft ECC Error Corrected

A vas egy Mylex AcceleRAID 352. Naponta 3-10 kozott mozog a hibaszám. Mivel eddig ilyen nem volt, ezért aggaszt a dolog. Mennyire számít ez kritikusnak? Rohanjak memóriát cserélni?

A Soft Error azt jelenti ECC kornyezetben, hogy valami hatasara egy bitnyi javithato hiba keletkezett a memoriaban. Szerencsere az ECC logika a hibat tudja korrigalni. Ilyen hiba keletkezhet barmitol, egyesek szerint akar erosebb naptevekenysegtol is. Viszont ha ez gyakori akkor nem csak veletlenrol van szo. A HP-nal ha a Systems Insight Manager ECC javitast regisztral, akkor az adott alkatreszre mar ervenyesitheto a Prefailure garancia. Azaz a HP komolyan veszi a Soft hibat is. En a helyedben cserelnem az alkatreszt. Foleg akkor, ha ez egy raid vezerlo cache memoriaja...

Jaja, alfa részecskékre szokták kenni a dolgot (ha eltalálja a sziliciumot, amin a foton energiájától módosul a töltés, ami egy DRAM cella esetén bit állapotváltáshoz vezet). Nincs a közelben sugárzó anyag (ex-szovjet szomszéd?), netán valami uránbánya/erőmű, esetleg lokális napkitörés... :)