EDAC problema(?)

Fórumok

memoria ize, jobb hijjan ide.

van egy dzsunkaszerverunk, 24g ram, 2xE5405, vmi olyan asus alaplappal, amibe ezek pont belemennek (a pontos tipus most terben es idoben is messze van, sajnos), de van benne az lspci szerint egy ilyen:

00:00.0 Host bridge: Intel Corporation 5000V Chipset Memory Controller

nomarmost, deb/lenny/oobkernel azt mondta tegnap este, hogy (\-ek nelkul, egy sorban, ertelemszeruen):


[1004974.629079] EDAC MC0: UE row 3, channel-a= 0 channel-b= 1 labels "-": \
(Branch=0 DRAM-Bank=7 RDWR=Write RAS=7507 CAS=0 FATAL Err=0x4 \
(>Tmid Thermal event with intelligent throttling disabled))

rakeresve erre - inet, google, rtfm: mondanak mindent a felhasznalok a "mindjart osszedol a vilag"-tol kezdve hogy "ah, csak szedd ki a i5000_edac kernelmodul-t es ne is foglalkozz az egesszel"-ig.

valami hasonlot latott valaki? mennyire kell aggodni a miert ilyenkor?

thx, a

Hozzászólások

Hát az EDAC elvileg arra lenne, hogy a memória hibákat jelezze. Hogy mondjuk lássad, amikor az ECC elkezd dolgozni és időben kidobd a memóriát mondjuk.
Ilyenem nem volt, de EDAC-os rendszeren volt olyan jelenség, ami nekem alaplap és memória csere után szűnt meg.
Ha kiveszed a modult, akkor tényleg nem fogod látni a hibaüzenetet.

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

aha, ertem, koszonom. tehat ebbol a fenti uzenetbol aka'r me'g azt is ki lehetne sakkozni hogy a 6x4g modulbol melyik az ami rossz? ez azert hasznos lenne, csak igy hirtelen nem latom. persze rtfm, ra' is keresek majd.

asszem a 2 procihoz 1-1 3-as blokk tartozik, mindegyikbe 4g-s ecc modult tehetsz maximum, igy jon ki a most is benne levo" 24g.

up? esetleg, hogy a fenti uzenetbol hogyan lehet kiszedni azt az infot, hogy melyik modul is a rossz...? thx, a.