Sziasztok,
Van egy HS21-es balde szerverem ami folyamatosan segfaultol.
2 napig futott rajta a memtest, de nem talált hibát.
CPU okozhat ilyesmit? Esetleg maga az alaplap? Memória az első számú gyanúsított nálam, de a hibátlan memtest után kissé bizonytalan lettem.
Vmi ilyesmit csinál:
ltsp-build-clie[6866]: segfault at 00000000001914d6 rip 000000000042b6f2 rsp 00007fff793507d8 error 6
ltsp-build-clie[7104]: segfault at 000000000059c706 rip 000000000042b6f2 rsp 00007ffff5f2caf8 error 6
ltsp-build-clie[7111]: segfault at 000000000059c706 rip 000000000042b6f2 rsp 00007ffff5f2caf8 error 6
ltsp-build-clie[7189]: segfault at 00000000001914d6 rip 000000000042b6f2 rsp 00007ffff5f2b358 error 6
ltsp-build-clie[7226]: segfault at 00000000001914d6 rip 000000000042b6f2 rsp 00007ffff5f2b358 error 6
debootstrap[7671]: segfault at 00000000001914d6 rip 000000000042b6f2 rsp 00007fff4a3bb188 error 6
debootstrap[7700]: segfault at 00000000001914d6 rip 000000000042b6f2 rsp 00007fff4a3ba318 error 6
debootstrap[7860]: segfault at 000000000059cb06 rip 000000000042b6f2 rsp 00007fff4a3bbc08 error 6
debootstrap[7911]: segfault at 00000000001914d6 rip 000000000042b6f2 rsp 00007fff4a3ba0c8 error 6
Előre is köszi a tippeket/véleményeket!
Zoli
- 1260 megtekintés
Hozzászólások
Osszekeveredett vagy serult libek?
Szerintem szinte biztos nem hw gond.
==
`Have some wine,' the March Hare said in an encouraging tone.
Alice looked all round the table, but there was nothing on it but tea.
- A hozzászóláshoz be kell jelentkezni
Teljesen friss telepítés.
És ezt csinálja CentOS-el és Debiannal is. Sőt, egy működő rendszerből este átpakoltam bele a winchestereket, még azzal is segfaultol.
Tuti hw, csak ötletünk sincsen h. mi lehet...
Zoli
- A hozzászóláshoz be kell jelentkezni
Szerintem ne várj csodára, hanem vesd bele magad a régi, de bevállt módszerbe: amit csak lehet, egyesével cseréld ki, amég ki nem bukik a bibi....
Tudom, hogy piszkosul uncsi, de be szokott jönni.
- A hozzászóláshoz be kell jelentkezni
Nincs benne valami ILOM chip, aminek az event logjában látszik valami?
- A hozzászóláshoz be kell jelentkezni
Blade-ben? Persze hogy van, de az volt az első amit néztünk, de semmit sajnos :(
- A hozzászóláshoz be kell jelentkezni
"Blade-ben? Persze hogy van,"
Ezért kérdeztem.
Viszont ha egy nyamvadt ECC-error sem jelent meg a logban, akkro lehet, hgoy mégsem memória...
Sőt.
Lehet még akár CPU, alaplap.
- A hozzászóláshoz be kell jelentkezni
Dupla...
- A hozzászóláshoz be kell jelentkezni
Sőt, érdemes lehet a CPU-n lecserélni a hővezető pasztát.
(Persze a CPU-hőmérséklet árulkodó lehet...) :)
...vagy akár a tápegység is lehet problémás.
- A hozzászóláshoz be kell jelentkezni
ilyen hibak eseten( memoria, cpu melegszik, stb) a kernelnek is fejre kene allni, nem?
- A hozzászóláshoz be kell jelentkezni
Nem feltétlen... persze idővel biztosan, a keletkezett hibák mértékétől függően...
No meg a gép is pl. olyankor melegszik, amikor jobban terhelem, akár viszonylag nagy mértékben (ill. gyorsan) is változhat a hőmérséklete.
A tápegység okozta hiba pedig elég rapszodikus tud lenni...
- A hozzászóláshoz be kell jelentkezni
A memóriával kezdd. Látam már olyat, hogy a memteszt napokig futva is jó volt, de a csere után minden nyűg megszűnt. Senki ne kérdezze, hogy miért ne mutatta meg a memtest86 a problémát.
- A hozzászóláshoz be kell jelentkezni
+1
nem egy ilyet láttam én is.
- A hozzászóláshoz be kell jelentkezni
Thx, ezt fogom tenni szerintem. Első körben, aztán jön a csere-bere.
- A hozzászóláshoz be kell jelentkezni
+1
Nálam is volt olyan, hogy egy gép 10-14 nap alatt fagyott...
Memtest persze nem futott ennyi ideig, bár elvileg a RAM-ot valamivel jobban piszkálnia kellett... :)
Azóta (kopp-kopp) még nem volt gond. :)
RAM-ot cseréltem benne + még egy IDE kábelt "végső elkeseredésemben", de nem az utóbbival lehetett a gond...
- A hozzászóláshoz be kell jelentkezni
Mindig a ltsp-build-clie es debootstrap processek szallanak el vagy mindig mas? "grep segfault /var/log/messages"
- A hozzászóláshoz be kell jelentkezni
Debianon pont ezt szállt el. Centos-en volt h. az ifconfig eth0 up szállt, volt h. a dhcp server, tehát toltál random a dolog.
- A hozzászóláshoz be kell jelentkezni