Sziasztok! Van egy ilyen hiba üzenetem:
Dec 10 21:59:25 ata5: failed to resume link (SControl FFFFFFFF)
A szerver folyamatosan irkálja kifelé úgy is ha nem vagy bejelentkezve! De ha csak ssh-n kapcsolódom fel se tűnik, mivel minden működik! Mi lehet ez a hiba?! Hogyan lehet ezt megoldani?!
- 1763 megtekintés
Hozzászólások
A szerverbe van egy MV88SX6041 4-port SATA II PCI-X Controller típusú Vezérlő kártya, amire két winchester van rádugva egy 1 terás és egy 650 gb -os, Ha újra indítom megy egy darabig, de aztán újra előjön ez a hiba:S
Ezek vannak kern.log fájlba mielőtt elkezdi ezt a hibát kiírni:
[27907.329615] Uhhuh. NMI received for unknown reason a1 on CPU 0.
[27907.329615] You have some hardware problem, likely on the PCI bus.
[27907.329615] Dazed and confused, but trying to continue
cpqphp: power fault interrupt
cpqphp: power fault bit 1 set
ata5: Unable to stop eDMA
ata5.00: exception Emask 0x52 SAct 0x1 SErr 0xffffffff action 0xe frozen
ata5: SError: { RecovData RecovComm UnrecovData Persist Proto HostInt PHYRdyChg PHYInt CommWake 10B8B Dispar BadCRC Handshk LinkSeq
ata5.00: failed command: WRITE FPDMA QUEUED
ata5.00: cmd 61/10:00:cf:1d:3c/00:00:25:00:00/40 tag 0 ncq 8192 out
res 40/00:ff:00:00:00/00:00:00:00:00/40 Emask 0x56 (ATA bus error)
ata5.00: status: { DRD
[36297.052005] ata5: Unable to stop eDMA
[36297.082200] ata5.00: exception Emask 0x52 SAct 0x1 SErr 0xffffffff action 0xe frozen
[36297.082617] ata5: SError: { RecovData RecovComm UnrecovData Persist Proto HostInt PHYRdyChg PHYInt CommWake 10B8B Dispar BadCRC Handshk LinkSeq
[36297.083244] ata5.00: failed command: WRITE FPDMA QUEUED
[36297.083484] ata5.00: cmd 61/10:00:cf:1d:3c/00:00:25:00:00/40 tag 0 ncq 8192 out
[36297.083486] res 40/00:ff:00:00:00/00:00:00:00:00/40 Emask 0x56 (ATA bus error)
[36297.084183] ata5.00: status: { DRDY }
[36297.084379] ata5: hard resetting link
- A hozzászóláshoz be kell jelentkezni
Esetleg vkinek vmi ötlet?! Hogyan is essek neki?! Vagy a kártya nem volna kompatibilis a szerveremmel?! De akkor miért megy egy fél napot vele?!
- A hozzászóláshoz be kell jelentkezni
Milyen OS van rajta, nincs-e melege a kártyának,
kábel, a szokásos kérdések ilyenkor.
Bios frissítve volt-e a lapon?
Csak az egyik hdd esetében van hiba?
Esetleg 3-4 perces másolás után befigyel-e hasonló hiba?
- A hozzászóláshoz be kell jelentkezni
Milyen OS van rajta: Ubuntu 10.04 LTS
nincs-e melege a kártyának: 25-28 fok körül mocorog
kábel: 50cm-es sata kábellel van kivezetve a külső rackban található winchesterekhez
Bios frissítve volt-e a lapon: Nem frissítettem!
Csak az egyik hdd esetében van hiba: Ha csak egy volt benne akkor is fenn állt a hiba!
Esetleg 3-4 perces másolás után befigyel-e hasonló hiba: Másoltam fel rá semmi gond nem volt. Párórával utána másoltam a másik winchesterre akkor lépet fel a probléma!
Érdekesség, hogy weben keresztül elérem a php által kilistázott fájlokat a külső winchestereken!
- A hozzászóláshoz be kell jelentkezni
ezek kicsit régiek, de úgy látszik akkor megoldódott a probléma:
http://www.ady-nagyatad.sulinet.hu/~vajdazs/mvsata.html
http://hup.hu/node/17151
- A hozzászóláshoz be kell jelentkezni
Ez is érdekes:
Uhhuh. NMI received for unknown reason a1 on CPU 0.
[27907.329615] You have some hardware problem, likely on the PCI bus.
[27907.329615] Dazed and confused, but trying to continue
cpqphp: power fault interrupt
cpqphp: power fault bit 1 set
Most a kérdés az, hogy a kártya bolondítja meg a rendszert,
vagy az alaplap esik össze.
http://bink.nu/forums/t/7678.aspx -- ez win
https://bugzilla.redhat.com/show_bug.cgi?id=660346
- A hozzászóláshoz be kell jelentkezni
Igazából ez számomra is kérdés!?
- A hozzászóláshoz be kell jelentkezni
Kollega is belefutott a Marvell rejtélybe:
http://www.spinics.net/lists/linux-ide/msg35547.html
- A hozzászóláshoz be kell jelentkezni
Örülök, hogy nem vagyok Te.
PCI-X cuccokkal lehet sokat szívni.
BIOS-ban próbálhatsz állítgatni PCI paramétereket, de sajnos azzal szarabb is lehet.
Sajnos egy másik kártya kipróbálását javaslom, ha nem lát el a már meglévő valami speciális feladatot. Úgy sejtem, hogy helyettesíthető. Csak persze olcsóbb nem lesz...
"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."
- A hozzászóláshoz be kell jelentkezni
Tehát az volna a legjobb megoldás ha kicserélném a kártyát?! Más alternatíva nincs?!
- A hozzászóláshoz be kell jelentkezni
This is a hardware problem. The operating system cannot be expected
to continue to function properly when there are disk controller errors.
https://partner-bugzilla.redhat.com/show_bug.cgi?id=235336
http://www.justlinux.com/forum/showthread.php?t=149327
Hátha segít.
- A hozzászóláshoz be kell jelentkezni
A következő hét elején szabadulok be a szerverterembe szerintetek mivel kezdjem akkor a probléma orvosolását? A szerver és a kártya cseréje nélkül értem én!
- A hozzászóláshoz be kell jelentkezni
Vkinek vmi jó javaslat?!
- A hozzászóláshoz be kell jelentkezni