Hello!
Az egyik gépünk 2 napja meghibásodott, a jelenség: I/O errorokat dobál a konzolra (én nem voltam ott, nem láttam), syslog szerint megpróbálja újraépíteni a szétesett SW RAID0-t, de már nem fejezi be, log megszakad, ezt követően nem lehet helyi konzolon bejelentkezni, de a PING-re válaszol a gép, apache is fut, 404-et ad -> kihullott alóla a filerendszer.
Van benne egy 250GB-s SATA, és egy 120-as PATA merevlemez, a SATA egy 120GB-os partíciója és a PATA egyetlen szintén 120-as partíciója van egy RAID0-ban.
A RAID-ből a SATA merevlemez partíciója esett ki, a gépet újraindították. Utána a RAID az alábbi állapotban volt:
http://molnarp.pastebin.com/m5ffc6e99
A RAID-et kézzel újraépítettem, amit be is fejezett, ezt követően ismét I/O üzenetek szórása, és fagyás, log szakadás.
A konzolon nem tudom mi volt, nem láttam, de a syslogban ez:
http://molnarp.pastebin.com/m4ca00a4f
http://molnarp.pastebin.com/m7077c1d7
Nyomtam rá egy badblocks-t (read only test), ebbe is belefagyott, ugyanaz került a logba, mint fent.
El is könyveltem magamban, hogy OK, szar a winyó, badsectoros. Utána pár órát állt a gép, bootoltam live cd-ről, badblocks, a winyó hibátlan, hibaüzenet nincs. Majd pár óra használat után megint megjelentek.
Kérdésem: ez most merevlemez hiba, vagy SATA vezérlővel lehet baj? Arra tippelek, hogy a melegedés okozhat ilyet...
Ugyanis, ha már ment egy ideig a gép, akkor live CD-n is ugyanezek a hibák kerülnek a logba.
SMART-ot néztem, nem jelez hibát, de a SMART adatok olvasásakor is jelentkezik a hiba.
(oprendszer: debian etch)
Petya