Széteső raid, hdd error?

Fórumok

Széteső raid, hdd error?

Hozzászólások

Milyen alaplapi sata és milyen BIOS beállítással?

Passz. A gépet (IBM x206) ssh-n érem el, BIOS-t nem látom.
A gép adatlapja e téren meglehetősen szűkszavú: "SATA modelleknél SATA adapter kártya, RAID1 képességű", így a típust se fogom tudni most megmondani.

Tudok valamivel esetleg hdd állapotot, elérési sebességet, tesztet futtatni, lekérdezni, vagy mittudomén?

[quote:ccdff4d49e="tlt"]A gépet (IBM x206) ssh-n érem el, BIOS-t nem látom.

Akkor hogy a nyavajába' cserélsz vinyót?

Erre 2 megoldás van. Vagy autokázom 200 km-t, vagy kicseréli a helyi ember.. :)

Vagy mindkettő..

De mivel tudom meg biztosan, hogy a hdd a hibás? Volt már vkinek a tisztelt fórumolvasók közül ilyen esete?

hello,

[quote:59878f774e="tlt"]De mivel tudom meg biztosan, hogy a hdd a hibás? Volt már vkinek a tisztelt fórumolvasók közül ilyen esete?

imho az üzenetek alapján majdnem biztos, h diszk hiba, de próbáld meg átnézetni az oprátorral a kábeleket, esetleg cserélje ki őket.

Táphiba kizárható? (esetleg nem gyenge a táp?)

(ezt viszont nem értem:
alaplapi sata raid, mdadm 1.9.0-4
most alaplapi raid-et használsz, vagy mdadm-et?)

a.

Van valami nem teljes értékű sata raid az alaplapon, ami elvégez egy-két műveletet (hétfőn megkérdem melyik típus), de az mdadm fut mellette. Én is meglepődtem, mikor megláttam anno..

SMART info

smartctl -a /dev/sda

SMART teszt

smartctl -t long /dev/sda

device-k ertelemszeruen behelyettesit

x206-ban az alaplapi 'RAID' egy ServeRaid 7e kártya szokott lenni, ami gyakorlatilag egy Adaptec HostRaid. Sima Fake/Soft Raid.
Ezért az mdadm.

Nagyon király. Ennyit a smart-ról. Illetve a HDD-ről... :(

[code:1:f95bf8c26d]
Device: ATA SAMSUNG SP2004C Version: VM10
Serial number: S07GJ10Y759082
Device type: disk
Local Time is: Sun Oct 9 10:01:32 2005 CEST
Device does not support SMART

Device does not support Error Counter logging
[/code:1:f95bf8c26d]

A smartctl tapasztalatom szerint nem viszi a sata vinyókat...

Még királyabb.. :)
Lefutattam közben a badblock-ot is, eredmény nélkül.
Egyéb lehetőség esetleg?

[quote:4b27cd1158="pete"]SMART info

smartctl -a /dev/sda

SMART teszt

smartctl -t long /dev/sda

device-k ertelemszeruen behelyettesit

Majd talán a 2.6.14-es kernelben valóban. Addig max ata passtru patch-el...

[quote:ebd89749a9="mpathy"][quote:ebd89749a9="pete"]SMART info

smartctl -a /dev/sda

SMART teszt

smartctl -t long /dev/sda

device-k ertelemszeruen behelyettesit

Majd talán a 2.6.14-es kernelben valóban. Addig max ata passtru patch-el...

omg. Ide,scsival hasznalom sata-ra (meg) nem jo?

Sziasztok.

Mondom a gondom.
Környezet:
Debian Sarge, kernel 2.6.12.6, alaplapi sata raid, mdadm 1.9.0-4.

3 db 200 GB SATA HDD, hdb és hdc RAID1-ben, hda az esetleges raid összeomlás, valamint még egy tartalék mentés érdekében naponta egyszer mountolva a backup könyvtárába, rsync-el mentés, majd unmount.

Egy hónapja megy a gép. Két nappal az indulás után 20.00 körül megállt, se kép, se hang. Ping megy, de semmilyen művelet nem megy, se ssh, se semmi. Rendszerterhelés az égben, load átlag 40 körül. Jó, restart, log átnéz, semmi, a kritikus időpontban egyetlen logba se történt bejegyzés. A restart után egyedül a mysql nyavajog, hogy az egyik adatbázissal van némi gondja, de iparkodik rendbe tenni. Az operátor szerint monitoron valami I/O volt hiba látható, de megnyugtat, van ilyen. Ejnye. Egyszer egy évben végülis kibirom, 5 perc kiesés nem túl nagy baj, pont benne voltam, kiszúrtam..

8 nappal ezelőtt 14.05-kor ugyanez a jelenség. Monitoron állítólag I/O hiba látható. A kutyafáját. SW watchdog fel, mert nem volt. Restart, boot rendben lefut. Gyanakvás hdd-re, mivel a logban ezidőtájt miegint semmi bejegyzés, egy fekete lyuk biztos magába szívta a bejegyzéseket, egyszerűen kiesett ez az időszak.

Tegnap 17.45-kor ugyanez. Watchdog mintha nem is lenne, áll az egész, ping megy, ennyi. Restart. A monitorra ezúttal már semmit nem tett ki, fekete kényernyő állítólag. De boot után már jön a mail is, hogy a raidből a md0, md2, md5 (/, /var, /var/log) tömbökből kiesett az egyik partíció:
"A DegradedArray event had been detected on md device /dev/md5."

Hm. cat /proc/mdstat: valóban hiánycikk az sdb néhány partíciója.
mdadm -a /dev/md0 /dev/sdb1, stb.
Ok, szinkronizál, tömb feláll, restart után is müxik.

Most nézem a logot, 02.00-tól 03.27-ig halom hibajelzés, majd watchdog ezúttal sikeresen újraindít.
Ezúttal viszont már az md3-ból is hiányzik a sdb partíció.
Kérdés a tapasztalt raidesekhez:
HDD hiba vagy a raid szivat? Bár egyértelműnek tűnik, megerősítést, esetleges megoldást kérek..

[code:1:ce6d703999]
Oct 8 02:02:46 easy kernel: ata2: status=0xd9 { Busy }
Oct 8 02:02:46 easy kernel: SCSI error : <1 0 0 0> return code = 0x8000002
Oct 8 02:02:46 easy kernel: sdb: Current: sense key=0xb
Oct 8 02:02:46 easy kernel: ASC=0x47 ASCQ=0x0
Oct 8 02:02:46 easy kernel: end_request: I/O error, dev sdb, sector 30433378
Oct 8 02:02:46 easy kernel: ^IOperation continuing on 1 devices
Oct 8 02:02:46 easy kernel: ATA: abnormal status 0xD9 on port 0xF8804087
Oct 8 02:02:46 easy last message repeated 2 times
Oct 8 02:03:16 easy kernel: ata2: status=0xd9 { Busy }
Oct 8 02:03:16 easy kernel: SCSI error : <1 0 0 0> return code = 0x8000002
Oct 8 02:03:16 easy kernel: sdb: Current: sense key=0xb
Oct 8 02:03:16 easy kernel: ASC=0x47 ASCQ=0x0
Oct 8 02:03:16 easy kernel: end_request: I/O error, dev sdb, sector 30433386
Oct 8 02:03:16 easy kernel: ATA: abnormal status 0xD9 on port 0xF8804087
Oct 8 02:03:16 easy last message repeated 2 times
Oct 8 02:03:46 easy kernel: ata2: status=0xd9 { Busy }
Oct 8 02:03:46 easy kernel: SCSI error : <1 0 0 0> return code = 0x8000002
Oct 8 02:03:46 easy kernel: sdb: Current: sense key=0xb
Oct 8 02:03:46 easy kernel: ASC=0x47 ASCQ=0x0
Oct 8 02:03:46 easy kernel: end_request: I/O error, dev sdb, sector 30433394
Oct 8 02:03:46 easy kernel: ATA: abnormal status 0xD9 on port 0xF8804087
....

Oct 8 03:31:03 easy kernel: md: Autodetecting RAID arrays.
Oct 8 03:31:03 easy kernel: md: autorun ...
Oct 8 03:31:03 easy kernel: md: considering sdc8 ...
Oct 8 03:31:03 easy kernel: md: adding sdc8 ...
Oct 8 03:31:03 easy kernel: md: sdc7 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdc6 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdc5 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdc2 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdc1 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: adding sdb8 ...
Oct 8 03:31:03 easy kernel: md: sdb7 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdb6 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdb5 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdb2 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: sdb1 has different UUID to sdc8
Oct 8 03:31:03 easy kernel: md: created md5
Oct 8 03:31:03 easy kernel: md: bind<sdb8>
Oct 8 03:31:03 easy kernel: md: bind<sdc8>
Oct 8 03:31:03 easy kernel: md: running: <sdc8><sdb8>
Oct 8 03:31:03 easy kernel: md: kicking non-fresh sdb8 from array!
Oct 8 03:31:03 easy kernel: md: unbind<sdb8>
Oct 8 03:31:03 easy kernel: md: export_rdev(sdb8)
Oct 8 03:31:03 easy kernel: raid1: raid set md5 active with 1 out of 2 mirrors
Oct 8 03:31:03 easy kernel: md: considering sdc7 ...
Oct 8 03:31:03 easy kernel: md: adding sdc7 ...
Oct 8 03:31:03 easy kernel: md: sdc6 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: sdc5 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: sdc2 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: sdc1 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: adding sdb7 ...
Oct 8 03:31:03 easy kernel: md: sdb6 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: sdb5 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: sdb2 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: sdb1 has different UUID to sdc7
Oct 8 03:31:03 easy kernel: md: created md4
Oct 8 03:31:03 easy kernel: md: bind<sdb7>
Oct 8 03:31:03 easy kernel: md: bind<sdc7>
Oct 8 03:31:03 easy kernel: md: running: <sdc7><sdb7>
Oct 8 03:31:03 easy kernel: raid1: raid set md4 active with 2 out of 2 mirrors
Oct 8 03:31:03 easy kernel: md: considering sdc6 ...
Oct 8 03:31:03 easy kernel: md: adding sdc6 ...
Oct 8 03:31:03 easy kernel: md: sdc5 has different UUID to sdc6
Oct 8 03:31:03 easy kernel: md: sdc2 has different UUID to sdc6
Oct 8 03:31:03 easy kernel: md: sdc1 has different UUID to sdc6
Oct 8 03:31:03 easy kernel: md: adding sdb6 ...
Oct 8 03:31:03 easy kernel: md: sdb5 has different UUID to sdc6
Oct 8 03:31:03 easy kernel: md: sdb2 has different UUID to sdc6
Oct 8 03:31:03 easy kernel: md: sdb1 has different UUID to sdc6
Oct 8 03:31:03 easy kernel: md: created md3
Oct 8 03:31:03 easy kernel: md: bind<sdb6>
Oct 8 03:31:03 easy kernel: md: bind<sdc6>
Oct 8 03:31:03 easy kernel: md: running: <sdc6><sdb6>
Oct 8 03:31:03 easy kernel: md: kicking non-fresh sdb6 from array!
Oct 8 03:31:03 easy kernel: md: unbind<sdb6>
Oct 8 03:31:03 easy kernel: md: export_rdev(sdb6)
Oct 8 03:31:03 easy kernel: raid1: raid set md3 active with 1 out of 2 mirrors
Oct 8 03:31:03 easy kernel: md: considering sdc5 ...
Oct 8 03:31:03 easy kernel: md: adding sdc5 ...
Oct 8 03:31:03 easy kernel: md: sdc2 has different UUID to sdc5
Oct 8 03:31:03 easy kernel: md: sdc1 has different UUID to sdc5
Oct 8 03:31:03 easy kernel: md: adding sdb5 ...
Oct 8 03:31:03 easy kernel: md: sdb2 has different UUID to sdc5
Oct 8 03:31:03 easy kernel: md: sdb1 has different UUID to sdc5
Oct 8 03:31:03 easy kernel: md: created md2
Oct 8 03:31:03 easy kernel: md: bind<sdb5>
Oct 8 03:31:03 easy kernel: md: bind<sdc5>
Oct 8 03:31:03 easy kernel: md: running: <sdc5><sdb5>
Oct 8 03:31:03 easy kernel: md: kicking non-fresh sdb5 from array!
Oct 8 03:31:03 easy kernel: md: unbind<sdb5>
Oct 8 03:31:03 easy kernel: md: export_rdev(sdb5)
Oct 8 03:31:03 easy kernel: raid1: raid set md2 active with 1 out of 2 mirrors
Oct 8 03:31:03 easy kernel: md: considering sdc2 ...
Oct 8 03:31:03 easy kernel: md: adding sdc2 ...
Oct 8 03:31:03 easy kernel: md: sdc1 has different UUID to sdc2
Oct 8 03:31:03 easy kernel: md: adding sdb2 ...
Oct 8 03:31:03 easy kernel: md: sdb1 has different UUID to sdc2
Oct 8 03:31:03 easy kernel: md: created md1
Oct 8 03:31:03 easy kernel: md: bind<sdb2>
Oct 8 03:31:03 easy kernel: md: bind<sdc2>
Oct 8 03:31:03 easy kernel: md: running: <sdc2><sdb2>
Oct 8 03:31:03 easy kernel: raid1: raid set md1 active with 2 out of 2 mirrors
Oct 8 03:31:03 easy kernel: md: considering sdc1 ...
Oct 8 03:31:03 easy kernel: md: adding sdc1 ...
Oct 8 03:31:03 easy kernel: md: adding sdb1 ...
Oct 8 03:31:03 easy kernel: md: created md0
Oct 8 03:31:03 easy kernel: md: bind<sdb1>
Oct 8 03:31:03 easy kernel: md: bind<sdc1>
Oct 8 03:31:03 easy kernel: md: running: <sdc1><sdb1>
Oct 8 03:31:03 easy kernel: md: kicking non-fresh sdb1 from array!
Oct 8 03:31:03 easy kernel: md: unbind<sdb1>
Oct 8 03:31:03 easy kernel: md: export_rdev(sdb1)
Oct 8 03:31:03 easy kernel: raid1: raid set md0 active with 1 out of 2 mirrors
[/code:1:ce6d703999]