mdadm error - SATA, SMART, LVM
A fenti higtragyan uzemeltetett RAID1 szetszallt.
Hardver: valami P4 lap, 2db SATA150 port, 2db 1TB SATA2 diszk
Szoftver: Frugalware Linux 1.1 (2.6.30), mdadm 3.0, lvm2 2.02.51, Samba
Mindket RAID1 diszk kopte a hibakat, az mdstat szerint az sdb lett hibas.
Igy indult a dolog reggel:
Dec 2 09:18:58 hostname ntpd[1823]: clock is now synced
Dec 2 09:23:40 hostname kernel: ata2: soft resetting link
Dec 2 09:24:16 hostname last message repeated 3 times
Dec 2 09:24:51 hostname kernel: ata2: soft resetting link
Dec 2 09:24:55 hostname kernel: ata2.00: configured for UDMA/133
Dec 2 09:24:55 hostname kernel: ata2.01: configured for UDMA/133
Dec 2 09:24:55 hostname kernel: ata2: EH complete
Dec 2 09:24:55 hostname smartd[1902]: Device: /dev/sdb, SMART Prefailure Attribute: 3 Spin_Up_Time changed from 184 to 209
Dec 2 09:24:56 hostname smartd[1902]: Device: /dev/sdc, SMART Usage Attribute: 194 Temperature_Celsius changed from 66 to 65
Dec 2 09:25:58 hostname kernel: ata2: soft resetting link
Dec 2 09:26:18 hostname last message repeated 2 times
Dec 2 09:26:53 hostname kernel: ata2: soft resetting link
Dec 2 09:26:58 hostname kernel: ata2: EH complete
Dec 2 09:26:58 hostname kernel: sd 1:0:0:0: [sdb] Unhandled error code
Dec 2 09:26:58 hostname kernel: sd 1:0:0:0: [sdb] Result: hostbyte=0x04 driverbyte=0x00
Dec 2 09:26:58 hostname kernel: sd 1:0:1:0: [sdc] Unhandled error code
Dec 2 09:26:58 hostname kernel: sd 1:0:1:0: [sdc] Result: hostbyte=0x04 driverbyte=0x00
Leallitottam a Samba-t es umountoltam a filerendszereket.
- SMART nem mukodott egyik diszkre sem
- RAID-et nem lehetett leallitani, mert device busy-re panaszkodott
- RAID-bol a hibasnak jelolt diszket ki lehetett venni, de a fenti hibak szinte folyamatosan jottek (tobb mint 1.5 *millio* alkalommal!), attol fuggetlenul, hogy elvileg nem volt mar I/O muvelet rajtuk.
- VG-t/LV-t nem lehetett deaktivalni I/O error miatt
- a SMART-ot kikapcsoltam
Jobb hijan rebootoltuk a gepet. Reboot utan a RAID tomb szepen felepult, a filerendszerek rendben vannak.
Elvileg a diszkek nem hasznalnak NCQ-t:
# dmesg | grep -i ncq
ata2.00: 1953525168 sectors, multi 16: LBA48 NCQ (depth 0/32)
ata2.01: 1953525168 sectors, multi 16: LBA48 NCQ (depth 0/32)
Ezeket az infokat talaltam a temaban:
Re: MD/RAID time out writing superblock (LKML)
szoftveres RAID1 LVM - vinyo - Input/Output error (HUP)
-- to be continued --
- Tovább (mdadm error - SATA, SMART, LVM)
- 1258 megtekintés