md raid10 széthullás

Fórumok

Sziasztok.

 

A raid:

========================================

Personalities : [raid10] [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4]
md0 : active raid10 sdd1[3] sda1[0] sdb1[1] sdc1[2]
      7813772288 blocks super 1.2 512K chunks 2 near-copies [4/4] [UUUU]
      bitmap: 0/59 pages [0KB], 65536KB chunk
====================================

 

A logban a következőt látom:

======================

May 31 23:21:21 dell-4-doom0 kernel: [6318523.033510] sd 0:0:1:0: [sdb] tag#9 Controller reset is requested due to IO timeout
May 31 23:21:21 dell-4-doom0 kernel: [6318523.033510] SCSI command pointer: (ffff880848d21948)   SCSI host state: 5      SCSI
May 31 23:21:21 dell-4-doom0 kernel: [6318523.033514] megaraid_sas 0000:01:00.0: [ 0]waiting for 1 commands to complete for scsi0
May 31 23:21:26 dell-4-doom0 kernel: [6318528.142542] megaraid_sas 0000:01:00.0: [ 5]waiting for 1 commands to complete for scsi0
May 31 23:23:33 dell-4-doom0 kernel: [6318654.602067] sd 0:0:1:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
May 31 23:23:33 dell-4-doom0 kernel: [6318654.602078] sd 0:0:1:0: [sdb] tag#0 Sense Key : Medium Error [current] [descriptor]
May 31 23:23:33 dell-4-doom0 kernel: [6318654.602081] sd 0:0:1:0: [sdb] tag#0 Add. Sense: Unrecovered read error
May 31 23:23:33 dell-4-doom0 kernel: [6318654.602100] sd 0:0:1:0: [sdb] tag#0 CDB: Read(16) 88 00 00 00 00 01 19 5c 92 f0 00 00 01 00 00 00
May 31 23:23:33 dell-4-doom0 kernel: [6318654.602103] print_req_error: critical medium error, dev sdb, sector 4720464628
May 31 23:23:33 dell-4-doom0 kernel: [6318654.602817] md/raid10:md0: sdb1: rescheduling sector 9440400112

May 31 23:32:07 dell-4-doom0 kernel: [6319168.869221] md/raid10:md0: sda1: redirecting sector 9440400112 to another mirror
=====================================================================================

 

Az sdb egyértelműen elesett, de a raid még nem dobta ki magából. Az sda meg kezd elesni?

Van esély arra, hogy sdb-t fail-ra teszem és még megmarad a masina egy rövid ideig?

 

Előre is köszönöm a válaszokat.

Hozzászólások

Én ebből nem látom,hogy az sda-nak baja lenne.

Viszont mdraidet használsz megaraid vezérlővel?

"Van esély arra, hogy sdb-t fail-ra teszem és még megmarad a masina egy rövid ideig?"

Van. Viszont ilyenkor már a backupot tesztelném.

Ha jól látom, akkor az sdb diszk még épp átlendült a problémán, és az md pedig már eleve a másik diszkhez fordult, hogy kell. Az sdb-t instant érdemes cserélni, és legyen rendes backupod mindenek előtt. A recovery az sdb párjáról megy majd, és ha rebuild közben elhullik, akkor lesz vége a tömbnek.

Csere után az sdb-t nulláznám dd-vel, illetve tesztelném, hogy kiderüljön nem kábel vagy backplane hiba miatt volt-e a fenti.

Milyen diszkek egyébként?

Úgy értelmezem, hogy az sdb1-ről az sda1-re ment az írás vagy olvasás. Ezt kár túlgondolnod. Ha nincs az sdb-n kívül másik diszknél vezérlő által jelentett hiba, illetve a smart értékek jók, akkor a gondolkodási fázis rendkívül hamar az sdb cseréhez kell vezessen.

Ahogy fentebb írták, itt megaraid driver van. Pontosan milyen kártya ez?