mdadm bénázás

Szólt a rendszer, hogy az egyik disk nem tetszik a tömbnek, csináljak má' valamit. Csináltam... 

Valahogy így:

# mdadm --detail /dev/md0

Tök szép meg jó, sdd kiesett. A spare meg valahol borér van, ugyan ott pörög a gépben, annakidején be is volt téve a tömbbe, most nem volt nyoma se.

# mdadm --remove /dev/md0 /dev/sdc

Kikapcs, gépből ki, másik diszk be, bekapcs.

# mdadm --add /dev/md0 /dev/sdc

Hadd menjen.

Kernel tájékoztat, hogy:

Oct 30 03:34:14 balckhole kernel: [ 2406.968697] md/raid1:md0: sdd: unrecoverable I/O read error for block 81408

smart szerint az sdd-n van pár hibás szektor. és itt azt hiszem el is mondtam mindent. Nem, nem kevertem a leírásban az sdc-t és sdd-t, valóban az sdd volt szar, én meg kivettem a tömbből a jó sdc-t.

Mondjuk úgylátszik veszve nincs minden, mert csatolható, olvasható eddig minden, amit kipróbáltam, de sehogy nem tudom rávenni, hogy azért mégis csak legyen kedves rászinkronizálni magát, vagy ha már visszatettem az eredeti sdc-t, akkor azzal álljon össze, el sem kezdi szinkronizálni.

 

Egyébként most így néz ki:
    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       49        1      active sync   /dev/sdd1

       2       8       33        -      spare   /dev/sdc1
 

Hozzászólások

Szerkesztve: 2019. 10. 30., sze – 06:33

Komolyan az ilyen bejegyzésekből tanulok a legtöbbet. [Jó értelemben. Tehát egyszerű az alapprobléma, értem, és átgondolni én mit csinálnék, miért, mit tett az író, miért tehette, stb. hasznos!]

Hasonlo esetben, en vegso megoldaskent force kapcsolot adtam neki es rebuildelte.

Valami nem igazan volt ott neked kerek diszk hiba nelkul sem.

http://karikasostor.hu - Az autentikus zajforrás.

Szállítás közben az egyik memória modul is kiesett, azzal is kellett szívni, mert cserélni kellett. Aztán össze is kevertem közben a diszkeket, szóval volt ott bőven baj. Fájl szinten lehetett róla menteni, aztán kiderült, hogy nem is kellett semmi belőle.

openSUSE Leap 15

Jah, ha már úgyis bele kellett nyúlni, akkor rendet akartam tenni a diszkek között, hogy kb. egy helyen legyenek a tömbökhöz tartozó diszkek. Na hát első nekifutásra ez össze is jött, elméletben. De később kiderült, hogy azért nem láttam a spare-t, mert azt megcseréltem az sda-val, eredetileg sde lett volna, és ő meg beépült a másik tömbbe. Végülis nem kellett semmi adat róla, szóval nem volt akkora gáz. Ha nagyon fontos lett volna valami rajta, előbb úgyis mentek egyet, vagy kettőt.

openSUSE Leap 15

A jövőre nézve egy (illetve kettő) javaslat: Egyrészt megnézni, valóban melyik device a beteg. Kétszer. Legalább. De lehet többször is :-) Utána szoftveresen azt kidobni a tömbből. (A parancsot kétszer (de lehet többször is...) megnézni az enter lenyomása előtt...)
Másrészt a  hdparm -i /dev/betegdevice  kimenetéből a SerialNo értékét jól megjegyezni, és fizikailag azt a diszket venni ki a gépből, amin az a sorozatszám olvasható. Ha a hdparm nem megy a döglött diszkre, akkor az összes többire megnézni a SerialNo-t, és azt kidobni, ami nincs a listában :-)

Jó ötlet, csak mostanság a hw raid elkényeztetett, hogy külön villog a hibás lemez és azt menet közben is lehet cserélni. :D Nem űr technika már, de arra, amire kell, jó ez is. Majd egyszer valamikor, ha kedvem lesz, úgyis valamelyik másikra lesz virtualizálva.

openSUSE Leap 15

Egy --re-add az sdc-re nem segített volna?

Tenyleg balckhole a gep neve? :)

/off