Sziasztok,
Adott egy gép, egy sil3112 kártyával, két 500-as WD vinyóval, mdadm raid1-ben. Ma reggelre a gép haldoklott, ssh nem enged be, webkiszolgálásból csak valami maradék van (kb statikus tartalmak, pl munin egy része). A gép szerverteremben van, kértünk egy restartot, utána már van ssh, de a load az egekben, procihasználat maxon, htop-ban piros az egész csík (vagyis nem a processzek használják, az elvileg zöld), /proc/mdstat szerint:
md8 : active raid1 sda8[1]
365277824 blocks [2/1] [_U]
md7 : active raid1 sda7[1]
3911680 blocks [2/1] [_U]
...
Vagyis sdb sehol. /dev -ben pedig ottvan. Kern.log meg ezzel van tele:
Mar 10 11:04:34 kernel: end_request: I/O error, dev sda, sector 37723500
Mar 10 11:04:34 kernel: ata1: EH complete
Mar 10 11:04:34 kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Mar 10 11:04:34 kernel: sda: Write Protect is off
Mar 10 11:04:34 kernel: sda: Mode Sense: 00 3a 00 00
Mar 10 11:04:34 kernel: SCSI device sda: drive cache: write back
Mar 10 11:04:34 kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Mar 10 11:04:34 kernel: sda: Write Protect is off
Mar 10 11:04:34 kernel: sda: Mode Sense: 00 3a 00 00
Mar 10 11:04:34 kernel: SCSI device sda: drive cache: write back
Kicsúszott az egyik kábel? De ha igen akkor miért nem megy a tükör másik felével rendesen? Az is kicsúszott csak félig? :)
Délután bemegyünk, megnézzük a gépet, de addig ha valakinek van valami tippje, annak nagyon örülnék..
Köszi előre is!
- 1062 megtekintés
Hozzászólások
mdadm gáz.
Bugos, tökre el tudom képzelni róla, hogy a filerendszer, ami az md8 -on van, megsérült a lemez kiesésekor, és az ellenörzése folyik, talán nem is lett mountolva, ezért nincsenek meg a tartalmak, amik az md8-on kellene, hogy legyenek.
A kábel-kicsúszást nem tartom valószínűneg, szvsz a lemez caput.
- A hozzászóláshoz be kell jelentkezni
Nincs egy hónapja hogy lett ez az egész RAIDes dolog. Előtte ATA vinyók voltak. A vincsiken 5 év gari van, RE2 széria, szóval sírvafakadnék és egy világ omlana össze bennem ha tönkrement volna valamelyik...
/proc/mdstat -ban nem látszana ha csinálna valamit a tömbbel éppen?
- A hozzászóláshoz be kell jelentkezni
Tudtommal a WD-nek van RE2 (Raid Edition) szériája, arra pedig 3 év a garancia.
Ne fakadj sírva, pont erre való a RAID, ha tönkremegy az egyik vinyó, még (normális esetben) nem esik össze a világ.
Attól, hogy szerver vinyóról van szó, még forgó-morgó alkatrész, ami bőven tönkremehet.
- A hozzászóláshoz be kell jelentkezni
Akkor viszont most mi történik a géppel? :) Pont ezaz, hogy jól kéne menjen eggyel is... Na mindegy, amúgy tutira 5 év gari van rá.
- A hozzászóláshoz be kell jelentkezni
Nálunk ilyen WD RE2-es winchi kb. 3 hét után bad sectoros lett. De szerencsére a raid tömb másik lemeze simán átvette a helyét, ami a /proc/mdstat-ból is látszott.
- A hozzászóláshoz be kell jelentkezni
A tegnap este tanulsága hogy ugyanez történt nálunk is... Éjjel 3 körül (kedd) kidobálta a tömbökből sdb -t, de valamiért a proci utána is 100% -on volt iowait -el, amíg a vinyó benne volt. Amit nem értek, hogy sda -ra is panaszkodott... Most a másik vinyóval megy a gép, egyelőre gond nélkül. A WD5001ABYS ahogy néztem már nem kapható, helyette remélem tudok egy legalább ilyen "jót" szerezni gariban... Szerintetek melyik széria jó az 500-asból?
- A hozzászóláshoz be kell jelentkezni
Üdv,
/proc/mdstat azért informálna róla ha valamit csinálna a tömb(ök)el.
"md8 : active raid1 sda8[1]
365277824 blocks [2/1] [_U]
md7 : active raid1 sda7[1]
3911680 blocks [2/1] [_U]"
Ezek nagyon úgy festenek mint akik 1 disk-en álló tömbök lennének. Az igaz hogy ezek forognak-->> meg is adják magukat.
Szívemhez közeli szerveren egy alkalommal 6 disk-ből 4 ment tönkre 2 hét alatt. Érdekes hogy a s/n egymás után jöttek. Szerintetek :S. De ha van rá gari akkor nem tragédia, csak "gyorsan" ujra kell építeni a tömböt.
- A hozzászóláshoz be kell jelentkezni
De, de mutatja is: kiesett az egyik diszk.
Sajnos van pár rossz élményem az mdadm-mal, jártam úgy, hogy megdöglött alatta az egyik diszk, és ezért a rajta levő XFS fájlrendszernek is baja lett - holott nem szabadott volna. De lett.
Nálad is ilyesmire gyanakszom.Inkább mount vagy df-h -val nézd meg, hogy fel van-e csatolva az a partició, amin az adatoknak kéne lenniük!
Az meg hogy szervervinyó? Hajajaj.
Nekem vn 4 darab Hitachi Ultrastar 1TB SATA lemezem, ezek ugye szervervinyók, olyan 60-80k/HUF darabja.
Van rajta olyan is, hogy 1.500.000 óra MTBF.
Sajnos rájöttem, hogy az MTBF ezeknél a lemezeknél azt jelenti, hogy Magától Tönkremegy a Büdös Francba.
A lemezek kb. 8 hónaposak, egyik totál úgy 1 hónapja, megdöglött, a másik két napja szép üzenetekkel szórja tele a /var/log/messages -t.
a messages -ben amúgy van valami?
- A hozzászóláshoz be kell jelentkezni
Kb ugyanazok vannak benne mint a kern.log ban, szépen ismételgeti. Nyomtam egy init 0 -t hátha leáll mire odaérünk a Victor Hugo -ba. Valszeg onnan is lesznek még kérdéseim.
Üdv addigis!
- A hozzászóláshoz be kell jelentkezni