RAID helyreállítás tapasztalat

Fórumok

Érdekelne, hogy volt-e már valakinek olyan esete, hogy a (sw-es) RAID-ben elszállt az egyik HDD-je, és cserélni kellett?

Hozzászólások

Persze, volt több is, 0 adatvesztéssel.

4 éves asztali pc, Debian, RAID1, egyik hdd kihullott, hdd csere, adatok vissza, és működik.

az otthoni debian szerver egyik raid1-es tömbjéből (pata) kihullott az hdb vasárnap hdd ki 4 perc, majd sync (kb 5 óra 320 GB) és minden ment tovább mintha semmi nem történt volna ja és közben használtuk

Linux, szoftveres RAID5 negy diszkkel (egy samsung, harom maxtor). A harom maxtor diszk gyakorlatilag egyszerre hibas szektorokba futott, igy szetesett az egesz array.

Szereztunk uj diszkeket atddztuk amit lehetett, aztan ment neki egy "force assemble", majd utana fsck (ext3). Talalt par tucat hibas inodeot, de se a rendszerben nem talaltunk utana hibat, se a felhasznalok nem jeleztek hianyzo fileokat.

Tanulsagok:
- a RAID redundans, de nem helyettesiti a teljes backupot
- soha tobbet maxtor (mar elotte is toronyban alltak a halott maxtor diszkek)
- a RAID kevesbe megbizhatobb mint a szamok mutatjak, mert tipikus, h azonos diszkekbol all, es emiatt valoszinu, h egyszerre is hibasodnak meg

[UPDATE: kozben jottem ra, h nem erre voltal kivancsi, hanem "normal" lefutasu diszk-cserere]

--
The Net is indeed vast and infinite...
http://gablog.eu

Lol. Hát igen a nagy disztributorok BUTÁK. MIND :D

Amúgy meg pont az ilyen hibákra találták ki a spare disket.
Viszont tény, hogy a backupot semmi sem helyettesítheti. SOHA.
Nemegyszer esett nekünk is már szét a SW raid, 90%-ban vissza lehetett hozni simán.
Csak az a maradék 10%.... nah az nem volt piskóta mire visszaszedtük.

Az EMC-vel kellett volna kezdened a sort... Érdekes módon nekem eddig csak gagyipécéből (meg gagyipécé-s jellegű külső scsi-házból) hullottak ki diszkek jelentős számban, esetleg komolyabb fejcsóválást is okozva, masszívabb storage-ok, illetve nevesebb gyártók szervergépeire ez nem annyira volt jellemző. Jó, persze, az öregecske 9, meg 18G-s ssa-diszkek azért bírtak hullani, de ezekből egyrészt sok (nagyon sok) volt a storage-ban, másrészt meg a hardveres raid5 lett szépen (LVM) megtükrözve két, teljesen független loop-on (külön PCI-busz, külön SSA-adapter, másik szerverszoba, másik diszktorony) lógó ssa-toronyra.

Amit javasolni tudok, otthoni RAID-ből kihulló diszk esetére, az egy lehetőleg azonnali inkrementális mentés (ha volt korábban teljes mentés...), majd ezt követően a dögöt eltávolítani, új diszket berakni, szinkronizálás maximális sebességgel, közben lehetőleg nem használni a gépet. Az ok egyszerű: Ha a szinkronizálás közben a régi diszk netán megadná magát, akkor kakukk van...

Szupi nekem nem telik otthonra (HP, DELL, IBM) szerverre tehát maradtam az egyszerű és primitív pata-s alaplapnál, és persze nincs előre konfigolt scsi cuccom sem (pata-nál célszerű nem egy szériás darabokat összerakni erről írtam fentebb). Olvasást az általánosban tanították szerintem, de az olvasás értés a Te esetedben megint más dolog, de kérlek cáfolj meg !?!?

Idióta "IBM" Scsi alapon seagate hdd-ket használ bátor módon raid1-ben évek óta x205/206, elvétve hitachi. A meghibásodási arány 3 éven belül nemmérhető, 3-5 év után 100 db ból 1-5, 5-10 év közt 100 db-ból 5-20.
Megnéztem az "ujjabb" 206M szervert, sataval szerelt, köptem rá kettőt...
Hardwares raid kártyára kötött diskek raid5 és ha van spare könnyen cserélhetők, hotswap esetén menetközben egyébként le kel állitani, ujrainditáskor simán felépiti a tömböt. Raid1 tömböt szettem ketté és szórakozásból raktam mellé uj diszket, ezt is ujraépitette..

Állatbarátokat keresek http://hup.hu/node/66090
http://elütöttek.hu/

Pedig ez így igaz. Ha lehet még a gyártó is más legyen!

Rengetegen szívtak/szívnak emiatt, egy open source oldal például teljes tudásbázisát vesztette el (ha jól emlékszem WD Raid Edition-ök haltak meg egyszerre).

A nagy szállítók azért ugyanazt a lemezt rakják, mert:
- sokkal olcsóbb (nagyobb volume)
- a gyártótól garanciát kapnak hogy együtt működni fognak
- nagyobb teljesítmény

De biztonság szempontjából, mind az elmélet, mind a gyakorlat szerint sem szabad ugyanazt a lemezt választani. Ne dőlj be a marketingnek!

Azon gondolkodom, nem ártana egy "kerékcsere" gyakorlásként. (3 vinyó, 2-t RAID-be, rendszer install, leállít, egyik csere, helyreállítani próbál).

Egyébként ha az egyik tönkremegy, leállítom, kiveszem a rosszat, eggyel is tudom üzemeltetni tovább ugyebár, hiszen a változásokat a RAID majd átviszi az újra? (Arra az esetre kérdezek itt rá, ha nincs épp kéznél egy csere vinyó, csak amíg átszaladok a boltba :-)

Féllábú RAID-et lehet használni, csak az álmoskönyv szerint nem egészséges. Ez nem üzemszerű állapota a rendszernek, tehát ASAP le kell állni vele. A sima RAID tükör adatvesztés ellen jó, a rendesz kiesése ellen viszont nem véd, csak nem azonnali adatvesztést okozó leállásod lesz, hanem fel lehet rá készülni, el lehet menteni a munkát, lehet értesíteni a felhasználókat, etc.

Használhatod, de tudatában kell lenned annak, hogy nincs raid, a még élő diszk hibája esetén a teljes adatvesztés szinte garantált.