RAID5 rendszer összeomlás

Fórumok

Sziasztok!

Adott egy Linux Raid5 rendszer és egy idióta felhasználó aki gondolt egyet és nyomott egy power off-ot, mert azt gondolta, hogy nem megy a szerver. Ennek hatására szépen összeomlott az egész rendszer. Helyrehoztam a tömböt majd live cd-ről bootolva futtattam rajta fsck-t mivel a partíciókat nem volt hajlandó felcsatolni a linux, gondoltam kijavítom a fájlrendszert. Le is futott rendesen majd amikor mondtam neki, hogy mount akkor lepődtem meg. A rendszer partíción a /etc /home /opt könyvtárak teljesen üresen voltak. A /opt könyvtárban volt egy firebird adatbázis és sehol sincsen most.

Megnéztem pár recovery programmal, de azok a létező fájlokat találták meg és inode nevű mappákat. Ezekben ugyan vannak valamiféle fájlok, de ezekkel meg nem tudom, hogy mit is lehetne kezdeni.

Van egy másik partíció is amin meg a fájl szerver volt. Na most az is teljesen üres. Egyetlen egy könyvtár van rajta a lost+found amiben vannak ugyan valamik, de azokkal sem tudom, hogy mit lehetne kezdeni.
Van arra valami lehetőség, hogy ezeket a fájlokat visszanyerjem?

Hozzászólások

Azoknak az adatoknak a mentésére, amiknek az elvesztése fájna. Ja, hogy nem volt...? Akkor fájni fog... Három diszkből kettő kell az adatok helyreállításához. Mivel volt egy hot spare, elvileg arra a három data diszkből elsőként kiszédült lemez adatait össze kellett volna raknia a tömbnek automatikusan - ha viszont ennek a folyamatnak a közepébe trafált bele egy újabb diszkhalál, akkor kampó, kivéve, ha a korábbi spare döglik - de általában nem az szokott ilyenkor megfeküdni.

Normális raid nem hasal el egy poweroff-tól, meg normális fs is jól-rosszul, de elviseli. Csak tipp, hogy a raided széthullott - gondolom, a kutya sem figyelte, hogy a hw-raid milyen állapotban van - ebbe beleállt az OS (hiszen elszállt a fs alól a device), kapott egy poweroff-ot, aztán heló.

Két tanulság: A raid addig jó, amíg működik - az állapotát folyamatosan tessék monitorozni, és ha kiszédül egy diszk belőle, akkor karbantartási időpontot egyeztetni, és cserélni. A másik meg az az ősi igazság, miszerint a raid nem helyettesíti a mentést.

Tudom, hogy utólag már nem segít rajtad, de ha lehet, állítsd be, hogy emailben értesítsen legközelebb a vezérlő menedzsment programja, ha valami furcsát észlel. Legalább időben megtudod, ha kihullik egy diszk...

EDIT: a power gombot kösd ki, a gép köré meg elektromos kerítést! :)

Ha jól értem a problémát nem az volt a gond, hogy a RAID széthullott és ezért beütött a krakk, hanem a felhasználó kikapcsolta a szervert (áramtalanított menet közben) mert azt hitte nem megy és emiatt esett szét a RAID és emiatt nem indult be a gép, ... Ezen az egyébként jogosan ajánlott email-es értesítés nem sokat segített volna :)

raid5+1 spare sokkal rosszabb, mint 4 lemezzel raid10.
raid 10 alatt ha szerencsed van, kieshet 2 lemez is, es tuleled, raid5 alatt, ha kiesik egy eles diszk, akkor egyreszt belassul az egesz IO szempontbol, mert elkezdik syncelni a sparre a kiesett lemez tartalmat, amihez paritast kell szamoljon, masreszt ha a rebuild alatt(ami orakig is siman eltarthat) esik ki meg1 lemez akkor kakukk.
Szoval ha van 4 lemezed, akkor raid6, de inkabb raid10.

Tyrael

A lost+found könyvtárban vannak fájlok. Azokkal nem lehet valamit kezdeni?