Debian SW RAID1-ben lévő 2db elöregedett HDD cseréje minimális leállással

Fórumok

Sziasztok!

Adott egy file szerver 2db 500GB kapacitású HDD-vel, amely HDD-k SW Raid 1 ben lettek tömbösítve.

A szerver közel 3 éve működik, non-stop írási / olvasási műveletekkel terhelve,szóval megérett a cserére már, mert a HDSentinel is csak "több mint 776 napot ír hátralévő időtartamnak" az 1000 + nap helyett.

A kérdés az, hogy hogyan lehetne megoldani azt, hogy a meglévő 2 hdd tartalmát, sw raid configgal együtt áttegyem 2 másik , újonnan vásárolt hdd-re.

Amire én gondoltam:

Szerver leállít, 2 db új merevlemez behelyez a szerverbe, a meglévő elöregedett /dev/sdb , /dev/sda mellé beépítem a raid tömbbe az újonnan vásárolt 2 hdd-t, aztán amikor végzett a szinkronnal, akkor a grubot telepítem az újonnan vásárolt diskekre, aztán a szervert leállítom ismét, a 2 db elöregedett hdd-t eltávolítom, és az új merevlemezekről , amelyek már jó állapotban vannak, beindul a rendszer , az összes szolgáltatás és minden működik tovább.

Ez elméletben 2*5 perces leállás lenne, és nem kellene éjszakáznom azért, hogy újraépítsem az egész rendszert, és vissza szinkronizáljam az adatokat 8-10 órás leállással.

Szerintetek az általam vázolt megoldás mennyire életképes?

Esetleg ha tudtok optimálisabb megoldást, akkor írjátok meg , legyetek szívesek.

A másik kérdésem, hogy erről a merevlemezről mit gondoltok, (WD RE4)?
Van esetleg valakinek tapasztalata vele? Fórumokon írnak rosszat és jót is róla, szóval nem tudom eldönteni, hogy megéri-e megvásárolni.

Ha a leírásnak lehet hinni, akkor extrém tartós hdd, ami adatközpontokba lett tervezve, szóval fájlszervernek teljesen alkalmas lenne, de elég sok +funkciója van, ami nem biztos, hogy debian linux alatt is kihasználható lesz, vagy, hogy egyáltalán a rendszer fel fogja ismerni külső forrásból származó driverek inicializálása nélkül.

Köszönöm szépen a segítséget előre is!

Hozzászólások

A WD RE4 diszkből vagy legalább 4 darabot vegyél RAID1 céljára, vagy pedig egyet sem:

"RAID-specific, time-limited error recovery (TLER)
Prevents drive fallout caused by the extended hard drive error-recovery processes common to desktop drives."

--------------------------------------------------------------------
http://www.kmooc.uni-obuda.hu/
http://www.memooc.hu/
https://www.safaribooksonline.com/

Az elv szerintem teljesen jónak tűnik. Az még felmerülhet, hogy mikor terheled kevésbé a futó rendszert, ha egyszerre vagy ha egymás után fűzöd be a 2 új disket?
Illetve, még a 2. leállítás előtt rendesen vezesd ki a raid-ből a 2 régi disk-et és a rendszernek mennie kell tovább.

A RE disk-ek (hiába Raid Edition) valóban nem sw raid1-re vannak kitalálva, inkább hw raid5-6 rendszerekhez, sok disk-el, spare-el. A te helyedben sima blue-t, esetleg black-et tennék. Vagy ha méretben nem akarsz lépni, akkor akár valami jobb fajta SSD-t.

----------------------------------^v--------------------------------------
"Probléma esetén nyomják meg a piros gombot és nyugodjanak békében!"

Látom az Re diszkeknél nagy a félrehallás. Az Re (így hogy második kicsi már évek óta) a WD Enterprise SATA vonala (bár sokan még ezen se tértek napirendre, hogy ez hogy lehet), ami hwből és fwból jobban viseli a vibrációt és a 24/7-es működést. Ezzel szemben nincs benne tervezési raid szint vagy más ilyen őrület. Jellemzően a szerver alaplapokhoz a gyártó is az Enterprise SATA kategóriát ajánlja és egyben ilyenekkel szokták tesztelni a SATA rendszert az alaplapon ők is. Ezen felül még támogatott vagy legfelalább tesztelt diszk listát is közzé szoktak tenni.

A TLER-hez, bár azt más írta, annyit mondanék, hogy az annyit jelent, hogy ha hibát észlel akkor pár mp-en belül visszatér hibával vagy reallokál vagy kezd valamit magával. Ezzel szemben egy desktop diszkben a firmware szeret sokáig próbálkozni az újraírással vagy újraolvasással és akkor van az a jelenség, hogy "beáll" a gép.

Szóval ha 24/7-es a gép, akkor nyugodtan vehetsz bele 24/7-re tervezett és ajánlott diszk párost és jó eséllyel rögtön 2x1TB-ra fogsz ugrani, mert 500G-s diszk már nemnagyon van gyártásban. Ezek a feature-ök amiket írnak nem OS szinten érvényesülnek, hanem SATA vezérlő-diszk szinten, sőt a TLER az mindentől független mert a diszk magától nem fog nekiállni sokat gondolkodni egy hibán és mond valamit a vezérlőnek.

A 2x5 perc leállás nemhotswap diszknél tuti több lesz. :)

Sosem volt a black Re, mármint marketingben és fw-ben, persze hogy mennyire van ténylegesen közös alapjuk az más kérdés. A Blue és Black az desktop széria. A Blue az entry/alap desktop a Black a performance/profi desktop hivatalosan, de egyik sem hivatalosan is 24/7-re ajánlott/tervezett.

A TLER-t még hdparmmal is tudod változtatni, de nem biztos, hogy akarod. :) (Link: http://blog.asiantuntijakaveri.fi/2012/07/restoring-full-capacity-of-sa… és lapalja)

Érdekes.

Amikor én vettem magamnak NAS-ba lemezt, WD Red lett (ez ugyanaz, mint a Re?) és akkor megnéztem a termékleírást, és az Amazon oldalán azt írták, hogy a Red az NAS-ra tervezett, jó RAID-be, jó 24/7-be, meg nem zavarja, ha többször leáll és újraindul.
A Black meg jó folyamatos üzembe, ahol nem kell folyton leállnia és újraindulnia, de két processzor van benne meg több ram, meg máshogy van csapágyazva, hogy kevésbé vibráljon és ezért gyorsabb, stb.

Ennek alapján 24/7-es szerverbe én simán black-et javasoltam/vettem volna. Ezek szerint rosszul tettem volna és Reddel jobban jár a szerver?

Most gyorsan rákerestem Amazonon arra, hogy WD server, erre azt mondja, hogy WD gold. Tavaly, amikor a Red-et vettem, nem is láttam, hogy ilyen is van. (Mondjuk a NAS-ba nem is vettem volna ezt)

RED jellemzően NAS-ba való vagy oda ahol nem kell nagy teljesítmény, de jó a hosszú élettartam. Nálam pl. laptop adat vinyója. 3 év gari is jól hangzik.
Re -t pedig megbeszéltük, szerverbe. Igazi szerverbe, nem otthoni NAS-ba.
Tegyük tisztába: https://www.pugetsystems.com/labs/articles/Understanding-the-WD-Rainbow…

Nekem az jött le, hogy a Gold az Re-t váltja majd fel folyamatosan. Legalábbis a jelenlegi szines történetből erre lehet következtetni. A Red-ek direkt SOHO piac (sima az 2-8 diszkes NAS-ba ajánlott 5400rpm-es, a Pro pedig, relatív kevés diszkes üzem szerintük, max 16 diszkig és 7200rpm-mel), tehát ezek is 24/7-esek, de kisebb igénybe vételre. Egyébként valami fantasztikusan próbálják szegmentálni a piacot, ezért valóban nehéz követni, hogy mit variálnak. Hogy melyikben mit variálnak fizikai és firmware tekintetben az is egy érdekes kérdés, de gondolom főleg az általuk megcélzott felhasználáshoz próbálják belőni.

Érdemes a gyártó oldalán tájékozódni, az a mérvadó szerintem.

Link 1: https://www.wdc.com/en-ie/products/business-internal-storage.html

- Red: "With drives up to 8TB, the WD Red drive is built for single-bay to 8-bay NAS systems and packs the capacity to store your precious data in one powerhouse unit."
- Red Pro: "For up to 16 bay medium to large-scale NAS environments, the WD Red Pro drive is engineered to handle increased business workloads and carries a 5-year limited warranty."
- Re: "The workhorse of our datacenter portfolio. High performance, capacity and reliability make the WD Re drive ideal for data warehousing/mining and high-performance computing."
- Gold: "Reliability, capacity, power efficiency and performance for a multitude of Datacenter-specific applications. Robust storage with 24/7 premium customer support."

Link 2: https://www.wdc.com/en-ie/products/internal-storage.html
- Blue: "Boost your PC storage with WD Blue drives, the brand designed just for desktop and all-in-one PCs with a variety of storage capacities."
- Black: "WD Black hard drives are designed for desktop PC and power users who demand performance, with a variety of upgrade options available."

A fentiek nyilván a gyártó által elképzelt felhasználás, mottó minden diszknél és mindenki saját maga belátása szerint választhat. Példul az általam szeretett WD Se szériát úgy látom lelőtték, az kék volt példul és bulk "cooler data"-hoz pl. backuphoz ajánlották még anno, valamint a 4-8-10 diszkes vásárlásnál már a büdzsét se feszítették annyira.

Ma délután egy másik telephelyen lévő file szerverben (HP Proliant ML310E Gen 8) megállt a másodlagos /dev/sdb HDD, ami egy WDRE4 volt, hirtelen egy WD10EFRX azaz 1TB WD RED NAS HDD volt raktáron, amivel kicseréltem a sw raid tömbben összrakott configot.

Fdisk az alábbi kimenetet adja az fdisk -l parancsra:

root@srv3:/srv/kozos/INFORMATIKA# fdisk -l

Disk /dev/sda: 931,5 GiB, 1000204886016 bytes, 1953525168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0x25975b7b

Device Boot Start End Sectors Size Id Type
/dev/sda1 * 2048 177733631 177731584 84,8G fd Linux raid autodetect
/dev/sda2 177735678 1953523711 1775788034 846,8G 5 Extended
/dev/sda5 177735680 677734399 499998720 238,4G fd Linux raid autodetect
/dev/sda6 677736448 693358591 15622144 7,5G fd Linux raid autodetect
/dev/sda7 693360640 1953523711 1260163072 600,9G fd Linux raid autodetect

Disk /dev/sdb: 931,5 GiB, 1000204886016 bytes, 1953525168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: dos
Disk identifier: 0x00000000

Device Boot Start End Sectors Size Id Type
/dev/sdb1 * 2048 177733631 177731584 84,8G fd Linux raid autodetect
/dev/sdb2 177735678 1953523711 1775788034 846,8G 5 Extended
/dev/sdb5 177735680 677734399 499998720 238,4G fd Linux raid autodetect
/dev/sdb6 677736448 693358591 15622144 7,5G fd Linux raid autodetect
/dev/sdb7 693360640 1953523711 1260163072 600,9G fd Linux raid autodetect

Partition 3 does not start on physical sector boundary.

Disk /dev/md0: 84,7 GiB, 90931462144 bytes, 177600512 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 524288 bytes / 524288 bytes
Disk /dev/md1: 238,3 GiB, 255865126912 bytes, 499736576 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 524288 bytes / 524288 bytes
Disk /dev/md2: 7,5 GiB, 7994343424 bytes, 15613952 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 524288 bytes / 524288 bytes
Disk /dev/md3: 600,8 GiB, 645069275136 bytes, 1259900928 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 524288 bytes / 524288 bytes

Ami idegesít ebben a kimenetben az az következő sor:

Partition 3 does not start on physical sector boundary.

Kell ezzel a hibaüzenettel foglalkoznom, ha kell, akkor szerintetek mit jelenthet, tudom javítani valahogyan?
Fórumokon nem találok értelmes bejegyzést erre a hibauzenetre vonatkozolag.

Köszönöm a segítséget előre is!

Re2/3/4-et használok szerverekben több, mint 10 éve HW és SW RAID-ben. Simán mennek 40/50/60 ezer üzemórát. Jó a hibatűrő rendszerük is.
Samsung HE (ez az enterprise kategória) koránt sem vált be ennyire. Sok vinyós HW raid mindig kilökte valamelyiket nagy terhelésnél. Hamarabb is pusztultak. Ugyanoda WD Re4 került, azóta nincs probléma.
WD black, blue és társaik pedig 20-25 ezer üzemóránál feladták.

Holnap esek neki a fent említett műveletnek, ezért kicsit jobban utánanéztem a dolgoknak.

A következő kételyek merültek fel bennem:

Annak idején, kb 3 éve, a raid1 tömböt 2 device-re (hhd-re) méreteztem, mert ugyebár annyi állt akkor éppen rendelkezésre.

Ahhoz, hogy a fizikailag jelen lévő 2db ÚJ HDD-t be tudjam fűzni a RAID1 tömbbe, aztán a régi, elöregedett HDD-ket eltávolítsam, kell bővítenem a raid configot 4 device-ra, azaz "growingolni", vagy nem szükséges, mivel a művelet végén úgyis 2 disk fog maradni?

Egyáltalán engedni fogja az mdadm, hogy még 2 új eszközt hozzáadjak a jelenleg meglévő kettő mellé, ha a details-ban active es working devices-nel is 2 eszköz van feltüntetve?

Valószínűleg délután kipróbálom virtualboxon, ezt a műveletet, de tartok tőle, hogy az eredmény nem ugyanaz lesz, mint holnap élesben:(

A választ és a segítséget előre is köszönöm!

Célszerű growingolni. Ha a csak hozzáadod az új lemez(eke)t akkor az alapban spare lesz. Ha ilyenkor kiveszed az egyik régi vinyót, akkor marad a raid-nek 1 aktív eszköze és elkezd a spare-re szinkronizálni. Ha itt kidől az aktív régi lemez akkor összedőlt a tömböd. Illetve itt a spare miatt a resync is kalandosabb lehet (spare-re resync, berakod a másik új vinyót, akkor arra resync, aztán eldobja a spare-t, aztán kiveszed azt, berakod a másik régi helyére és megint resync - láttam már ilyet hw raid vezérlőnél, az mdadm nemtom hogy csinálja). A kivett régi vinyón persze ott vannak az adatok, kérdés hogy azóta mi változott.

Szóval szerintem add hozzá a két új vinyót és grow 4 lemezre. (Igény szerint lehet egyesével is hozzáadogatni.) Mondanám hogy a régi vinyókat is hagy benne, ártani nem árt, de ki is veheted, --fail aztán --remove. Utána isméz grow 2 lemezre.

Mi is Re diszkekkel szállítjuk a partnereknek a szervereket. Eddig ami kipotyogott közülük az mind valamilyen külső behatás miatt halálozott el. Bár 5 év garancia van rájuk, mi 3-3.5 évente elkezdjük egyesével cserélni őket.
A módszer amit írtál jó. Annyi csak, hogy én két lépésben csinálnám a kisebb terhelés miatt. Persze ez környezetfüggő. Egy alacsony terheltségű szervernél nem biztos, hogy feltűnik a lassulás. Leállítani a szervert így is csak kétszer kell hozzá.