Szerver HDD cseréket megejtem:

Címkék

1 év után kötelezően, hibamentességtől függetlenül.
0% (1 szavazat)
2 év után kötelezően, hibamentességtől függetlenül.
1% (6 szavazat)
3 év után kötelezően, hibamentességtől függetlenül.
4% (16 szavazat)
Csak ha elromlik.
63% (267 szavazat)
Csak az eredmény érdekel.
31% (132 szavazat)
Összes szavazat: 422

Hozzászólások

Azt hiszem nekem újra kell gondolnom a stratégiámat, mert lehet jobb lenne időzíteni az ilyen feladatokat. :)

(x) ha a menedzsment szoftver okot ad rá (pl. prefailure állapot, hiba stb.)

--
trey @ gépház

Az beleveheto a "ha elromlik"-ba szerintem. Ujabb szavazas johet arrol, hogy kinel mi a hatar az "elromlott"-ra. :)

A fix idot en mindenkepp tulzonak tartom, kiveve ha felsobb helyrol elvaras es fizetik a poliszit. Van diszk ami 1 ev utan (pedig sas meg enterspajz megminden) es van ami mar kozel 9 evnyi uzemorat porgott.

A 9 évet mindenképpen túlzásnak tartom. 9 éves vinyó legföljebb 80GB-os. Egy más célra újonnan vett NAS-on, vagy újonnan épített RAID-en egy ici-pici volume-on elfér az a 80GB, a lecserélés költsége szerintem köbö a 80GB átmásolásához kellő munkadíjnak felel meg.
Amúgy ha lett volna olyan opció, hogy "legföljebb 5 év, vagy ha hibázik", akkor azt választottam volna.

A fix idős csere szerintem több gondot okoz mint amennyit megold. Egy jó merevlemez 10 évig is elmegy, de van olyan új merevlemez ami fél év után megdöglik. Gyártási hiba lehet az ok, garanciában természetesen cserélik de adatmentés ritkán jár a garancia mellé. Egy felesleges csere, felesleges kockázattal is jár. Rendszeres backup és archiválás a megoldás adatbiztonságra és nem a felesleges merevlemezcsere.

A mai ínséges időkben azt hiszem nagy luxus* előre meghatározott időszakonként cserélni ezeket. A rendszer legyen hibatűrő és legyen tartalék a polcon. Ott elfér és nem kopik :)
* Kivéve, ha más, kevésbé kritikus helyre még felhasználható.

Persze, minden relatív, az adott helyzet határozza meg és a te tapasztalaid mást mondhatnak. Én úgy látom, hogy több (>3) lábú RAID10 esetén elég jó esélyünk van, hogy nem az előbb kihullott vinyó párja esik ki következőnek. Ha a polcról bekerül a tartalék jó eséllyel hamarabb összeszinkronizál, minthogy behalna egy másik.
Persze, nem zárható ki. Ahogyan az sem, hogy a vadi új vagy üzemórában fiatal vinyó egyszer csak kiesik. nagy számú mintából vett statisztikával lehetne dönteni.
Jobb híján a saját kis számú mintámból (100+ HDD) tudok következtetni.
RAID-10, RAID-50, RAID-60-nal + polcon lévő vinyóval + backuppal én azért elég jól alszom :)
Utoljára 2008-ban volt, hogy 4 vinyóból álló 2x RAID1-ből egyszerre 2 vinyó esett ki. Szerencsére mindkettőnek csak az egyik lába. Na az tényleg kicsit megemelte a pulzusomat :)

Inkabb az lehet, hogy egy "alombo'l" szarmazo diszkek hullanak ki egyszerre. Nalunk most egy (6+2)*1.5T-s RAID6-ban rohadt le 3 egyszerre, par nap (max egy-ke't he't) kulonbseggel, egzaktul 3 e'v utan. Az serial number-ek kozott minimalis volt a kulonbseg, szoval kabe egymas utan johettek le a gyartosorrol. 3bo'l ketto" kattogosra szarta o"ssze maga't, de egyro"l me'g ki lehetett vakarni az adatokat. Erdekes volt az is, sajat elektronikat kellett epiteni ami reszetelte egy bad sector kiolvasasa utan, csak ugy lehetett leolvasni rola, de ugy majdnem mindent... mindegy, ez ma'r ma's mese :]

Hibaturo az, hogy a rendszer barmelyik resze megdoglik, attol meg mukodokepes marad.
Valamint ha valami elromlik, akkor az dogoljon meg rendesen (aka fail hard), ne kezdjen el ujrainditassal/stb... probalkozni.

Nalunk mindenbol legalabb 2 van: bejovo vonalbol, firewall-bol, load balancer-bol, szerverterembol, szerverbol, switchbol, ..., es mind failover setup-ban (tobbnyire automatikus failover).

Ez nemcsak rendelkezesre allast novel, de biztonsagossa teszi az upgrade/deploy -okat is. Sok ido es energia, de ahol komolyan gondoljak, boven megeri.

Azért ha egy raid10-ben az a-b párok egyike megpusztul, akkor közel sem bőven dögölhet meg a következő diszk, mert ha épp a döglött párja követi a társát az örök bitmezőkre, akkor azért nem leszel hűdeboldog... RAID esetén egyébként a gyors, olcsó, nagy megbízhatóságú tulajdonságok közül igazán kettő választható - amelyiket _nem_ fogja tudni a tömb :-P

Csak ha elromlik: a SMART altal jelzett legelso pending, vagy reallocated szektornal.

Vegyes a kép. Céges file szerveren (bár bőven van mentés róla) legfeljebb 3 évente csere. Többinél az első gyanús smart jelre, bár sajna az sem tud előre jelezni mindent.

RAID-nél ha elromlik az bőven elég szerintem. Bár még szerencsére csak 1x volt rá példa. Sajnos kissé soká tartott 2TB adattömböt "újraépíteni", de nem lett legalább adatvesztés. RAID nélkül viszont figyelni kell a SMART-ot, ha kezdődik a "bad sector" esemény, akkor már előjel, és gyors read-only adatmentés, csere. Erre viszont már többször volt példa.

Ha jól van tervezve/összerakva a RAID, akkor igen. De ez azt is feltételezi, hogy raid5 elfelejt, vagy legalább nem túl nagy diszkekből rak össze ilyen istencsapását az emberfia (huszonpár TB RAID5-ból kiszédülő diszk utáni rebuild közben megdöglő újabb egy-két diszk tökéletes forrása az örömnek meg a boldogságnak, pláne hajnali kettőkor....), hogy minél rövidebb ideig tartson a "térdre, imához" (eredeti nevén rebuild) időszak.
A SMART-ra támaszkodás, meg az egy diszken tároljuk az még desktop esetben sem biztos, hogy vállalható, szoktam mondani, hogy ami egy példányban van meg, az nincs meg.

Egy "régi motoros" ismerősöm és az Ő bölcsességei jutottak eszembe, úgy mint pl:
1, pénteken új dologba nem kezdünk, senki se akar hétvégén túlórázni, ha valami nem jól sikerül
2, ami működik, ahhoz nem nyúlunk és nem rontjuk el

Én úgy tapasztaltam, hogy a vinyó halál viszonylag ritkán jósolható meg előre. Bár van kivétel, és olyankor illik is cselekedni, de egyébként én is "Csak ha elromlik" opciót választottam. Egyébként meg sub, csak az olyan snassz, mikor csupán ennyit ír be valaki :P

Tobbnyire virtualis szervereket hasznalok, a szolgaltatom megoldja a cseret akkor es amikor kell, en meg eszre sem veszem, es ez igy nekem jo.

--
|8]

Nem mindegy, hogy milyen hhd.
Valódi szerver kategóriában leírják a hibajelenségeket és gyakoriságukat, amikor cserélni kell.
Valamiért mindig kisebb a diszkek mérete a boltban kaphatóhoz képest, amikor pl. IBM szerverbe kerülnek.
Ez arra utal, hogy megbízható gépbe csak a kiforrott technológia kerülhet.

Ezen kívül az oprendszer is meghatározó: kezeli-e a hibákat, vagy nem.

egyéb: három év után azonnal, amint van rá pénz.

Kicsit szűkek a választási lehetőségek. Speciel érdekes lenne (szerintem), hogy a "Csak ha elromlik" lehetőségen belül hányan szavaztak ténylegesen arra, hogy csak akkor cserélnek, ha el is romlott, illetve hányan arra, hogy ha okot ad rá, de még nem romlott teljesen el.
---------------------------
���������������������������

http://pastebin.com/GByXPtkL (home 'server') Ideje lenne aggódnom? :(
Kicsit off topic, de mi a legegyszerűbb módja annak, hogy ha gáz van automatikusan leállítsa és szóljon?

Évente karbantartom a vinyót a következőképpen:

1. Kiszedem
2. Panelt lecsavarozom
3. Ami poros azt pormentesítem
5. Az érintkezőket kontaktspray-vel lepucolom, oxidmentesítem.
6. Panel vissza
7. Gépbe vissza...

6-8 éve húzzák az igát amiket így karbantartok, néhány gép közülük éjjel-nappal üzemel. 2-3 év alatt jól látható oxidréteg képes képződni az érintkezőkön, évenkénti pucolással ezt a hibalehetőséget kiküszöbölöm.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Nem csak otthon, melóhelyen is. 12 gép, gépenként 3-4 vinyó. Egy vinyó fent leírt karbantartási módja 5 perc. 4 vinyós gépnél időben:

gépház kipakolása: 2 min
gépoldal leszedése: 1 min
vinyók kiszedése:
- ha csavaros 4*2 min
- ha patentos 4*10 sec
a vinyóval végzett munka: 4x5 min
vinyók visszaépítése:
- ha csavaros 4*2 min
- ha patentos 4*10 sec
gépoldal vissza: 1 min
gépház vissza: 2 min

gépenként max. 45 perc alatt elvégezhető.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Workstationok, egy web-mail-ftp szerver, és egy routergép. 1-1.5 óra kiesés itt nem kritikus.

Hogy érdemes-e? Sokszor volt olyan, hogy egy vinyó motorja nem indult, vagy menet közben cincogott, stb... ezeket a hibákat az esetek 80%-ában kontakthiba okozta. 1 műszak alatt végig lehet szaladni az összes gépen, inkább akkor pucoljuk az érintkezőket, amikor nincs más fontosabb tennivaló, ne akkor jöjjön elő, amikor volna sokminden más. ( helyi TV, évente 1 hét leállás ütemezve )

Nem csak a vinyókat pucoljuk ilyenkor, hanem minden olyat, amit össze kell dugni (memória, proci, kártyák érintkezői). 2 évente a procikat is hűtőzsírozzuk.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Ezt teszi a szerver/nem szerver.
diszk lecsatolás: 1 min
diszk csere: 1 min
diszk felcsatolás: 1 min
(agyhalott operátort feltételzve, amikor minden parancsot el kell olvasni)

HA a szerver döglött be - mivel nincs cluster vagy virtualizáció
diszk 2db áthelyezés: 2 min
alkalmazás átkonfigurálása: 2 min
(elvárt képességek mint fent)

rendszer újrarakása új/tartalék gépre/diszkre: 20 min

Szerverenként 4-8 diszk, de általában soha nem kell cserélni.

Ez szerver környezetben. :)