Szerver HDD cseréket megejtem:

 ( Oregon | 2013. november 12., kedd - 8:45 )
1 év után kötelezően, hibamentességtől függetlenül.
0% (1 szavazat)
2 év után kötelezően, hibamentességtől függetlenül.
1% (6 szavazat)
3 év után kötelezően, hibamentességtől függetlenül.
4% (16 szavazat)
Csak ha elromlik.
63% (267 szavazat)
Csak az eredmény érdekel.
31% (132 szavazat)
Összes szavazat: 422

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Azt hiszem nekem újra kell gondolnom a stratégiámat, mert lehet jobb lenne időzíteni az ilyen feladatokat. :)

(x) ha a menedzsment szoftver okot ad rá (pl. prefailure állapot, hiba stb.)

--
trey @ gépház

+1

SMART adatokat nézem szinte az összes gépen muninnal.

Az beleveheto a "ha elromlik"-ba szerintem. Ujabb szavazas johet arrol, hogy kinel mi a hatar az "elromlott"-ra. :)

A fix idot en mindenkepp tulzonak tartom, kiveve ha felsobb helyrol elvaras es fizetik a poliszit. Van diszk ami 1 ev utan (pedig sas meg enterspajz megminden) es van ami mar kozel 9 evnyi uzemorat porgott.

A 9 évet mindenképpen túlzásnak tartom. 9 éves vinyó legföljebb 80GB-os. Egy más célra újonnan vett NAS-on, vagy újonnan épített RAID-en egy ici-pici volume-on elfér az a 80GB, a lecserélés költsége szerintem köbö a 80GB átmásolásához kellő munkadíjnak felel meg.
Amúgy ha lett volna olyan opció, hogy "legföljebb 5 év, vagy ha hibázik", akkor azt választottam volna.

Az már nálam 3 év felett. :)

A fix idős csere szerintem több gondot okoz mint amennyit megold. Egy jó merevlemez 10 évig is elmegy, de van olyan új merevlemez ami fél év után megdöglik. Gyártási hiba lehet az ok, garanciában természetesen cserélik de adatmentés ritkán jár a garancia mellé. Egy felesleges csere, felesleges kockázattal is jár. Rendszeres backup és archiválás a megoldás adatbiztonságra és nem a felesleges merevlemezcsere.

A mai ínséges időkben azt hiszem nagy luxus* előre meghatározott időszakonként cserélni ezeket. A rendszer legyen hibatűrő és legyen tartalék a polcon. Ott elfér és nem kopik :)
* Kivéve, ha más, kevésbé kritikus helyre még felhasználható.

Mi számít hibatűrőnek? Egy RAID10-ben bőven dögölhet meg a másik diszk, míg az újra próbál rámászni az adat...
A több paritásos megoldások (pld. RAID6) pedig sok helyre lassúak.
--
zsebHUP-ot használok!

Pont így jártam (RAID10). 3,5 éves diszkek és a spare is halott volt már.

"a spare is halott volt már."
Ez menet közben hogy-hogy nem derült ki?

PEBKAC

Persze, minden relatív, az adott helyzet határozza meg és a te tapasztalaid mást mondhatnak. Én úgy látom, hogy több (>3) lábú RAID10 esetén elég jó esélyünk van, hogy nem az előbb kihullott vinyó párja esik ki következőnek. Ha a polcról bekerül a tartalék jó eséllyel hamarabb összeszinkronizál, minthogy behalna egy másik.
Persze, nem zárható ki. Ahogyan az sem, hogy a vadi új vagy üzemórában fiatal vinyó egyszer csak kiesik. nagy számú mintából vett statisztikával lehetne dönteni.
Jobb híján a saját kis számú mintámból (100+ HDD) tudok következtetni.
RAID-10, RAID-50, RAID-60-nal + polcon lévő vinyóval + backuppal én azért elég jól alszom :)
Utoljára 2008-ban volt, hogy 4 vinyóból álló 2x RAID1-ből egyszerre 2 vinyó esett ki. Szerencsére mindkettőnek csak az egyik lába. Na az tényleg kicsit megemelte a pulzusomat :)

Azért egy mai 4 (lassan 6) terás diszknél az egyszerre elég tág fogalom tud lenni. Valahol a pár nap és a pár hét között...
--
zsebHUP-ot használok!

Igazad van. Számomra ez a méret/diszk már oroszrulett kategória :) Azt hittem másnál is. Pont az 1 diszkre koncentált adat mennyiség miatt megbuknak a korábbi hibatűrő technikák. RAID-hez nem is használok ezért 1TB feletti vinyókat.

Imádkozzam végig azt 3 napot, mire újraépiti? :)

Igen. Más lehetőség nincs.

Vagy használj háromlábú tükröt. Persze rendszeres backup mellett...

+1.

Inkabb az lehet, hogy egy "alombo'l" szarmazo diszkek hullanak ki egyszerre. Nalunk most egy (6+2)*1.5T-s RAID6-ban rohadt le 3 egyszerre, par nap (max egy-ke't he't) kulonbseggel, egzaktul 3 e'v utan. Az serial number-ek kozott minimalis volt a kulonbseg, szoval kabe egymas utan johettek le a gyartosorrol. 3bo'l ketto" kattogosra szarta o"ssze maga't, de egyro"l me'g ki lehetett vakarni az adatokat. Erdekes volt az is, sajat elektronikat kellett epiteni ami reszetelte egy bad sector kiolvasasa utan, csak ugy lehetett leolvasni rola, de ugy majdnem mindent... mindegy, ez ma'r ma's mese :]

Hibaturo az, hogy a rendszer barmelyik resze megdoglik, attol meg mukodokepes marad.
Valamint ha valami elromlik, akkor az dogoljon meg rendesen (aka fail hard), ne kezdjen el ujrainditassal/stb... probalkozni.

Nalunk mindenbol legalabb 2 van: bejovo vonalbol, firewall-bol, load balancer-bol, szerverterembol, szerverbol, switchbol, ..., es mind failover setup-ban (tobbnyire automatikus failover).

Ez nemcsak rendelkezesre allast novel, de biztonsagossa teszi az upgrade/deploy -okat is. Sok ido es energia, de ahol komolyan gondoljak, boven megeri.

Azért ha egy raid10-ben az a-b párok egyike megpusztul, akkor közel sem bőven dögölhet meg a következő diszk, mert ha épp a döglött párja követi a társát az örök bitmezőkre, akkor azért nem leszel hűdeboldog... RAID esetén egyébként a gyors, olcsó, nagy megbízhatóságú tulajdonságok közül igazán kettő választható - amelyiket _nem_ fogja tudni a tömb :-P

Csak ha elromlik: a SMART altal jelzett legelso pending, vagy reallocated szektornal.

Vegyes a kép. Céges file szerveren (bár bőven van mentés róla) legfeljebb 3 évente csere. Többinél az első gyanús smart jelre, bár sajna az sem tud előre jelezni mindent.

RAID-nél ha elromlik az bőven elég szerintem. Bár még szerencsére csak 1x volt rá példa. Sajnos kissé soká tartott 2TB adattömböt "újraépíteni", de nem lett legalább adatvesztés. RAID nélkül viszont figyelni kell a SMART-ot, ha kezdődik a "bad sector" esemény, akkor már előjel, és gyors read-only adatmentés, csere. Erre viszont már többször volt példa.

RAID nélkül, csupán SMART-ot figyelni: orosz rulett

Ha jól van tervezve/összerakva a RAID, akkor igen. De ez azt is feltételezi, hogy raid5 elfelejt, vagy legalább nem túl nagy diszkekből rak össze ilyen istencsapását az emberfia (huszonpár TB RAID5-ból kiszédülő diszk utáni rebuild közben megdöglő újabb egy-két diszk tökéletes forrása az örömnek meg a boldogságnak, pláne hajnali kettőkor....), hogy minél rövidebb ideig tartson a "térdre, imához" (eredeti nevén rebuild) időszak.
A SMART-ra támaszkodás, meg az egy diszken tároljuk az még desktop esetben sem biztos, hogy vállalható, szoktam mondani, hogy ami egy példányban van meg, az nincs meg.

szoftveres vagy hardveres raid volt?
Én nem tapasztaltam raid5 nél sem Tb-körüli tagoknál hogy túl lassú lenne a hardveres raid újraépítése

raid5 öt nagyon nem szeretem, de ezek a lehetőségek:)

raid10-hez meg minimum 2db hot spare

Ezek szerint nem használod a diszkeket, csak állnak, és unatkoznak.
--
zsebHUP-ot használok!

ebéd időben szinkronizáltam, lehet:)

Egy "régi motoros" ismerősöm és az Ő bölcsességei jutottak eszembe, úgy mint pl:
1, pénteken új dologba nem kezdünk, senki se akar hétvégén túlórázni, ha valami nem jól sikerül
2, ami működik, ahhoz nem nyúlunk és nem rontjuk el

Én úgy tapasztaltam, hogy a vinyó halál viszonylag ritkán jósolható meg előre. Bár van kivétel, és olyankor illik is cselekedni, de egyébként én is "Csak ha elromlik" opciót választottam. Egyébként meg sub, csak az olyan snassz, mikor csupán ennyit ír be valaki :P

+1

Kapacitásbővítés belefér, de egyébként dolgozza meg az árát. Utolsó SCSI-s szerveremben még vígan fut a 2001-es Quantum Atlas.

A második pont általam ismert változata:
Ami nem romlott el, azt nem javítjuk meg!

Tobbnyire virtualis szervereket hasznalok, a szolgaltatom megoldja a cseret akkor es amikor kell, en meg eszre sem veszem, es ez igy nekem jo.

--
|8]

Szerintem a felelősség áthárítása nem egyenlő az adatbiztonság növekedésével.
Feltételezem nem ismered a szolgáltatód rendelkezéseit ez ügyben.

Még illúziónak is hamis olyan dologban bízni amiről nem tudsz semmit.

Ismerem a szolgaltatom rendelkezeseit, megneztem, mielott szolgaltatot valasztottam. Roviden ok megoldjak, hogy az adataim biztonsagban legyenek, en ettol boldog vagyok. A mikentje meg nem erdekel.

--
|8]

Mint amikor a gyerekem megígéri: Apa vigyázni fogok!
Osztán olykor-olykor csak becsúszik: Bocsi, apa!

Ez egy gyereknek elnézhető, egy szolgáltatónak kevésbé, de ettől még nem biztos, hogy nem fordul elő.

Ha magam csinalnam, akkor se lenne jobb, csak tobb munkam lenne vele.

A kulonbseg annyi egyebkent, hogy a gyerek nem all veled szerzodesben, es nem fizet karteritest, ha megsem vigyaz elegge.

--
|8]

OFF
Nyuszipapa a lányokkal való mókára tanítja a fiát három nyuszilányon bemutatva:
-Figyelj fiam, így kell ezt csinálni! Mögéállok, nekikészülődök, és aztán egy-két-há! Na most te jössz!
-Mögéállok... Nekikészülődök, és egy-két-há-négy... Bocs papa!

Nem mindegy, hogy milyen hhd.
Valódi szerver kategóriában leírják a hibajelenségeket és gyakoriságukat, amikor cserélni kell.
Valamiért mindig kisebb a diszkek mérete a boltban kaphatóhoz képest, amikor pl. IBM szerverbe kerülnek.
Ez arra utal, hogy megbízható gépbe csak a kiforrott technológia kerülhet.

Ezen kívül az oprendszer is meghatározó: kezeli-e a hibákat, vagy nem.

Egesz pontosan mennyivel kisebb?
--
zsebHUP-ot használok!

-1"

:)

Azért ez egy buta kérdés.
A válasz ugyanilyen: harmada.

egyéb: három év után azonnal, amint van rá pénz.

Kicsit szűkek a választási lehetőségek. Speciel érdekes lenne (szerintem), hogy a "Csak ha elromlik" lehetőségen belül hányan szavaztak ténylegesen arra, hogy csak akkor cserélnek, ha el is romlott, illetve hányan arra, hogy ha okot ad rá, de még nem romlott teljesen el.
---------------------------
���������������������������

Rég láttam diszket teljesen megdögleni. Többnyire folyamatosan növekvő Reallocated_Sector_Ct ("kibaszkoggya a réd") vagy pörgő Raw_Read_Error_Rate-tel kísért belassulás a csere oka. A smart az esetek tizedében kerül FAILING_NOW állapotba.

A kicsit nem jó az nem jó. :)
Nem csak a nagyon nem jó a nem jó. :)

http://pastebin.com/GByXPtkL (home 'server') Ideje lenne aggódnom? :(
Kicsit off topic, de mi a legegyszerűbb módja annak, hogy ha gáz van automatikusan leállítsa és szóljon?

Évente karbantartom a vinyót a következőképpen:

1. Kiszedem
2. Panelt lecsavarozom
3. Ami poros azt pormentesítem
5. Az érintkezőket kontaktspray-vel lepucolom, oxidmentesítem.
6. Panel vissza
7. Gépbe vissza...

6-8 éve húzzák az igát amiket így karbantartok, néhány gép közülük éjjel-nappal üzemel. 2-3 év alatt jól látható oxidréteg képes képződni az érintkezőkön, évenkénti pucolással ezt a hibalehetőséget kiküszöbölöm.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Jaj... Bár a .sig alapján annyira nem csodálkozom :-P

Az jó, itt van vagy 500 db diszk, két IT-s kollégára.
Max. arra van energiánk, hogy a szervereket monitorozzuk.

Na ja... De azt is megnézném, hogy egy EMC/HP/IBM/satöbbi storage gyártója mit szólna egy ilyen "karbantartás"-hoz :-)

Azok hobbicégek csak, ne keverd őket ide. :)

Dell storage support-hoz rendszeresen van szerencsém, minőségben versenyeznek egy garázscéggel..de legalább kva drágák.

Gondolom ezt otthon csinálod és nem a Googlenél vagy az Amazonnál. :)

Nem csak otthon, melóhelyen is. 12 gép, gépenként 3-4 vinyó. Egy vinyó fent leírt karbantartási módja 5 perc. 4 vinyós gépnél időben:

gépház kipakolása: 2 min
gépoldal leszedése: 1 min
vinyók kiszedése:
- ha csavaros 4*2 min
- ha patentos 4*10 sec
a vinyóval végzett munka: 4x5 min
vinyók visszaépítése:
- ha csavaros 4*2 min
- ha patentos 4*10 sec
gépoldal vissza: 1 min
gépház vissza: 2 min

gépenként max. 45 perc alatt elvégezhető.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Szolgáltatás addig áll?
Mert gondolom nem a hotswap raidből kapod ki a hdd-t. )

Nem hiszem, hogy ezek szerverek lennének, szerintem workstation PC-kről beszél, azt meg egy éjszaka alatt végig is lehetne söpörni. Az, hogy érdemes-e egyáltalán, pedig egy másik történet.

Workstationok, egy web-mail-ftp szerver, és egy routergép. 1-1.5 óra kiesés itt nem kritikus.

Hogy érdemes-e? Sokszor volt olyan, hogy egy vinyó motorja nem indult, vagy menet közben cincogott, stb... ezeket a hibákat az esetek 80%-ában kontakthiba okozta. 1 műszak alatt végig lehet szaladni az összes gépen, inkább akkor pucoljuk az érintkezőket, amikor nincs más fontosabb tennivaló, ne akkor jöjjön elő, amikor volna sokminden más. ( helyi TV, évente 1 hét leállás ütemezve )

Nem csak a vinyókat pucoljuk ilyenkor, hanem minden olyat, amit össze kell dugni (memória, proci, kártyák érintkezői). 2 évente a procikat is hűtőzsírozzuk.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Tegyék hozzá, hogy a 12 gép/ember elég szerencsés felállás.

Ezt teszi a szerver/nem szerver.
diszk lecsatolás: 1 min
diszk csere: 1 min
diszk felcsatolás: 1 min
(agyhalott operátort feltételzve, amikor minden parancsot el kell olvasni)

HA a szerver döglött be - mivel nincs cluster vagy virtualizáció
diszk 2db áthelyezés: 2 min
alkalmazás átkonfigurálása: 2 min
(elvárt képességek mint fent)

rendszer újrarakása új/tartalék gépre/diszkre: 20 min

Szerverenként 4-8 diszk, de általában soha nem kell cserélni.

Ez szerver környezetben. :)

Én még azt hozzáteszem, hogy középen az elválasztásnál szétszedem, és a korongokat puha ruhával végigtörlöm.
:-P

(nem.)

Én a tükrökön Clint használok.
--
zsebHUP-ot használok!

Én meg kiveszem a tárcsát és tükörnek használom.

Ha vannak rajta mikroforgácsok annak eltávolítására pedig tökéletes a mágnes. :)