RAID tömb mellé ... hot spare-t.

 ( trey | 2014. március 31., hétfő - 10:13 )
ha tehetem, mindig teszek egy global
18% (53 szavazat)
ha tehetem, mindig teszek több global
6% (18 szavazat)
ha tehetem, mindig teszek egy dedicated
7% (20 szavazat)
ha tehetem, mindig teszek több dedicated
2% (5 szavazat)
csak bizonyos RAID level (leírom) esetén teszek
2% (7 szavazat)
ritkán teszek
8% (24 szavazat)
sosem teszek
19% (56 szavazat)
Egyéb, leírom.
2% (6 szavazat)
Csak az eredmény érdekel.
36% (107 szavazat)
Összes szavazat: 296

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

"ha tehetem, mindig teszek egy global", ahol a "ha tehetem" kb azt jelenti, hogy 5-nel tobb diszk van (vagyis 5 a tombben + 1 hot spare).

Én tennék, de nem fizetnék ki. Illetve az is ugyanannyit pörög, mint az, ami meghal, így jó eséllyel a spare is lehalhat, mire szükségem lenne rá. :)

Normális raid kártya nem pörgeti a hot-spare diszket (vagy legalábbis beállítható ez az opció).

Szerintem storage esetében ez nem feltétlenül van így, legalábbis nem látom értelmét, hogy folyamatosan pörgesse.

"Általában teszek mellé, lehetőleg más szériából származó lemezt."

Ez egy friss sor a brosúrákban. Mindegyik pörgeti, egyébként nem lehet bizonyos benne, hogy működik-e.

Miért kell folyamatosan pörgetnie?

Kérdezd meg a gyártókat róla, de a storage nem az a hipp hopp feature mániás üzletág.
Amire én tippelek, nem kell így egy plusz logikát és energiagazdálkodást beleépíteni és a hotspare lemez állapotát is tudják ellenőrizni.
A tárolók esetén a plusz mínusz egy lemez fogyasztásban már mindegy.
... esetleg az LSI ezzel nem akart foglalkozni.

De már rájöttek, hogy zöldülniük kell, de mire kizöldülnek mehetnek a levesbe. A klasszikus tárlózás már egy szűkülő terület.

DELL storage-okat használunk, semmilyen érdemi információt nem találtam arról, hogy a lemezek pörgetve vannak-ek.

Néztem egyet neked:

https://flic.kr/p/mDTuox

Abban a Dell storage-ban is van biztosan ilyen feature, ott meg tudod nézni.

--
trey @ gépház

Ugyan nem Dell storage, de Dell -gepben levo- vezerlo: PERC H710P Mini

Nekem porgeti a hot spare-t is:


root@backup1:~# omreport storage pdisk controller=0 | grep -E '^(Name|State|Power|Hot)'
Name : Physical Disk 0:1:0
State : Online
Power Status : Spun Up
Hot Spare : No
Name : Physical Disk 0:1:1
State : Online
Power Status : Spun Up
Hot Spare : No
Name : Physical Disk 0:1:2
State : Online
Power Status : Spun Up
Hot Spare : No
Name : Physical Disk 0:1:3
State : Online
Power Status : Spun Up
Hot Spare : No
Name : Physical Disk 0:1:4
State : Online
Power Status : Spun Up
Hot Spare : No
Name : Physical Disk 0:1:5
State : Ready
Power Status : Spun Up
Hot Spare : Global

En bizom benne, hogy ha ok ezt talaltak ki default-nak, akkor ez jobb is igy nekem. ;)

Hogy vegyed a winyot, vazze! :-)
--
Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant.

Szerintem se porog a hotspare, de ha olyan bios van, ami porgeti (el tudok kepzelni ilyen bugot), akkor meg legfeljebb nem adod hozza a RAID vezerlo altal kezelt diszkekhez (kiajanlod JBOD meghajtokent), ennek annyi a hatranya, hogy manualisan kell beimportalni es hozzaadni replacementkent a kidolt diszkhez.
--
Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant.

Tudnék mondani egy speciális esetet, amikor a hot spare jelenléte megakadályoz egy olyan banális leállást, hogy ihaj. Találkoztam egy olyan firmware hibával, ami esetén a következő a szituáció:

Adott egy RAID6 tömb, azon egy LUN, ami iSCSI-n keresztül ki van ajánlva X darab ESXi hostnak. Ha a RAID6 tömbben meghal egy diszk, akkor a storage azonnal "Error" állapotba kerül és megszünteti a LUN prezentálását az ESXi-k felé. Nyilvánvaló, hogy ez bug, hiszen RAID6 esetén egy (sőt, akár kettő) diszk hiba esetén mennie kellene a dolgoknak tovább, mint ha mi sem történt volna.

Ha kicseréled a RAID6 tömbben a hibás diszket, akkor megkezdődik a rebuild és újra prezentálódik a LUN a hostok felé. Az adatok nem sérülnek.

Ha van hot spare, akkor a storage nem kerül "Error" állapotba. A bugot már javította a gyártó:

Idézet:
[Description]
Due to a firmware bug in SCSI TPGS (Target Port Group Support) code, TPGS compliant multipath drivers
may perform undesirable actions. These actions range from unnecessary path failover (Solaris MPxIO,
Microsoft MPIO with MSDSM) to total data access loss in VMware vSphere 4.0 and above.

[Impact]
For ESX servers 4.0 and above, it will lose data access in case of a disk failure in RAID6 until the faulty disk
is replaced. For other platforms that use SCSI TPGS protocol it results in unnecessary path failovers and
sub optimal path selection.

--
trey @ gépház

Jo, azert ez finoman szolva nem a tipikus eset amiert hot spare-t szoktunk hasznalni.

Nyilvánvaló, csak mint érdekességet említettem meg.

--
trey @ gépház

A diszkjeinket ugye legyártják Kínában/Japánban/valahol, majd elszállítják Thaiföldre ahol összerakják úgy kábé. Aztán azt a logisztika elrugdossa egy helyi lerakatig. A gyár helyi lerakatából átlökdösik a Vendor raktárába ahol dobálgatják még egy picit mire bekerül a helyére. Ők tudják hogy diszkekre azért kb vigyázunk, így még túlél egy gyors QA processzt hogy utána megvegye valaki.

Nagy cégként itt jövünk mi.

- Rendelünk belőlük néhány raklappal mert úgy olcsóbb. Ezt Kínában fel is teszik egy gépre és átrepítik a mi globális lerakatunkba valahol a közel-keleten.
- Közel-keleten ezt elteszik a többi doboz közé.
- Fél évvel később én jelzem a logisztikának, hogy kéne. Ők leveszik a polcról és átszállítják Lengyelországba EU-s vámügyintézésre.
- Papírozás után átrepül Londontól délre egy helyi raktárunkba ahol kitalálják hogy hova is megy meg miért.
- Tévedésből elküldik az irodai címemre ahol megjelenik az íróasztalom mellett. A kollégák írnak mailt hogy menjek be mert baj van.
- Bemegyek, nyomtatok rá matricákat a jó címmel, kollégák visszaviszik a portára.
- Felveszi a futár, aki átjuttatja a DC kerítésén.

Hát ezért rakok storage enclosure-onként (legalább) két hot spare-t, és ezért lesz szekrényenként 40-60 TB kihasználatlan helyünk.

:D - jók a videók...
--
http://naszta.hu

Általában (sw)Raid1-et használunk. Ami itt érdekes, hogy miért is legyen spare, ha rögtön lehet 3 lábú is (dedikált verzióban gondolkozva). Multkor be is igazolódott a létjogosultsága, 24 órán belül két diszk minusz a háromból.

Azért ott valami igen csúnyán kiment. A hot-spare lényege, hogy nem vagy csak időszakosan pörög fel (hogy ne a hibás diszknél derüljön ki, hogy nem is indul...), illetve van amikor pörög folyamatosan, hogy még azzal se kelljen vesződni. Elvileg a sima pörgés jóval kevésbé veszi igénybe a diszket, a folyamatos tekerés.

arra gondolt, hogy 3 diszk volt raid1-ben, es abbol nyugodtan meghalhat ketto.

Az vilagos, ha sokdiszkes linux softraid install van enis siman csinalok 3+1 diszkes raid1-et a rendszernek. Pusztan a 24 oran belul ket diszk is meghal nem egy jellemzo dolog gepen belul.

Az utolso mondatodban tevedsz. Kissebb az eselye, mint az egy diszk meghalasanak, de meg boven a jellemzo kategorian belul van, foleg, ha meg plusz faktorok is raerositenek, mint pl. az egy szeriabol szarmazo diszkek.
--
Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant.

DAS: minimim 1 egy dedicated/raid
SAN: több global. De pl. vannak storageok amik nem is enged X darab hot spare nélkül raid-er konfigurálni...

Láttam már olyat aki tett :p
Amúgy raid 1 mellé szoktam csak, ha az softraid, és egy amúgy használt diszkről egy partíciót rátudok tenni.

--
Fontos! Ha berágok, nem feltétlen személyed ellen szól...
openSUSE 13.1 x86_64

ZFS, RAIDZ2
Heti scrub.
Ahol sebesség kell, ott mirror vdev-ek, a távoli backup pedig raidz2.

--------------------------
Mini PC-k
Youtube csatorna