Ha egy diszk megbízhatósága p, akkor mennyi egy raid6, raid5, raid10, raid1E rendszer megbízhatósága?
A matematikai tudásom nem elégséges a kérdéseim megválaszolásához :-(A diszk megbízhatóságá a vizsgált élettartamban (elsõ 5 év), a gyártó úgy adja meg, hogy mekkora két meghibásdás közötti várhatóan eltelt idõ (MTBF). Ez nem túl jó metrika, mert a diszk egyszercsak tönkremegy (várható élettartam), és utána kidobjuk, mert tönkrement. Nincs két hiba, ami között jól viselkedik.
De, mégis, tegyük fel, hogy tudható az, hogy valamennyi idõ alatt valamekkora valószínûségggel hibásodik meg, és ez mindíg ugyanannyi az élettartama alatt. Egy diszkre legyen: 1 óra alatt p valószínséggel nem hibásodik meg.
(Ekkor 1 év alatt p^8760 valószínséggel nem hibásodik meg, oks.)
A raid1 akkor megy tönkre, ha egyszerre két diszk hibásodik meg. Rámondhatjuk, hogy 1-(1-p)^2 a jósága (óránként) de ez nem igaz, ugyanis egy spare berakása és a rekonstrukció R óra, és ha ezalatt hibásodik meg a korábban túlélt eredeti diszk, akkor is elesett a raid.
A raid10 az N darab (N páros egész) diszkbõl áll. Egy spare beillesztése R óra. A raid10 tönkremegy, ha egy diszk kiesése esetén R idõnél hamarabb esik ki a kiesett diszk párja. Minden diszknek pontosan 1 párja van.
Az a gyanum, hogy a raid10 megbízhatósága az N növelésével csökken, és elöbb-utóbb eléri az 1 diszk megbízhatóságát. Kiváncsi lennék erre a grafikonra. (N, R, p)
A raid1E (linux raid10 implementáció) hasonló a fentihez, de minden diszknek két párja van, a rekonstrukt ideje alatt 2 olyan diszk is van, aminek kiesése a terljes raid elesését is okozza. a diszkek száma: N, 2-nél nagyobb egész (nem kell, hogy páros legyen). Itt is kiváncsi vagyok, hogy mikor lesz az egész rosszabb, mint 1 diszk. (N, R, p)
A raid5 esetén 1 diszk kiesése esetén valami R rekonstrukciós idõ alatt bármelyik másik esik ki az N-1 diszkbõl, a tömb meghalt. Itt is kiváncsi vagyok arra a küszöbre, aminél nagyobb raid5 már kevésbé megbízható, mint 1 diszk (N, R, p) összefüggés, N -> (N, R, p) grafikon.
A raid6 esetén 2 diszk kiesését még túléli, de 3 diszkét már nem. Az elsõ diszk kiesésénél indul el a rekonstrukció, és a rekonstrukció ideje alatt nem szabad, hogy még 2 kiessen. Itt is kiváncsi vagyok arra a küszöbre, aminél nagyobb raid6 már kevésbé megbízható, mint 1 diszk (N, R, p) összefüggés, N -> (N, R, p) grafikon.
Tapasztalatból tudom, hogy az egyre nagyobb diszkek esetén növekszik az R rekonstrukciós idõ. Az a tippem, hogy az R rekonstrukciós idõ növekedésével a "vállalható N" erõsen csökken. A raid10, raid1E rendszerek esetében a rakonstrukciós idõ sokkal kisebb, mint raid5, vagy raid6 esetén. (12 óra versus 3 nap, 1TB diszk esetén, entry-level storage rendszerben).
A grafikonokból olyan vegyes kérdéseim is vannak, hogy hány diszk esetén megbízhatóbb a raid10, mint a raid5, vagy ha a raid10 rekonstrukciós ideje másfélszerese a raid1E rekonstrukciós idejének, akkor melyik a jobb stb.
Természetesen nagyon köszönöm magukat az összefüggéseket is, de ha nem lehetetlen elemi módszerekkel megmagyarázni, akkor a magyarázatot is.