A redundancia jó - ha "működik"

DX80 iSCSI kettős controller modul hiba

Emberek azért fizetnek ki sok pénzt bizonyos informatikai eszközökért, mert azok nagyobb rendelkezésreállást biztosítanak olcsóbb társaiknál redundáns alkatrészek - táp, vezérlőmodulok, portok stb. - felhasználásával. Éppen ezért bosszantó az, amikor egy ilyen eszközben a redundáns alkatrészek pontosan egyszerre mondják fel a szolgálatot. Az meg még bosszantóbb, ha erősen úgy fest, hogy nem hardverhiba, hanem bugos firmware a probléma okozója. Ráadásul a probléma nem egyedülálló, több másik ügyfél is áldozatául esett.

A probléma: a storage eszköz szabályos leállítása, majd indítása után mindkét kontroller összes iSCSI host portja "0x0010" hibakóddal halott lesz. Mindennemű kísérlet (firmware downgrade, firmware upgrade, controller ki-be stb.) dacára a helyzet nem változik.

A gyártó elemzi a problémát. A gyártó védelmében el kell mondani, hogy az eszköz már rég nem garanciális, bár szerintem ez nem menti fel teljesen a probléma alól. Főleg ha kiderül, hogy tényleg firmware hiba okozta a problémát. Mert az a garanciális idő alatt is előjöhetett volna.

Hozzászólások

Ilyenkor ugyfelnek mit lehet mondani? Sorry, de a reduandancia nem volt eleg? Offsite backup van, vagy masik eszkozben eletre keltheto a tartalom?
____________________
http://szoftvervasarlas.co.hu - szoftverek legjobb áron

Saját eszközöm, így én mondjuk úgy, hogy megértem.

Semmi kritikus nincs már rajta a koránál fogva. Néhány nem kritikus virtuális gép futott róla. Természetesen van róluk virt. gép szintű backup. Amik kellettek már vissza is lettek állítva.

Engem inkább az foglalkoztat, hogy ez most tervezett elavulás :D vagy tényleg firmware bug.

--
trey @ gépház

Dőlt alattam már Dell diszk array is össze úgy hogy mindkét vezérlő megadta magát. Ha jól rémlik ott is hasonló probléma volt, de valami "mondj el három miatyánkot és kelet felé fordulva ebben a sorrendben kapcsold be újra" megoldással életre lehetett kelteni miután 1-2 órát törte a fejét rajta a support.

Hát, tegnap reggel jelentettem be, még vakarják a logfájlokon a fejüket Németországban. Kíváncsi leszek a magyarázatra, főleg ez után:

"Hi,
I've got the same problem with DX80 (iSCSI) . After shutting down the system, it comes up again with all host ports dead. I sent the log files to fujitsu and they confirmed a hardware error of both controllers."

Én kötve hiszem, hogy két kontroller egyszerre hardveresen meghibásodik egy szabályos leállítástól, ráadásul csak a host portok mindegyiken és nem csak egy ügyfélnél, hanem legalább 8-nál csak az internetes fórumpostok alapján. Ráadásul mindenkinél ugyanazzal a hibakóddal.

--
trey @ gépház

Persze, ez mindig benne van, de nekem azért gyanús a dolog, mert indításkor a portok felélednek, a switch portokkal össze is állnak, csak utána mennek down-ba.

Nyilván ettől nem még nem lehet kizárni a hardveres hibát teljesen, de pont ezzel a típussal volt már korábban csúnya firmware hiba, amit a gyártó sikeresen javított. A kiadása után jött egy "S2" modell, ami sokkal stabilabbnak tűnik (van abból 2 nálam).

--
trey @ gépház

az SDS megoldasoknak ez a nagy elonye (meg par nagyobb arraynek is) hogy nem 2 kontroller van, hanem (megoldastol fuggoen) akarmennyi, amennyit szeretnel.

Összességében megéri Eternus-t venni újonnan? Alig halok valamit róla, akkor is csak a hibákat, de lehet amúgy egy szuper cucc.

Jó párat üzemeltetünk, támogatunk. Nincs vele több baj, mint más gyártók termékeivel. Ilyen hibákba én már belefutottam közvetve vagy közvetlenül HP, IBM stb. gyártóknál is. Ez csak ügyfél preferencia és pénztárca kérdése.

Egy biztos, akármilyen központi storage-od van, ha csak egy van és nincs mentésed, akkor az kapufa.

Ha csak egy van és az beszarik, bajban vagy. Hiába van mentésed, ha nincs hova visszaállítani. Úgyhogy egy storage nem storage, két storage egy storage.

Hacsak nem valami olyan drága megoldásod van, ami a komplett storage kiesése ellen is véd. Olyan is van, ára nem ez a kategória.

--
trey @ gépház

Ok, bármelyik alkatrész megmakkanhat bármikor, kell a redundancia és a mentés, de az Ethernus kapcsán szinte csak FW problémák rémlenek fórumokon, pl háklis winyókra és kilöki a tömbből az elvileg hibátlan darabokat, meg hasonlók. De ezek szerint a többi gyártó se jobb.

7-8 év alatt egy diszkhiba volt ezzel a konkrét storage-dzsal. Sajnos az firmware buggal is társult, de a gyártó az néhány óra alatt megoldotta.

Ezeket az eszközöket a garancia letelte / életciklusának vége után elvileg kukázni kéne. Sajnos a magyar valóság nem ugyanaz mint amit egy külföldi gyártó megálmodik.

Az S2-es verziójával (FC-s és iSCSI-s is van) eddig 3-4 év folyamatos üzem alatt 0 diszkhiba és 0 firmware volt. 24 diszk pörög bennük.

Az egyikben egy redundáns tápot kellett menet közben cserélni, mert az eldurrant pár éve. Ezen kívül problémamentesek voltak.

--
trey @ gépház