Katasztrófatűrő HP rendszer - felrobbantva...

Címkék

A golyóálló HP szerver és földrengésálló Sun Project Blackbox után a HP most azt próbálja bemutatni egy video-n, hogy milyen is egy igazi katasztrófatűrő rendszer. Az Arkansas-i Camden-ben levő National Technical Systems ballisztikus központjában a HP mérnökei egy igazi gázrobbanást szimuláltak. A robbantás során egy komplett adatközpontnyi működő berendezést tettek a földdel egyenlővé.

A felrobbantott rendszer HP Integrity szerverekből, StorageWorks XP termékekből, HP Procurve hálózati elemekből állt. A rendszer öt különböző operációs rendszert futtatott. Ezek HP-UX, HP OpenVMS, HP NonStop, Red Hat Enterprise Linux, Microsoft Windows Server 2003 rendszerek voltak. A teszttel a HP mérnökei azt akarták demonstrálni, hogy egy ily méretű katasztrófa esetén mennyi időre van szükség ahhoz, hogy a megsemmisült rendszerek által futtatott szolgáltatások újraéledjenek egy másik, készenlétben álló infrastruktúrán. A teljes failover kevesebb, mint két perc alatt lezajlott (és a halak is túlélték :).

A video megtekinthető itt.

Hozzászólások

fish-failover 294 sec LOL

-- pgergely --

Az azert erdekelne, hogy a W2k3-nak, es a linuxnak miert tartott ennyi ideig a failover.

--
Fontos feladatot soha ne bizz olyan gepre, amit egyedul is fel tudsz emelni!

Nem tudom, de egy ilyen katasztrófa esetén a < 2 perc failover nem rossz eredmény. Ez még bőven belefér az 5 9-es rendelkezésre-állásba. Akár kettő ilyen is történhet egy évben, még akkor is jók. Mondjuk 2 ilyen esemény mellett több hiba már nem igen fér bele :) (évi 5.26 perc kiesés).

--
trey @ gépház

Azért abban biztos lehet, hogy a HP által fejlesztett rendszerek (HP-UX, HP OpenVMS) sokkal jobban fognak szerepelni a HP vasakon, mint a 3rd party RHEL, vagy éppen a Windows. Emellett HP-UX és az OpeVMS esetében kimondottan ráfekszenek a disaster témára.

--
trey @ gépház

Vazze itt átlövik, meg robbantgatják, meg szétrázzák a jó kis cuccokat. Inkább adnák nekem, jobb célra is fel tudnám őket használni:-D

Ha legközelebb atombombával fognak tesztelni, akkor elkezdek gyanakodni, hogy valami készülődik...

Dw.

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

Miért kell ehhez robbantani? Nem lett volna elég az adott gépeket egy mozdulattal levágni a hálózatról?

Szerintem teljesen mindegy, hogy zárlatos lett az UPS és ezért minden gép kikapcsolt, vagy elvágta a kubikos a hálózati kábelt, vagy esetleg felrobbant a gépterem.

G

a sun-os táncoló indus jobban tetszett ... az is majdnem csinált ekkora katasztrófát :)

nekem nem jön le a video, valaki tolja fel YouTube-ra.

A következő cluster tesztnél és is egyszerűen felrobbantom majd az egyik node-ot. :-)

Ave, Saabi.

Valóban, a szíved csücske oprendszer cluster megoldása, amikor minden IP címnek-nek saját hálózati kártya kell, sokkal jobb megoldás. :-(

Amúgy ugyan milyen portokat nyit meg szerinted? Másfelől kit érdekel? Ha valakit zavar, takarja el egy pár tűzfallal.

Ave, Saabi.

Nem az IP-cím/hardveres interfész 1:1 megfeleltetés a szívem csücske, bár az arra azért kellemesen használható, hogy címátvétel esetén hw-cím is átkússzon az egyik noderól a másikra.
Portlista van élő, supportált clusterről nálam (pontosabban bent a munkahelyemen), és a panasz elsődlegesen az ottani kollégától hangzott el.

Csalódtam a Nonstop OS-ben. Mi tartott 33 másodpercig? Nem ezt szoktam meg tőle.

--
- Hogyan lehet tanulni? - Jól kell tudni kérdezni. - Hogyan lehet jól kérdezni? - Ahhoz sokat kell tudni...

amúgy ez qrva értelemes dolog volt. inkább lihúzták volna a kábelt, és úgy mérik az időt. Értelmetlen hülye környezetszennyezés.
---
Reactor error - core dumped!

Hmmm, és ez a hup leállás most belefért az 5 percbe? :)