Tudtok erről valamit?
A c1 nem jön be, alatta a szerverek kiestek.
balazsasd
Hozzászólások
Kaptam választ facebook-on:
"
A szünetmentes tápegység karbantartása során probléma jelentkezett, de a hiba elhárításán már dolgoznak munkatársaink. Ez várhatóan 15-20 percet vesz igénybe.
Ha balfasz a karbantarto ceg akkor baszhatod a baypassod vagy az agregatorod :) Nalunk anno ketszer is lebasztak az egesz szerver szobat a villanyrol..... Hiaba volt bypass meg aggregat.....
Szerintem a kovetkezo tortent: Bypass-ra tetettek a szunetmentest elvegeztek a karbantartast, majd mikor visszakapcsoltak( az amugy tulterhelt szunetmentes) kapott egy nagyobb loketet es leoldott. Mivel utana fokozatosan terheltek nem jelentkezett a hiba es kezdodhetett a normal szerverszoba inditas. Gondolom az indulas ott sem 10 perc alatt van meg.
ahogy Facebookon írtuk, illetve a telefonálóknak telefonon mondtuk azt itt is utólag megerősítem.
A Victor Hugo utcai, 5.emeleti szervertermünkben az egyik szünetmentes táp akkumulátor cseréje zajlott, külső mérnökiroda szakemberei által.
A karbantartás alatt természetesen bypasson üzemelt a rendszer. A visszaengedéskor (amikor elkezd szinkronizálni az UPS a hálózati feszültséghez, de még bypasson vannak a fogyasztók) kapcsolta le a betáp oldali biztosítékot az UPS és ezzel a szerveremben lévő eszközök kb. fele alól kiesett az áramellátás.
Most már minden gép kap áramot és a szerverek többsége el is indult hibamentesen.
Az érintett ügyfeleinknek 12 órán belül emailen küldünk egy részletesebb tájékoztatót.
A c1-ben a belső hálózat és a szerverek redundánsan vannak két UPS-re bekötve, a cloud szerverek ezért nem álltak le, nem indultak újra, de az internet felé néző switch egytápos és ezért az kiesett, az érintett szerverek ezért nem voltak elérhetőek.
Amiről szó volt a c1 kapcsán az nem core eszköz, hanem egy access switch.
A border, core és disztribúciós eszközök hálózat-topológiailag és tápegységileg is redundánsan vannak bekötve, ezért is maradtak elérhetőek az áramkieséssel nem érintett szerverek.
Én nem tudom mi ez a c1 :> De akkor ezek szerint van akiknek olcsó access switchen megy ki a net, és vannak akiknek nem. Azt lehet tudni, hogy akik ilyen olcsóbb 1 tápos switchen keresztül kommunikálnak azoknak olcsóbb a szolgáltatásuk, valamint tudnak-e róla. Vagy elő van adva, hogy redundáns minden meg minden, aztán kiderül, hogy mégse annyira redundáns :>
Persze, hogy tudják, linket nem szeretnék beilleszteni ahol ez le van írva a honlapunkon, nehogy reklámnak tudjon.
Differenciálva vannak a szolgáltatások redundancia szerint és a kevesebb redundanciát tartalmazó kevesebbe kerül.
Az árammal csak a baj van :D http://hup.hu/node/70184?page=1&comments_per_page=9999
De kb. minden nagy (meg nyilván kicsi is, hehe) cég előadta már az elmúlt tíz évben valamilyen variációját, ami azért elég lehangoló képet fest a teknikáról. Bár... a Dataplex nem rémlik, ők még tartoznak ezzel :D
Az újabb termekben már ezekből a hibákból tanulva tervezték az elektromos hálózatot és hacsak nincs valami komoly eszközhiba, akkor nem is lesz gond. Eszközhiba alatt a konkrét váltást/bypasst adó "dobozra" gondolok természetesen.
Én vagyok túl analfabéta ehhez, de elolvastam a hozzászólásokat...
A biztonsági rendszer (UPS) karbantartása során az éles rendszert sikerült kinyírni? És ezt egy szakember cég csinálta, aki gondolom hetente több ilyet csinál. Jól értem?
A másik pedig, amikor a 230V visszajön és stabil (?), akkor a szerverek indítása olyan lassan haladt, hogy valaki több órára kiesett? VPShez vagyok szokva, ott egy restart alatt 3db ping marad ki (kb. 3 sec).
Tudom, hogy ez nem egy NASA központ, meg kis pénz kis foci...de akkor sem egy mikrovállalkozás irodai SMB megosztásairól van szó, ahol nem baj egy 15 perces leállás, majd az Excelben a CTRL+S-t ebéd után nyomják meg...
Félek internetes vállalkozásba vágni...vagy a clusterem álljon 5 gépből: linode+vulter+digitalocean+aws+akarki.szolgaltato.hu?
Szerintem ne legyenek illúzióid.
Az Amazon is állt már le. Az MS Azure-ban is történtek gáz dolgok, úgy hogy ott nem is szimpla VM-t béreltek, hanem platform vagy infrastruktúra szolgáltatást.
Egy szerver-szerver jellemzoen lassan bootol, hiszen arra tervezik hogy sosem all le vagy csak tervezetten. Elindul az out-of-band management es csak utana barmi mas vagy a bios kepernyonel varod a booting imc feliratot. Masreszt nem lehet, legalabbis nem ajanlott, durr elinditani minden gepet egyszerre, mert igen kemeny kilengesek lehetnek.
Storage-onak is kell egy ido mire osszeallnak, nem beszelve a halozati eszkozokrol. Szoval ha programozhato PDU-val inditanak el mindent az nem lesz meg egyik percrol a masikra mukodo rendszer.
Maximálisan jogos, ma is tanultam valamit. Egy áramszünet alatt széthullott "hálózatos raid"-nek is kellhet idő, no meg a dedikált vasak (még a játékszerverek, HP Proliant) is percekig bootolnak.
Thx.
Konkrétan egy ProLiant DL785 G7 bebootolása során kinő az ember fiának a szakálla. :-D De ezek tényleg nem arra vannak kitalálva, hogy ki-be kapcsolgassa az ember...
Hozzászólások
Kaptam választ facebook-on:
"
A szünetmentes tápegység karbantartása során probléma jelentkezett, de a hiba elhárításán már dolgoznak munkatársaink. Ez várhatóan 15-20 percet vesz igénybe.
Köszönjük türelmedet!
Üdvözlettel,
Az EZIT Kft. csapata
"
Koszi, nalunk sincs mar 1 oraja eletjel :)
---
http://www.vultr.com/?ref=6814182
Szunetmentes karbantartas alatt a faszert is nem kapcsolnak bypassra?
vagy bypass + aggregator, just for sure.
Ha balfasz a karbantarto ceg akkor baszhatod a baypassod vagy az agregatorod :) Nalunk anno ketszer is lebasztak az egesz szerver szobat a villanyrol..... Hiaba volt bypass meg aggregat.....
--
http://szolarenergia.hu - A hálózat építést csak elkezdeni lehet, befejezni nem....
Konkrét, megtörtént eset, olyan cég, akik fő profilja a szünetmentes ellátás tervezése és kivitelezése:
- És ha ezt itt lekapcsolom, akkor nem fog elmenni az áram.
Katt.
ZZzzzz.... csönd.
Őket többé nem hívtuk.
https://www.youtube.com/watch?v=z8HKkF2GsBQ
Szerintem a kovetkezo tortent: Bypass-ra tetettek a szunetmentest elvegeztek a karbantartast, majd mikor visszakapcsoltak( az amugy tulterhelt szunetmentes) kapott egy nagyobb loketet es leoldott. Mivel utana fokozatosan terheltek nem jelentkezett a hiba es kezdodhetett a normal szerverszoba inditas. Gondolom az indulas ott sem 10 perc alatt van meg.
Sziasztok,
ahogy Facebookon írtuk, illetve a telefonálóknak telefonon mondtuk azt itt is utólag megerősítem.
A Victor Hugo utcai, 5.emeleti szervertermünkben az egyik szünetmentes táp akkumulátor cseréje zajlott, külső mérnökiroda szakemberei által.
A karbantartás alatt természetesen bypasson üzemelt a rendszer. A visszaengedéskor (amikor elkezd szinkronizálni az UPS a hálózati feszültséghez, de még bypasson vannak a fogyasztók) kapcsolta le a betáp oldali biztosítékot az UPS és ezzel a szerveremben lévő eszközök kb. fele alól kiesett az áramellátás.
Most már minden gép kap áramot és a szerverek többsége el is indult hibamentesen.
Az érintett ügyfeleinknek 12 órán belül emailen küldünk egy részletesebb tájékoztatót.
A c1-ben a belső hálózat és a szerverek redundánsan vannak két UPS-re bekötve, a cloud szerverek ezért nem álltak le, nem indultak újra, de az internet felé néző switch egytápos és ezért az kiesett, az érintett szerverek ezért nem voltak elérhetőek.
Azért az érdekes, hogy egy "core" eszköz csak 1 tápos.
Fedora 23, Thinkpad x220
Igen, ez egyértelműen tervezési hiányosság.
------------------------
{0} ok boto
boto ?
Vagy csak költségvetés. Ugyanis jó párszor hallottam már én is sajna, hogy jó lesz az, mert "hányszor történt már ilyen/olyan eset ... "
Fedora 23, Thinkpad x220
Az üzletet is tervezik, a kockázatot is. Akárhonnét nézed is, ez tervezési hiba.
------------------------
{0} ok boto
boto ?
Amiről szó volt a c1 kapcsán az nem core eszköz, hanem egy access switch.
A border, core és disztribúciós eszközök hálózat-topológiailag és tápegységileg is redundánsan vannak bekötve, ezért is maradtak elérhetőek az áramkieséssel nem érintett szerverek.
Én nem tudom mi ez a c1 :> De akkor ezek szerint van akiknek olcsó access switchen megy ki a net, és vannak akiknek nem. Azt lehet tudni, hogy akik ilyen olcsóbb 1 tápos switchen keresztül kommunikálnak azoknak olcsóbb a szolgáltatásuk, valamint tudnak-e róla. Vagy elő van adva, hogy redundáns minden meg minden, aztán kiderül, hogy mégse annyira redundáns :>
Fedora 23, Thinkpad x220
Persze, hogy tudják, linket nem szeretnék beilleszteni ahol ez le van írva a honlapunkon, nehogy reklámnak tudjon.
Differenciálva vannak a szolgáltatások redundancia szerint és a kevesebb redundanciát tartalmazó kevesebbe kerül.
tippelek, formula ;)
Ők egyébként jók, vagy nem?
tudnek meselni, de kot az NDA
Az árammal csak a baj van :D http://hup.hu/node/70184?page=1&comments_per_page=9999
De kb. minden nagy (meg nyilván kicsi is, hehe) cég előadta már az elmúlt tíz évben valamilyen variációját, ami azért elég lehangoló képet fest a teknikáról. Bár... a Dataplex nem rémlik, ők még tartoznak ezzel :D
Az újabb termekben már ezekből a hibákból tanulva tervezték az elektromos hálózatot és hacsak nincs valami komoly eszközhiba, akkor nem is lesz gond. Eszközhiba alatt a konkrét váltást/bypasst adó "dobozra" gondolok természetesen.
Ja, de hacsak mindig van.
Nomeg ami nekem legemlékezetesebb, az egyszerűen kommunikációs hiba volt. Mármint ember-ember (cég-cég) között.
Maradjunk annyiban, hogy náluk is volt "malőr"... Igaz, csak a klíma állt le, illetve az egyik ajtózárat ellátó kis ups adta fel...
Én vagyok túl analfabéta ehhez, de elolvastam a hozzászólásokat...
A biztonsági rendszer (UPS) karbantartása során az éles rendszert sikerült kinyírni? És ezt egy szakember cég csinálta, aki gondolom hetente több ilyet csinál. Jól értem?
A másik pedig, amikor a 230V visszajön és stabil (?), akkor a szerverek indítása olyan lassan haladt, hogy valaki több órára kiesett? VPShez vagyok szokva, ott egy restart alatt 3db ping marad ki (kb. 3 sec).
Tudom, hogy ez nem egy NASA központ, meg kis pénz kis foci...de akkor sem egy mikrovállalkozás irodai SMB megosztásairól van szó, ahol nem baj egy 15 perces leállás, majd az Excelben a CTRL+S-t ebéd után nyomják meg...
Félek internetes vállalkozásba vágni...vagy a clusterem álljon 5 gépből: linode+vulter+digitalocean+aws+akarki.szolgaltato.hu?
Szerintem ne legyenek illúzióid.
Az Amazon is állt már le. Az MS Azure-ban is történtek gáz dolgok, úgy hogy ott nem is szimpla VM-t béreltek, hanem platform vagy infrastruktúra szolgáltatást.
Egy szerver-szerver jellemzoen lassan bootol, hiszen arra tervezik hogy sosem all le vagy csak tervezetten. Elindul az out-of-band management es csak utana barmi mas vagy a bios kepernyonel varod a booting imc feliratot. Masreszt nem lehet, legalabbis nem ajanlott, durr elinditani minden gepet egyszerre, mert igen kemeny kilengesek lehetnek.
Storage-onak is kell egy ido mire osszeallnak, nem beszelve a halozati eszkozokrol. Szoval ha programozhato PDU-val inditanak el mindent az nem lesz meg egyik percrol a masikra mukodo rendszer.
Maximálisan jogos, ma is tanultam valamit. Egy áramszünet alatt széthullott "hálózatos raid"-nek is kellhet idő, no meg a dedikált vasak (még a játékszerverek, HP Proliant) is percekig bootolnak.
Thx.
Konkrétan egy ProLiant DL785 G7 bebootolása során kinő az ember fiának a szakálla. :-D De ezek tényleg nem arra vannak kitalálva, hogy ki-be kapcsolgassa az ember...
Ave, Saabi.
vard ki ugyanezt egy megtomott bladecenterrel ;)