DENINET

Tud valaki infót a Deninetről? Áll a honlapja, állnak a gépeim illetve a BIX grafikonon nincs forgalom. Megszívtam ezt a pénteket is?

Hozzászólások

Nekem azt mondták, hogy az egyik core routerük elszállt...

update: Már megy is...
update2: Megint megállt...

elindult..

update: megállt.
--
Nem az erős, aki sosem esik el, hanem az, aki mindig fel tud állni!

nekünk már úgy 16:40 óta hol megy, hol nem. Az operátort már el se érjük előbb foglalt volt, aztán fogta és kikapcsolta a telefont...

Két routerük van, de ebbe ami leállt volt kötve a BIX és még pár peering.
A nemzetközis routerük nem állt le.
De most majd lesz második belföldi routerük, így most már 3db összesen.
Mi is két külön routerükre csatlakozunk és elkezdett nemzetközi irányba menni a forgalom, csak annak idő kell mire minden szolgáltatótól ide találnak a csomagok. :)

____________________________
www.szerverplex.hu

Tisztelt Ügyfelünk!

Mai napon 16.27-16.49 és 16.52-17.05 között a belföldi routerünk pillanatnyi áramingadozást követő UPS hiba miatt nem volt elérhető. A router két azonos típusú, de független UPS-re volt rákötve, sajnos mindkét UPS meghibásodott. Az áramellátási hiba más eszközt, szervereket nem érintett. Az UPS-ek közepes terheléssel üzemeltek, karbantartásuk rendszeres volt.
A szolgáltatás kiesésért elnézésüket kérjük.
Rövid időn belül második belföldi routert fogunk üzembe helyezni.

+1. Az UPS bemenetén fellépő olyan zavarra, ami az UPS-t leülteti, nem lehet tesztet csinálni, maximum úgy, hogy "na, most azt játsszuk el, hogy meghalt az egyik UPS", és a kimenetén szépen bontani az áramkört. A "két UPS egyszerre csinálja ezt" eseten meg nincs mit tesztelni, akkor megáll minden.
Bár mint korábban írtam, ha azonos a két UPS, akkor a "betáp oldali olyan zavar, amitől leáll az UPS" esemény következménye előre borítékolhatóan a "mindkét UPS leáll" lesz, ha a két szünetmentes azonos erősáramú betáplálást kap.

"UPS bemenetén fellépő olyan zavarra, ami az UPS-t leülteti"
Oké, ez mi lehet? Én túl áramra, tüskékre tippelnék, de az ilyen helyeken nincs szűrve? Az ellen a legfrissebb 10k-s UPS-em is védve van (papíron). (tipp, azonos dugaszra volt kötve valamelyik pistike hosztingos seedszarverrel, és amikor eldurrant a tápja, akkor kiverte azt is?)
Mit nem vettem figyelembe?

--
Fontos! Ha berágok, nem feltétlen személyed ellen szól...
openSUSE 13.1 x86_64

Nem tudom, mi lehet, de a "pillanatnyi áramingadozást követő UPS hiba", egy jól és rendszeresen tesztelt, két UPS-t használó, duplikált szünetmentes hálózat esetén nem az UPS kimeneti oldalán keresendő.
Ha az UPS kimeneti oldalán történt olyasmi, ami lerohasztotta _mindkét_ ups-t, vagy ami mindkét szünetmentes körben kiesést okozott, miközben más eszköz nem borult el... Ez valahogy nekem nem tiszta... A router van két független UPS-re dugva (és semmi más), és ez a két UPS-t érintette egyszerre a "pillanatnyi áramingadozást követő UPS hiba"? Még emészteni kéne a leírtakat, bár láttunk már ennél cifrább publikus post-mortem jelentést is :-)

Oké, olyat már láttam, hogy a tápkábel gyors kihúzása majd visszadugása után egy IBM gyártmányú token-ring dobozból "kiesett" a firmware, és lehetett nekiállni soros porton rátolni a megfelelő fájlt... (Ott is volt a flopi meg a kábel a szekrényben, ahogy kell...)

Igazából arra gondoltam, hogy a ups bemeneti oldala osztozott a pistike hosztingos géppel (mennyi az esély erre? 0%?)
Nekem egy kicsit bűzlik ez a mondóka, mivelhogy az "olcsó" ups-em is kibírja az áramingadozást (+- irányban is). De hát nem tudhatok mindent, ezért kérdeztem mi lehetett.

"flopi meg a kábel a szekrényben, ahogy kell"
Ilyennel találkoztam már. Csak az egy hordozható lérezes vonalkódolvasó volt. Mindig újra kellett "flashelni", ha ki lett véve az akku töltéshez. Aztán mindig ott volt a kis floppy, a kábel és a leírás, hogy "hogyan kell tölteni" egy laptop mellett a töltőnél.

--
Fontos! Ha berágok, nem feltétlen személyed ellen szól...
openSUSE 13.1 x86_64

Elmondtad a lényeget: "papíron"

Az IT-sok ott követik el a hibát, hogy az UPS-re úgy tekintenek, mint egy mindig-minden körülmények között tökéletesen működő eszközre, amit semmilyen jellel (pl. nagyfrekvenciás tüskejel) nem lehet megfektetni.

Pedig mindenki látott már szerver clustert megborulni, és magyarázni a menedzsmentnek az okokat, akik ugyanígy értetlenül állnak az eset előtt, mint mi a lehaló UPS előtt.

Szünetmentesekben az akkuk általában sorba vannak kötve, 1-2-n körben.
Olyan mint egy RAID0, ha kiesik egy akku akkor az a kör kiesik.
Ez simán az egyik pillanatról a másikra be tud következni.

Annyit tudni kell az egészhez, hogy gyári új akku is lehet rossz és minőségi akkuk közt is vannak minőségbeli különbségek.
Egyik kibír 5 évet, másik csak 1-et és képesek egyik pillanatról a másikra tönkre menni.

És akkor még ott van a szünetmentes elektronikája, ami szintén feladhatja egyik pillanatról a másikra.
Szakmabeliként láttam már önteszt során kigyulladó szünetmentest is.

Aki használt ipari méretekben, mennyiségben szünetmentest az tudja, hogy előfordulhatnak ilyen hibák.
Ahogy az előttem szóló is mondta helyesen, papíron sok minden van, de a valóság nem mindig a papír formát követi.

Nem hinném, hogy spóroltak volna a szünetmentesen, nem arról híresek, hogy spórolnának bármin is.
Minket is érintett a leállás, de nem panaszkodom, mert mindig korrektek.
És ahogy a fent idézett levélből is kiderül, lesz másodlagos router, amit tegyük hozzá több milliós tétel!

____________________________
www.szerverplex.hu

Gyakori kérdésekre járok röhögni. Találkoztam már ott szembe erre irányuló kérdéssel. Aztán hamar eloltották a lelkesedését, hogy arra se szakértelme, se pénze nincs elég. Szóval nem kell nekik tippet adni, az ötlet felmerül ezekbe maguktól is :D

Egyébként, ha már RC kernelt használ, legalább annyit tud, hoyg azt behegessze. Legalább is értelmes disztrót még nem láttam rc kernellel kiadva. (de hát ugye a sün is tévedhet, ezért kefélt a drótkefével... másodszor is...)

--
Fontos! Ha berágok, nem feltétlen személyed ellen szól...
openSUSE 13.1 x86_64

ironia on

A MikroTik egy router gyártó- és hozzájuk oprendszert fejlesztő cég. Nem kifejezetten ipari célokra használják: megtalálható szinte minden internet szolgáltató hálózatában, de a széles termékskála miatt egyre inkább előfordul bármilyen cégnél - akár a legkisebbeknél is, ahol nem akarnak leragadni a TP-Link - jellegű cuccok szolgáltatásainál.”

ironia off

Nem a 10GE kihajtása a csoda önmagában, hanem ennél jóval összetetebb a dolog. Amikkel első ránézésre meg kell bírkóznia a céleszköznek:
- több 10GE és 40GE link kezelése (tehát, nem 2-3db, hanem mondjuk 50db)
- a megfelelő BGP táblák kezelése, amik manapság elég nagyok ahogy hallom
- kellő sebességű routolás, gyakorlatilag késleltetés mentesen az összes élő linken és adott esetben LACP és hasonló mókák kezelése
- ACL-ek kezelése

Ennél biztos jóval több dologra kell figyelniés majd olyan aki ebben napi szinten benne van kiegészít. :)

Szerk: majd kihagytam, kell egy működő és lehetőleg aktuális szoftver konfig is. Ami másik ami eszembe jutott, hogy egy core eszközből N darab SFP ki/be húzkodása lassabb valszin, mint az elektronyos hálózatot helyrerúgni.

Igazából csak a 10GE-n akadt meg a szemem, hogy miért épp az a vízválasztó, de látom itt fentebb hogy alapvetően félreértésből lett a poszt.

Kemény lenne ha valaki komolyan gondolná, hogy erre fél óra alatt össze lehet dobni egy alternatívát fiókban talált eszközökkel. :)

Persze, ez igaz, csak lehet az ugyfelek ezt nagy ivben le*.
Tehat arra gondolsz, hogy nem lett megfeleloen tesztelve?:) Egybkent meg egy valamirevalo UPS-nek birnia kene a bejovo ingadozasokat, illetve elotte az elektromos halozatot felkesziteni.

En arra probaltam celozni, hogy ezeket is kell tesztelni rendszeresen, mindig a legrosszabbra felkeszulni, vagy azt megprobalni szimulalni.

+1. A költségeket tetszőlegesen lehet növelni (n+1. darab független betáplálás, plusz n+1 darab dízel, m+1 darab ups, ami akár technológiáját tekintve sem azonos, több független szünetmentes hálózat a szekrényekig, stb. Csak ezeket a költségeket nagyon-nagyon kevés rendszer esetén lehet értelmesen megmagyarázni.
A dupla szünetmentes hiba az 1+1-es felállásban kiesést fog okozni - ilyenre nincs teszt, ilyenre az van, hogy bevállalják. Ha nem vállalnák be, akkor nem két, hanem több UPS lenne, és erősáramű switchek lennének berakva a szekrényekbe, hogy a "csak" dupla táppal működő eszközök se maradjanak védtelenek két ups ledöglése után.
A bemeneti oldalon bekövetkező olyan zavarra, ami az ups-t leülteti, pláne datacenter méretű betápnál nem igazán lehet tesztet csinálni. Mégis hogyan? Hozni egy kellüen nagy áramfejlesztőt, berakni az uos elé (a szolgáltatói betáp helyére), és elkezdeni azzal "szórakozni"? :-P

Egyébként meg látott már a világ bypas-ba kapcsolt ups-t, mert "folyton sípolt"... :-P És elég, ha egy van átdobva bypass-ra, és a másik meg a kardjába dől a hálózati delej elvesztésekor valami miatt :-P

oke, persze, vannak anyagi es eszszerusegi hatarok is.

zeller, ja, vilagos. de ki mondta, hogy ugyanolyan szunetmentes kell mindig venni? A tesztet a szunetmentesekre irtam.

A halozati tervezessel sok mindent meg lehet(ne) elozni. Eonos kollegak mondtak anno. Persze ez penz kerdese.
Meg ugye az emlitett hely tobb szolgaltato elmondasa szerint sem a legkorszerubb ezen a teruleten.

Már vagy 6-7 éve hogy ott van a legrégebbi szerverünk, és emlékezetem szerint ilyen hosszú leállásuk még nem volt.
Másik szolgáltatónál a Dataneumba volt már hogy NAV kapcsolta le fél napra az egész hálózatot, megfertőzött gép vágta hasra router/switch-et, vagy épp egyéb hiba ugyanezeket aminek javítása nem fél óra alatt történt.
Pedig szidják egyesek a Victor Hugó utcai épületet hogy milyen gányolás, kupi van ott, stb.

Pont az eset után pár órával vittem be a negyedik gépet. Több operátor is teljesített szolgálatot.

Nem biztos hogy ezen a fél órán kell vergődni,mikor a t-online levelezése egy napig ált, sőt már megint nem megy.

Ha mondjuk a deninetnek van 100 céges ügyfele, és mind a 100 megfekszik 30 percre, és ebből 15 átlépi a vállalt SLA értéket az adott évre (januárban), ott viszonylag komoly problémáról beszélünk. (a fenti adatokat hasra ütésszerűen írtam).

--
arch,centos,debian,openelec,android

dev: http://goo.gl/7Us0GN
BCI news: http://goo.gl/fvFM9C

Honnan tudod, hogy milyen SLA-kkal vállalták a szerződéseket?
Ha jól számoltam, akkor éves szinten fél óra kiesés ~99.9943% -os rendelkezésre állást jelent.
Szerverhosztingra a weboldaluk szerint 99.9%-ot vállalnak, ami ~8óra 45percet jelent kb.
Nyilván, nem jó dolog egy kis kiesés sem, fél óra még annyira sem, de akinek sok a fél óra leállás/év, holott a szerződés szerinti feltételekbe több, mint 8 óra is belefér, az véleményem szerint nyissa ki a pénztárcáját, s építsen ennek kezelésére alkalmas rendszert, vagy keressen sokkilences szolgáltatót.

Engem annyira érintett hogy tcom netem+iptvm van otthon (meg lehet szólni érte, de céges egyedi szerződéssel kapjuk fillérekért). Amit kaptam mail címet az azért van beállítva egy ideje (előtte évekig nem volt) mert nem kaptam értesítést egy karbantartásról, vagyis küldtek de én nem néztem sosem.
Levelező néha le akarta tölteni a leveleket, de hol ilyen hol olyan hibával megállt, természetesen a leállásról azóta egy sort nem küldtek, deninet meg mailt küldött mindenkinek helyreállítás után nem sokkal.
Viszont sok céget tudok akik nem foglalkoznak különösebben netes megjelenéssel, ha van is lapjuk egy domainel, levelezésre a t címüket használják mert az van nekik évek óta (ne akard meggyőzni őket másról nem fog menni:), szerintem nekik annyira nem esett jól a két nap.
És amit nem tudunk, hogy érintett e olyanokat, akik saját domainel rendelkeznek a tcomnál, és ott van a levelezésük is.
Tcom az egyik, ha nem a legnagyobb szolgáltató, a deninet meg szerintem egy közép nagyságú cég a piacon.
Hogy kié a nagyobb hiba én gondolkodás nélkül a tcomra adom az x-et.
Belső infója nem tudom kinek van de kíváncsi lennék, mi volt a hiba és miért tartott eddig kijavítani.

Jaja, megállt az egyik új cisco, de van egy független backup cisco is és aki arra rá van kötve azoknak semmi kiesésük nem volt, pl nálunk se okozott semmit, csak kaptuk az értesítést, hogy az egyik link lement. Ráadásul aki Deninettől vesz netet (bgpvel) az ingyen kap a backup eszközre linket, így aki ezzel nem élt az magára vessen.

____________________________
www.szerverplex.hu - Szerver Hosting, VPS, Webtárhely, Domain ...

Deninet kiemelkedően jó minőségű szolgáltatást nyújt és elég rugalmas is.
3 független cisco eszközükhöz van linkem.
Nem ismerek még egy ilyen céget akinek ekkora sávszélesség kapacitása van és automata DDOS védelmet is ad.
Még nem vagyunk akkorák, hogy megérje megduplázni az amúgy sem kevés internet költségünket.

____________________________
www.szerverplex.hu - Szerver Hosting, VPS, Webtárhely, Domain ...