[elvi kérdés] Hogy kössem be a szerverek tápegységeit, ha...

Fórumok

Sziasztok!

Hétvégén újrakábelezzük a szerverszobánkat, és mivel nem értünk egyet a kollégával/főnökkel, tőletek kérek tanácsot.

Érkezik egy új, bika nagy szünetmentes, ami el tud látni minden eszközt hosszú órákon keresztül.
Azokat az eszközöket, amiknek csak egy tápja van (switch, router, stb), értelemszerűen az UPS-re fogom kötni, ez nem kérdés.
A szerverekben viszont két táp van, és a vita ebből fakad.

'A' verzió (ezt támogatja a főnököm):
minden tápot kössünk az UPS-re

'B' verzió (ezt támogatom én):
minden szerver egyik tápját kötném az UPS-re, és minden szerver másik tápját kötném a villamos betápra

Szerintetek melyik a jobb módszer és miért?
Köszi!

Hozzászólások

A duáltápos szerverek a failover miatt vannak dual táppal szerelve. Ergo 1 táppal is működnek. Pl szervertermeknél paraméter listában láthatsz olyat, hogy N+1 betáp, tehát van több egymástól független áramkör. Na szóval a lényeg itt az, hogy a két tápod külön áramkörön (fázison) legyen, arra az esetre ha valamelyikkel gond van. Szóval 1 táp UPS-be, 1 táp a sima hálózatra.

Az egytápos eszközök pedig UPS only.

Gondolj arra az esetre is, hogy mi van akkor ha a szünetmentes megy tönkre?
-------------------------
Dropbox refer - mert kell a hely: https://db.tt/V3RtXWLl
neut @ présház

Ki kell vágni a fenébe a sok dugasz tápot, a MeanWell-nek vannak sima és redundáns tápjai is, ha nincsenek nagy távolságok, akkor simán megtáplálható egy közös tápról vagy egy kisebb redundáns rendszerről a sok kis eszköz. Nálunk egy ilyen racionalizálás történt, csak épp a redundáns tápot nem játszottam meg, viszont az UPS érezhetően tovább bírja egy tökösebb 12V-s táppal mint több kisebbel.
Ha kell 5 és 24 v is, azokhoz persze sajnos külön táp/rendszer kell majd, de ha a legtöbb eszköz egy feszültséggel megy, akkor érdemes megfontolni a tápcserét.

Nem mindegy. Lehet olyan kisebb áramkimaradás, amire pont bemondja az unalmast az UPS (akku vagy relé hiba miatt), de pl egy direktbe táplált eszköz még pont túlesne ilyenen, vagy újra el tudna indulni, miközben az UPS letiltott. Jártam így, visszajött az áram, de az UPS ott pislákolt pirosan és szexualizált áramot továbbítani.

Még ha ugyanaz a betáp akkor is ha lehet az egyik ups a másik meg a sima fali, ez egy új ups lesz ha jól értem, és mint tudjuk a legtöbb cucc az első két hétben mondja be az unalmast vagy pedig 3 év múlva, ha olyan nagy mázlid van akkor szombaton hajnali 2kor fog leállni az új csilivili ups valami miatt akkor pedig a sima betápról meg még mennének, de ha mindkettő tápot az upsre teszed és lehal akkor hétfőn reggel kereshetsz elosztókat h be tudd dugdosni legalább az egyik tápját dugni valahova

Hát az 'A' verziónak legalább annyi értelme van, mint a dual wan-os routerbe kétszer húzni utp-t ugyanabból a modemből :D

B
Ha az UPS invertere meghal, van villamos betáp.

Köszönöm a megerősítést, akkor a saját elképzelésem szerint ('B') fogom bekötni a szervereket.

Egy dolgot azért nézz meg. Ha 60-70%-on fut a szünetmentes B esetben és a normál táp kihagy akkor a load balance szerverek a szünetmentesből fogják pótolni a hiányzó áramot. 50-50 load balance-nál a szünetmentes lekapcsolhat túlterhelés miatt... Szóval én 40% fölé nem engedném a terhelést. Sőt van olyan inverter ami 50 felett négyszögjelet alatta pedig tiszta szinuszt ad ki magából...

Ettől nem tartok, ugyanis nagyon fölé lőttünk a terhelésnek.
Most két 3000 VA-es UPS-ünk van, a szervereket hajtó 46%-on ketyeg, a másik a hálózati eszközöket hajtja, az még kevesebbet eszik.
Az új UPS 15000 VA-es lesz, és vettünk hozzá külső akku pakkot is, mert nekünk az áthidalási idő volt a fontosabb.
Szombaton már fogom látni, hogy az új UPS mekkora terheléssel fog járni, majd megírom.

Mi valamikor év elején csináltunk hasonlót (teljesen újrakábeleztük a szerverszobát, hálózat + elektromos kábelek), a szerverszoba méretétől és a projektben részt vevők számától függően azért ez elég izzasztó projekt tud lenni, de gondolom, ezzel tisztában vagytok. Arra figyeljetek, hogy legyen elég gyorskötöző (vagy tépőzáras kötegelő, ha nem sajnáljátok rá a pénzt), hogy ne kelljen menet közben "kompromisszumokat kötni" (vagyis legyen minden kábel szépen kötegelve és lerögzítve)... plusz nem árt néhány tartalék patch kábellel is készülni, akár különböző színűekkel, hogy meg tudjátok különböztetni mondjuk a trönkportokat a végponti eszközöktől vagy, ha vannak analóg telefonok és/vagy ISDN eszközök, ezeket is hasznos külön kezelni az Ethernet eszközöktől. Biztos sok készülékben van gyárilag beépítve túlfeszvédelem, de egy analóg telefonvonal 70V-os feszültsége biztos nem tesz jó egy 5V-os Ethernet eszközöknek, ha véletlen sikerül rosszul kipatchelni valamit.

Ha matricáztok is, feltétlenül vinil-alapú címkét használjatok, a sima, irodai használatra szánt matricák elég hamar elengednek szerverszobai környezetben, ahol a szerverektől a meleget, a klímától meg a hideget kapják non-stop üzemben. Nálunk két héten belül elengedték magukat ezek a matricák, utána váltottunk a viniles megoldásra (pl. Dymo Rhino széria), és most már csak ilyet használunk a szerverszobában.

Mi a dual tápos szervereknél mindkét tápot UPS-re kötöttük, figyelve rá, hogy ne ugyanazon a körön legyen mindkét UPS. Így a redundancia ténylegesen biztosított (bármelyik komponensből kieshet egy: PSU, UPS, betáp), és mindkét táp felől védve van a szerver túláram, túlfesz, ingadozás stb. ellen + van áthidalás is. Minden dual tápos szervernél kineveztük az egyik UPS-t "fő tápforrásnak" (logikusan a nagyobb kapacitású akksival szerelt UPS-t), és annak az agent-jét telepítettük, hogy időben le tudjon állni szabályosan a szerver, ha hosszabb időre megszűnik a betáp. Ennek az az egy buktatója van, hogy ha az egyik táp kiesik, de a másik tápról gond nélkül el tudna ketyegni a vas, akkor is le fog állni - szabályosan, csak épp feleslegesen. :) Erre nem sikerült a mostaninál okosabb megoldást kitalálnunk, de nem is volt még rá példa, hogy indokolatlanul állt volna le valamelyik dual tápos szerver.

Mint teljese laikus kérdezem és mint olyan akit nagyon érdekel ez a téma, hogy mi lenne ha megfordítanátok? Ha jól értem ezeknél a szervereknél nem megy egyszerre a két táp. (?, logikusan) Vagyis ha a "fő tápforrás"-ból kifogy a szufla, rögtön átkapcsol a másikra (másik tápra, másik ups-re) amit addig nem merített semmi (elméletileg). Ha a "tartalék tápforrás" agent-jét telepítitek fel akkor miután lemerült a "fő tápforrás" a szerver nem váltana át a "tartalékra" és ha már az is merülne akkor nem lehetne azzal leállíttatni a szervereket (már ha elég nagy az akksija és rendesen karban van tartva)? Vagy simán megfordítani a tápokat? Bár szerintem a jelenlegi telepítésnek is megvannak az előnyei, nem is egy! Csak elmélkedtem.

Érdekes, nagyon köszönöm a válaszokat! Ha jól értem akkor áramszünet esetén mind a két UPS-t terheli a szerver, de csak akkor áll le szabályosan, ha a nagyobb akksis UPS töltöttsége elér x%-ot (vagy x ideje nincs áram?) és ha a kisebb akksis UPS merül le előbb, akkor a szerver magától tápot vált?

Nem egészen, de megpróbálom elmagyarázni. Két tápegység van és két UPS, amik külön fázisról kapnak áramot. Normál üzemben ezek 50-50%-on "pörögnek", a két tápegység és UPS egymással párhuzamosan üzemel és ad le teljesítményt a szerver felé. Ha kiesik az egyik táp (vagy UPS), a szerver komplett áramfelvétele átterhelődik a másik tápra, ezt a váltást a szerver saját belső elektronikája kezeli. Ebből kiindulva simán megtehetem, hogy az egyik tápból kihúzom a kábelt - a szerver gond nélkül megy tovább.

A leállítás úgy van konfigurálva, hogy 10 percnyi áramszünet után elindul a shutdown folyamat a menedzselt gépeken. UPS-ből sajnos nem homogén a rendszer, van HP és van APC is jelenleg, és ezek egy picit másképp működnek. A HP-nál a betáp kiesésének időtartama ("shutdown initiated after") és a szabályos leálláshoz szükséges idő ("OS shutdown time") befolyásolja, hogy mikor kapja meg a leállítási parancsot az oprendszer, az APC-nél pedig az akksi aktuális töltöttségi szintje (pl. 10%) és/vagy a hátralévő futási idő (pl. 3 perc) dönt a leállásról. Minden táphoz tartozik egy management szerver (vagy jobb esetben az UPS-ben lévő management modul), amin keresztül az agent-ek monitorozni tudják az UPS állapotát. Ez azért jó, mert így szerverenként lokálisan szabályozhatók a beállítások. HP-nél ez is másképp működik, itt a szerveren központilag lehet konfigurálni az agent-ek beállításait és ilyenkor ha jól tudom, a szerver küldi a jelzést az agent-nek, hogy mikor kell leállnia.

Nagyon szépen köszönöm a válaszodat, nagyjából megérettem mindent. :)

Annyit szeretnék még kérdezni, hogy az ilyen redundás tápos szerverekben az os érzékeli, hogy kiesett az egyik táp? (Feltételezem képes érzékelni és értesítést is lehet valahogy küldeni ebben az esetben a Rendszergazdáknak, gondolom valamilyen driver vagy program külön kell az op. rendszerre)[Nálatok, hogy van beállítva?]

És, hogy mennyire megbízhatóak ezek a félig hajtott tápok? Itt arra gondolok, hogy évekig mennek 50%-on és egyszer-csak (valamilyen meghibásodás, pl. elöregedése miatt) a másik tápra kerül rá a teljes terhelés, vagy lehet monitorozni, tesztelni ezeket a tápokat?

Valamint ami engem is érint, de nem találtam még rá jó megoldást, ti mivel, hogyan szoktátok letesztelni az UPS-ek akksiját, hogy mennyit bírnak még? Főleg olyanokra gondolok, ahol nincs menedzsment. [Nem szerver gépek!!!] (Gondolom, menedzsment esetén jól látszik valamilyen értéken, hogy öregszik az akkumulátor.)

Előre is nagyon szépen köszönöm a válaszokat!

Az OS alá telepített program (vagy driver) jelzi a táp hiányát.
Logolhat pl. syslogba, az meg továbbítja.

A félig hajtott táp legalább ki van tesztelve. A hidegtartalék nem annyira.

Elvileg az akuk terhelésre adott válaszából lehet rá következtetni (oszcilloszkóppal lehet nézni). Gyakorlatban időnként meg kell járatni őket. Lemeríteni pár százalékot.
3 év után jobban kell rájuk figyelni, esedékes a csere.

A monitoring nem az OS szintjén történik, hanem egy erre kifejlesztett szoftverrel, ami soros porton, USB-n vagy hálózaton keresztül kérdezi le az UPS státuszát és ennek megfelelően generál riasztásokat. Ilyet a HP és az APC is natívan tud. HP UPS-nél a Power Protect nevű szoftver van, webes felületről konfigurálható, APC-nél a PowerChute ennek a megfelelője, de mi (mivel többnyire linuxos szervereink vannak) inkább apcupsd -t szoktunk használni, ez plain text konfigfájlból reszelgethető, az e-mail riasztásokat szkriptek segítségével küldi.

Szerintem nincs semmi összefüggés a megbízhatóság és a load-balance-os működés között, a dual tápos szervereknél mindkét táp teljes értékű, nem fog sem előbb, sem később tönkremenni attól, hogy kisebb terhelést kap normál üzemben. Simán lehet használni egy táppal is egy dual tápos szervert, csak így ugye elveszted a redundanciát.

Nem használunk semmi külső tool-t a teszteléshez, a céges környezetbe szánt UPS-ek minden elképzelhető módon jelzik (email riasztás, syslog bejegyzés, LED villogtatása + hangjelzés), ha cserélni kell az akksit (rendszeresen futtatnak önteszteket, ilyenkor átkapcsolnak akksira egy rövid időre és figyelik a kimenet paramétereit). A HP és az APC is kijelzi a várható áthidalási időt, ez leginkább attól függ, hogy mekkora terhelés alatt van az UPS, illetve hogy milyen állapotban van az akksi. Nem érdemes túlgondolni a dolgot, ha jelez az UPS, cserélni kell az akksit és kész, ez általában 3-5 évente esedékes az akksi típusától függően. A legtöbb modellnél lehet menet közben cserélni a cellákat, de ezt érdemes ezzel foglalkozó szakira bízni, hiszen mégiscsak egy 230V-os eszközt kell áram alatt szétszedni, ami nem éppen veszélytelen művelet.

Ha egy ups-re kotsz mindket tapot:
- ha aramszunet van es ups teszi a dolgat akkor gepet nemigazan zavarja semmi, tulfeszultseg vedelmet es rovid kimaradasokat, aramszunet utani rovid kimaradast megoldja ups
- ha ups-el gond van akkor hiaba lenne egyebkent aramod megall a gep

Ha egyik tapot kotod csak ups-re olyanokra erdemes figyelni, hogy:
- villamos betapon legyen tulfeszvedelem legalabb
- villamos betapnal aramszunet vegevel lehet nem azonnal jon vissza tartosan, hanem rovid idoszakra visszajon de ujra elmegy az aram, ha addigra mar ups lemerult vagy elotte se ment akkor nem fog jot tenni a gepnek boot kozben ujra elmegy az aram (ups eseten mondhatod hogy csak akkor kapcsoljon ups aramot a gepeknek ha pl 50%-ban feltoltott ups, igy kesobb indulnak vissza a gepek ugyan de ha kell ujra lesz eleg ideje szervernek rendesen leallni mielott elfogy az energia)

Szoval azt mondanam attol fugg mi a fontos, ha az hogy gepek es rajtuk adatok kevesbe serulhessenek aramellatasi gondok miatt akkor ups-re menjen mind2 betap (ha mar nincs masodik ups), ha inkabb szamit hogy kevesebb ideig legyen kimaradas aramszunet eseten es hw hiba eseten van tartalek eszkoz, adatvesztes meg kevesbe lehet gond vagy szempont akkor egyik betap ups masik direktben.

Az A-nak akkor van értelme, ha esetleg az UPS-es idő alatt purcanna meg a szerverben a táp.
Egyébként B, hiszen a szünetmentest probléma nélkül karbantarthatod, nem probléma, ha épp a szünetmentes döglik be, és nem terheli "feleslegesen" egy második táp az UPS-t akkus idő alatt.
--
"Sose a gép a hülye."

Ilyenkor az egyik labat az ups-re kell kotni, a masikat a villamos betapra a kettapos verzional.

Ha az ups megy tonkre, akkor nem borul minden. Marpedig lesz olyan, hogy megborul az ups.

Igazéból tényleg csak "vallási" kérdés, de valamiért a "B" egy hangyányit jobbnak tűnik.

Nem igazán vallási kérdés. Rajzold le az infrastruktúra elemeit (egy téglalap a betáp, egy másik a az UPS, néhány további a gépek/eszközök), majd kösd össze őket úgy, ahogy a valóságban függnek a másiktól az A, illetve a B megoldás szerinti felállásnál. Aztán húzd át az UPS-t, és nézd meg, mi az, ami életben marad az egyik, illetve a másik esetben.

2 ups :)
Ha ez nem jarhato, akkor B.
---------------------------------------------------
Hell is empty and all the devils are here.
-- Wm. Shakespeare, "The Tempest"

Tegnap összeállt a dolog, végül úgy döntöttem, hogy az egyik régi, de még remekül működő UPS-t megtartom azon szerverekhez, akiknek két tápegysége van, így két szünetmentessel lefedtem a teljes szerverszobát.
A load 16-17% mindkét UPS-en.