Sziasztok!
Van egy "Dell Smart-UPS 2200VA USB & Serial 230V" (Part Number: DLA2200I) szünetmentesünk. 2008 decemberében vásároltuk, 2012.04.26-án cseréltünk benne aksikat. Az UPS-re 4 szerver (egy master a többi slave) + 1 monitor van kötve.
Nem is volt vele semmi probléma január 16-áig.
Január 16-án kollégák szóltak, hogy leálltak a szerverek, és január 17-én ismét (éppen betegszabadságon voltam).
Már akkor is furcsálltam, hogy az apcupsd egyik alkalommal sem küldött levelet, amikor elment az áram.
Ma reggel ismét arra érkeztem be a munkahelyemre, hogy a szerverek állnak az UPS "kikapcsolva", kismegszakító lecsapva.
Most már gyanús kezdett lenni a dolog, ezért próbáltam kideríteni, hogy mi történhetett, mi okozhatja a problémát.
A master szerveren "/var/log/apcupsd.events" utolsó 40 sora a következő.
Ebből a következő derül ki számomra:
- Az önteszt dátumokat nézegetve gyanús lett, hogy a jan. 16-ai leállás előtt pont két héttel futott önteszt.
- Aztán jan.17-én reggel 7-8 óra között egy újabb leállás (ezt nem tudom mi okozta).
- Majd pont két hét elteltével ma (amikor az öntesztnek kell futnia) újra jelentkezett a probléma.
A 01.16, 01.17 és a mai eset után is a kismegszakító visszakapcsolása után a UPS feléledt és szinte csontig le volt merülve.
Kb. 3 óra elteltével feltöltődtek az aksik, majd (meggondolatlanul) gondoltam végzek egy manuális öntesztet az UPS-en.
Egyszeri (rövid) megnyomásra semmi, majd egy kb. 2-3 mp-es gombnyomásra (a manuálja szerint így kell) bekövetkezett az amit nem vártam: kismegszakító lement, a szünetmentes "kikapcsolt" (egy led sem világított), szerverek természetesen abban a pillanatban leálltak.
Amikor a kismegszakítót visszakapcsoltam, az UPS is éltere kelt (töltöttségi szint 100%), 4-ből két szerver elindult.
A master szerveren az apcaccess kimenete most a következő
Egy UPS újrakonfigurálást végeznék, csak a szervereknek is menni kell.
Kérdések:
- Véleményetek szerint mi lehet a probléma?
- Elképzelhető, hogy bő másfél év elteltével lemerültek az aksik?
- Ha a 2. kérdésre igen a válasz, attól még miért megy le e kismegszakító?
- Esetleg zárlatos lenne az UPS, vagy az aksi?
- Az aksik újrakonfigurálását (vagy hogy hívják) hány %-os terheltség mellet érdemes végezni (mert eltérő %-okat olvastam erről)?
Bármi ötletet szívese fogadok.
- 5539 megtekintés
Hozzászólások
Néhány kérdés indulásképp:
- mekkora a kérdéses kismegszakító és milyen: B, C vagy D?
- mi van még azon a körön?
- A hozzászóláshoz be kell jelentkezni
A kismegszakító B16-os (ezt akartam is írni), 2007-ben szerelték.
A B16-os kismegszakítón elvileg csak az alábbi két szünetmentes van (de gyakorlatilag a fene tudja mi még):
Terhelés a DLA2200I UPS-en:
1 db. Dell PowerEdge III szerver (4 HDD)
1 db. Intel szerver (2 HDD)
2 db. hagyományos PC, 2-2 HDD (kvázi szerver, semmi extra)
1 db. monitor
Terhelés a Back-UPS CS 650-en:
1 db. Cisco 1700 router
1 db. Cisco Catalist 2950 switch
1 db. 3COM 24 port Gbit switch
2 db. D-Link DES-1016D switch
1 db. Edimax router (soho)
1 db. PoE Wifi antenna (mikrós net)
A mostani eseteket leszámítva, az elmúlt 6 évben kb. kétszer-háromszor kellett felkapcsolnom.
- A hozzászóláshoz be kell jelentkezni
Próbáld meg felderíteni, hogy mi lehet még azon a körön. De ahogy a többiek is írták, a további kísérletezést már szünetmentes nélkül tedd és legyen mentésed.
- A hozzászóláshoz be kell jelentkezni
Ok.
Különben, ha nincs más ezen a B16-os kismegszakítónk, akkor ez elég a fenti eszközökhöz?
- A hozzászóláshoz be kell jelentkezni
Ha mindkét UPS egyszerre kezd tölteni - mondjuk egy áramszünet után -, akkor valószínűleg kevés, abból kiindulva, hogy a CS 650 adatlapján 5.3A van.
- A hozzászóláshoz be kell jelentkezni
Ezekből a szerverekből hányat terhelhetek rá egy APC Back-UPS RS 1500-as szünetmentesre.
- A hozzászóláshoz be kell jelentkezni
Nyilván szar ez a szünetmentes, ha lecsapkodja a kismegszakítót, én elvinném javíttatni, de legalábbis nem az éles szerverket rádugva próbálgatnám.
- A hozzászóláshoz be kell jelentkezni
+1 én is kivennem szerverek alól, úgy tesztelném...azoknak még az is jobb ha nincsenek szünetmentesen a probléma megoldásáig, mint állandóan kirántani alóluk a talajt.
Problémára: persze lehet rossz az aksi és rossz szünetmentes is. Ha van kéznél tartalék aksikészlet akkor az aksi kérdés rövidre zárható, ill. goto javítással fogalakozó cég.
Ugyanilyen szünetmenetes van egyik helyen ahol garázdálkodom: Aksi csere volt úgy hogy 80%-osnak mondta az aksikat, töltötte, merítette, épp csak diagnosztika mondta szarnak. Ebből kiindulva bármi lehet.
- A hozzászóláshoz be kell jelentkezni
Sajnos csere aksi az nincs.
Próbálok kölcsön kérni használt, de még működő aksikat egy másik szünetmentesünkbe, amíg a problémásat tesztelem, szervizeltetem.
- A hozzászóláshoz be kell jelentkezni
Első ránézésre ez a klasszikus kváziszinuszos UPS vs. aktív PFC-s táp jelenség. Tehát az történik, hogy amíg van áram, minden rendben, szinuszos kimenetet kapnak a gépek. Amint elmegy az áram, vagy önteszt indul, az UPS kimenete kváziszinuszosra változik (négyszög, vagy jobb esetben négyszöggel elég durván közelített szinusz), az aktív PFC-s táp meg szinuszos jelalakra számít, ennek következtében tartósan nagy áramot vesz fel az UPS-ből, amelyik túlterhelést érzékel és leáll.
Megoldás: UPS csere szinuszos kimenetű UPS-re, vagy tápegység csere passzív PFC-s tápra.
szerk: a kismegszakító lerúgás nem szokott jelentkezni a fenti szituációban, de nem kizárt, hogy azt is ez okozza, valószínűleg nem megfelelő az UPS túlterhelés-védelme.
Petya
- A hozzászóláshoz be kell jelentkezni
De a korábbi öntesztek alkalmával (az elmúlt kb. 5 évben) miért nem jelentkezett ez a probléma.
Nagyon régóta ezek az eszközök vannak ráterhelve.
- A hozzászóláshoz be kell jelentkezni
Amit írsz az elképzelhető, csakhogy a kérdéses UPS (Dell Smart-UPS 2200VA USB & Serial 230V) bizony szinuszos.
http://www.apc.com/resource/include/techspec_index.cfm?base_sku=DLA2200I
(Waveform Type: Sine wave)
Üdv:
Dw.
"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."
- A hozzászóláshoz be kell jelentkezni
aksi cellazárlat?
- A hozzászóláshoz be kell jelentkezni
passz...
Egyik szaki ismerősöm látatlanba azt mondta, hogy inverter hibára utal, de szinte biztos, hogy az UPS-sel van a hiba.
Holnap tesztelgetem szerverek nélkül, elfekvő gépekkel, monitorral.
- A hozzászóláshoz be kell jelentkezni
Épp tegnap délután volt nálunk egy kísértetiesen hasonló jelenség. A mi esetünkben egy dual-tápos Dell szerver egyik tápegysége hibásodott meg, ami sikeresen lecsapta a FI relét, ezzel áramtalanítva a fél szerverszobát...
Első körben tippünk sem volt, mi lehet a gond, viszont a problémás szerver UPS-e tetszhalottnak tűnt (mint később kiderült, csak lemerült az akksija), úgyhogy gyoran átkötöttük a rajta lévő szervereket egy másik UPS-re, de pár perccel később megint előjött a hiba. Nem sokkal később kiszúrtuk a táphibát jelző szervert, lehúztuk a hibás tápot, és utána már nem volt ezzel probléma.
Nem lehet, hogy nálad is valami hasonló áll a háttérben?
- A hozzászóláshoz be kell jelentkezni