Sziasztok!
Van egy 0-24ben üzemelő gépem, debian lennyvel. Azt a jelenséget produkálja, hogy 2hetente újraindul. Minden második szombaton 17óra 30valamennyi perckor. De hogy mitől...? Szeretném kideríteni, hogy vajon ezt mi idézi elő.
Nézegettem a logokat, nem találtam semmi érdekeset, de lehet átsiklottam a megoldás felett.
Tudnátok segíteni, hogy vajon merre induljak el a felderítésben? Hol keresgéljek, és mit? :)
- 3147 megtekintés
Hozzászólások
a cronban meg a logokban keresgélj.
----------------------------------
feel the beat - it's everywhere!
- A hozzászóláshoz be kell jelentkezni
a syslogból annyi derül ki, hogy a sendmail -q futott le közvetlen az újraindulás(vagy nem tudom minek nevezzem:)) előtt. De az nem csak 2hetente futkorászik :)
- A hozzászóláshoz be kell jelentkezni
/var/log/fsck/checkfs logja árulkodik valamiről... http://davbar.hu/pub/log/checkfs
Szerintetek ez lehet a bibi?
- A hozzászóláshoz be kell jelentkezni
Nem, ez egy következmény. Minden reboot után lefut az fsck és ez belekerül a logba.
- A hozzászóláshoz be kell jelentkezni
Hol van a gép helyileg? Ha kikapcsolod az ACPI-t, akkor is újraindul?
- A hozzászóláshoz be kell jelentkezni
A gép a szervernetnél van bent. Nem hiszem, hogy ACPI probléma lenne, mert eddig is ez a kernel volt fent, és 80+ uptimekat csinált a gép. Atom stabil volt.
- A hozzászóláshoz be kell jelentkezni
Inkább olyasmire gondolok, hogy valaki általunk ismeretlen okból kifolyólag ctrl+alt+del gombokat nyomogat...
- A hozzászóláshoz be kell jelentkezni
Nade percre pontosan? :D:D
- A hozzászóláshoz be kell jelentkezni
Normál leállás/újraindulás, vagy olyan, mintha áramszünet/reset lenne?
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
Azt logból látom valahol?
- A hozzászóláshoz be kell jelentkezni
Hát a fent linkelt log -od (checkfs) nekem arra enged következtetni, hogy áramkimaradás, vagy reset...
- A hozzászóláshoz be kell jelentkezni
De mindig ugyanakkor? 2hetente, percre pontosan?
Persze nem zárom ki a dolgot, rá is kérdezek holnap az ügyfélszolgálatos srácnál.
- A hozzászóláshoz be kell jelentkezni
+1
Ha recovering journal, akkor váratlan újraindításról van szó.
Fut a gépen watchdog? Esetleg az aktiválódik indokolatlanul...
"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."
- A hozzászóláshoz be kell jelentkezni
Nem fut a gépen watchdog
Annyit nem értek, hogy ez a log 17:36:49-kor készült. A syslogban 17:34:01 az utolsó bejegyzés, és 17:37:31-kor indulnak a bootolás bejegyzései, bootdata ok.. töttörö-töttörö...
Tehát előbb van fschk és utána reboot?
- A hozzászóláshoz be kell jelentkezni
Rákérdeztem az ügyfélszolgálaton. Senki sem szólt még nekik, hogy elmenne az áram, ilyen rendszerességgel. Én meg nem egyedül vagyok a "konyektoron" gondolom :)
- A hozzászóláshoz be kell jelentkezni
takarítónő nem jár arra? :)
- A hozzászóláshoz be kell jelentkezni
nem :D:D
- A hozzászóláshoz be kell jelentkezni
fel :)
- A hozzászóláshoz be kell jelentkezni
Érdekes dolog történt. Nem oldódott meg a probléma, megvolt az esedékes újraindulás, de...
Ugye volt egy óraátállítás nemrég. Gép órája át is állt szépen, viszont az újraindulás most nem 17:35kor hanem 16:35kor történt.
date
2009. nov. 9., hétfő, 17.10.51 CET
hwclock --show
2009. nov. 9., hétfő, 17.10.35 CET -0.525424 másodperc
Hardware óra is jól jár. Szóval érdekes.
Így sincs ötlete senkinek? :)
- A hozzászóláshoz be kell jelentkezni
Ez azt jelenti, hogy a takarító néni nem állt át vagy előbb végzett :)
Úgy látszik minden második szombaton útban van a géped valakinek, mondd hogy helyezzék át egy salgóval..
- A hozzászóláshoz be kell jelentkezni
[OFF] Az Urban Terroros szervereddel mi történt?
Egyszer nyáron játék közben ledobott, és azóta se látom a szerver listán :-D
-------------------------------
"Nehogyma'! Te vagy a Blade Runner!"
- A hozzászóláshoz be kell jelentkezni
Keveset játszunk már, aztán nem volt rá idő meg kapacitás figyelgetni. Meg először azt hittem h az kavarja meg a rendszert és amiatt indulgat ujra. Szval nem elég stabil most hozzá a gép. Ha megoldódnak ezek az ujraindulásos prolémák, elképzelhető h újrainditom az UT-t is.
Néha azért jó lenne felgurulni egy pár percre :)
- A hozzászóláshoz be kell jelentkezni
...Napi szinten rajta lógok mán' wáááááá az agyamra megy :))
- A hozzászóláshoz be kell jelentkezni
Egy próbát megér:
motion (mozgásérzékelővel ellátott képfelvevő webkamerához)
- A hozzászóláshoz be kell jelentkezni
Nekünk is van egy ilyen gépünk annál a szolgáltatónál, de a mienknek kikapcsol a tápja. Úgy kell bekapcsoltatni 2-3 hetente, de akkor most figyelni fogom az időpontot :).
Lehet rá fogjuk tenni egy szünetmentesre hogy logoljuk mi a szar történik.
- A hozzászóláshoz be kell jelentkezni
Oké. Nekem 7én szombaton 16:30valamennyikor volt a legutóbbi. Tehát a következő 21-ére várható :)
- A hozzászóláshoz be kell jelentkezni
Némely szünetmentes gyári beállítása szokta ezt okozni.
All APC Smart-UPS initiate a self-test when power is turned on and every
2 weeks, as well as at the push of a button and at pre-determined times
(using software). This ensures that you will be alerted of failing batteries
before they wear out.
Más márkánál:
Automatic self-tests every two weeks ensure that you will be alerted to degraded batteries before they wear out. You may perform self-tests anytime.
--
http://opensolaris.org/os/project/indiana/
http://www.opera.com/browser/
- A hozzászóláshoz be kell jelentkezni
99%, hogy ez áll a dolog mögött
- A hozzászóláshoz be kell jelentkezni
Elgondolkodtató a dolog. Lehet rákérdezek a supportnál h "mizu az upsekel?"
- A hozzászóláshoz be kell jelentkezni
Az UPS lényege nem épp az, hogy megóvjon ezektől..? :) Vagy csak akkor csinálja, ha már rossz az aksi és nem cserélik?
- A hozzászóláshoz be kell jelentkezni
Ha beraksz egy UPS-t a szervered elé, annak egy pár év alatt szépen csendben kiöregednek az akkumulátorai. Aztán amikor jön a valódi áramszünet, akkor már azt a két percet sem fogja tudni áthidalni, amíg eljut a szerver a halt-ig (most nem egy szélvészgyors Windows 7 szerverről beszélek, ami nyilván 2 másodperc alatt shutdown-ol).
Ennek kivédésére több választási lehetőség van:
1. Te gondoskodsz időnként az UPS teszteléséről
2. Rábízod az UPS-re - mondjuk kéthetente
3. Ha a szolgáltatás nem bírja el a teszteléssel történő kiesést, akkor pár évente szó nélkül cseréled az UPS-t, vagy az akkumulátorokat
4. Gazdag vagy és HA cluster mellé kettős betáplálásod van tartalék aggregátorral (ebben az esetben sem azonnal hidal át az aggregátor és azt sem árt rendszeresen ellenőrizni)
Üdv,
Dw.
"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."
- A hozzászóláshoz be kell jelentkezni
> Ha a szolgáltatás nem bírja el a teszteléssel történő kiesést
Na most én csak azt nem értem, hogy szükségszerű ez a kiesés az UPS tesztnél, vagy csak akkor történik, ha már öreg az akksi?
De igazából költői a kérdés, mert az egyik lehetőséget úgysem fogadom el. :)
- A hozzászóláshoz be kell jelentkezni
Másik lehetőség, hogy semmi baja, csak túl van terhelve. Annyi gép van ráaggatva, amit nem bír el, így mikor átvált akksira, akkor túlterhelés miatt lekapcsol.
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
áá tényleg két hét, valami lenny bug lenne? átrakattuk a terem másik végébe, hátha javul a részidő :D
Wed Oct 28 18:04:58 2009
Wed Nov 11 18:17:21 2009
- A hozzászóláshoz be kell jelentkezni
Nekünk is a szervernetnél van, de nincs ilyen gondunk, tehát valami más lesz a bibi. Ubuntu 8.10 server edition fut rajta mondjuk.
- A hozzászóláshoz be kell jelentkezni
:D
lenny bug és csak kettőnknél :D Érezd magad megtisztelve :D
- A hozzászóláshoz be kell jelentkezni
Énis átrakattam :) Biztos ami biztos :D
- A hozzászóláshoz be kell jelentkezni
A tiedbe nincs véletlen vmilyen adaptec vezérlő?
- A hozzászóláshoz be kell jelentkezni
subscribe mystic-channel
- A hozzászóláshoz be kell jelentkezni
Mivel amúgy is "misztikus" a hiba, hagy kérdezzek valami butaságot:
biztonsági frissítések automatikusan jönnek, vagy manuálisan oldod meg a kérdést? Ha esetleg automatikusra tetted, mennyi a periódusa ennek?
- A hozzászóláshoz be kell jelentkezni
Manuálisan oldom meg, teljesen random időzítéssel :)
- A hozzászóláshoz be kell jelentkezni
Takarítónéni kihúzza a konnektorból, mert a porszívónak kell az aljzat.
- A hozzászóláshoz be kell jelentkezni
A Szervernetnén így alakítják a pormentes körülményeket?
- A hozzászóláshoz be kell jelentkezni
És az ellenség megtévesztése végett pontban 17:35-kor dugják be a porszívót.
- A hozzászóláshoz be kell jelentkezni
Ezt te irtad le 454564562. alkalommal.
- A hozzászóláshoz be kell jelentkezni
Milyen vas és hány diszk van a gépben?
Én rendszeresen küzdök random reboot / random kernel panic problémákkal olyan összetákolt PC -knél amiben 10+ diszk van. Hiába teszem bele a legjobb Enermax tápot, 1 éves uptime -ot a legritkábban esetben érek el nagy (alkalmi) terhelésű 10+ diszkes PC -vel, hiába szerver alaplap és ECC RAM. A 4-6 diszkes tákolt PC -k hasonló konfigban mennek évekig gond nélkül. Egyelőre nem tudom a jelenség pontos okát, csak hogy ilyen is van. :)
- A hozzászóláshoz be kell jelentkezni
4 scsi meg 2 sata diszk van benne. szerver lap, ecc ramok, fasza táp... De összerakott :) Viszont a terhelése elenyésző.Ugyhogy nemtudom :(
- A hozzászóláshoz be kell jelentkezni
Ha annyira menetrendszerűen történik az újraindulás, akkor menetrend szerint érdemes lenne jól megnézni, hogy pontosan mi történik. Logot kellene abban az időszakban szinkronizálni egy távoli gépre (sshfs): elsősorban azt lenne jó látni, hogy milyen folyamatok futnak (no meg mennyire terhelnek). (Esetleg a helyszínen is érdemes lehet élőben nézni, hogy mi történik - ha megoldható.)
Aztán a BIOS-t is érdemes lehet átbönészni.
És végül -attól függően, hogy mennyire kivitelezhető- egy hétvégére máshová (nagyon máshová, nem a terem másik sarkába) kell költöztetni a gépet.
- A hozzászóláshoz be kell jelentkezni
Nem akarok belepofazni a nagyok dolgaba, de mivel mindig ugyan akkor tortennek az ujraindulasok, ezert nem jo otlet az adott idopontban odamennyi a gephez 10 perccel korabban, es figyelni, hogy mi tortenik?
Ha meg nem tortenik semmi, akkor eselyes, hogy emberi beavatkozas szokott lenni...
- A hozzászóláshoz be kell jelentkezni
végső esetben ez lesz :)
- A hozzászóláshoz be kell jelentkezni
Bah, bakker, szeptemberben indítottad a topicot, de már előtte is csinálta, hónapok óta szívsz evvel, és még nem szántál erre egy fél órát?!...
:)
- A hozzászóláshoz be kell jelentkezni
Eltaláltad :D
Komolyra fordítva a szót, nem olyan egyszerű. :)
- A hozzászóláshoz be kell jelentkezni
+1
"Attól, hogy kinyomtatták, még nem szentírás..."
- A hozzászóláshoz be kell jelentkezni
Ma volt szerencsém belepillantani a BIOS-ába a kicsikének IP-konzolon. Az órája 1 órával visszább van mint a pontos idő. Tehát a teória, hogy nem a gép hibája a dolog megdőlni látszik. Ráadásul mostmár nem csak kéthetente indul újra, hanem rendszertelenül.
Két dologra gyanakodnék: az egyik az alaplap: Tyan K8WE , a másik a SCSI kártya: Adaptec 2200S
Logokban változatlanul semmi.
Van ötletetek, hogy deríthetném ki hogy mi okozza a problémát? Tudom valahogy a logolást vmi durvábbra rakni, hogy minden apró kis dolgot naplózzon?
- A hozzászóláshoz be kell jelentkezni
Sőt, eszembe jutott még valami. Kb akkor kezdődtek a gondok mikor egyik kolegám kicserélte a gépben a 2 egymagos procit, két 2magosra, és rosszul rakta rá az egyikre a hűtőventillátort. Pár napig ment úgy a gép mire valaki észrevette.
Processzorokat szerintetek hogyan és mivel tudnám ellenőrizni? Ha lehet szerverszobai látogatás nélkül :)
- A hozzászóláshoz be kell jelentkezni
cpuburn, elég hamar kidől a proci ha megküldöd.
--
Vittem a buliba egy üveg sósavat. Oldódjon a hangulat...
- A hozzászóláshoz be kell jelentkezni
Köszi!
Hát megküldtem. :) Meg se kottyant neki. Simán muzsikál tovább a gép, nem is melegedett.
Büszke vagyok rá :D
- A hozzászóláshoz be kell jelentkezni
Azért figyeld hogy nem-e dobja el magát egyszer csak :-)
--
Vittem a buliba egy üveg sósavat. Oldódjon a hangulat...
- A hozzászóláshoz be kell jelentkezni
Oké, majd futtatok egy hosszabb tesztet. Bár ekkora terhelés nem jellemző a gépre, amit ez a jószág generál.
- A hozzászóláshoz be kell jelentkezni
A hosting cégnél milyen UPS-en vannak a gépek? Konkrétan az a kérdés, hogy kváziszinuszos (négyszöggel közelített szinusz), vagy rendes, szinuszos?
Csak mert ha aktív PFC-s a tápegység a gépedben (főleg a Chieftec GPS széria háklis nagyon erre, nekem is volt...), és az UPS meg kváziszinuszos, akkor az első alkalommal, amikor megpróbál akksiról járni a gép (áramszünet, vagy önteszt), le fog állni (a PFC vezérlő megbolondul a négyszögjeltől, és túlterhelésbe viszi az UPS-t, amely ezt érzékelve leáll.).
Tehát első körön a tápegység pontos típusa érdekelne, illetve hogy a szolgáltató milyen tápot ad akkus üzemben. (Ha nem tudják megmondani, vigyél oszcilloszkópot, és nézd meg magad)
Petya
- A hozzászóláshoz be kell jelentkezni
A tápról össz-vissz annyi információm van, hogy HIPRO 700W-os. Megpróbálok valahonnan infót szerezni a dologról. De mint írtad, ez akkor leállítja végsősoron az UPS-t. Ezt meg nem tapasztalták az operátorok. Csunya lenne, ha négyszögjeles UPS-ei lennének a cégnek, de a mai világban nem lepődnék meg ezen sem :)
Köszi az ötletet.
- A hozzászóláshoz be kell jelentkezni
Ha mást nem tudsz, akkor menj be, és kérd meg őket, hogy nyomják meg a TEST gombot a kedvedért :) Ha leáll a géped, megvan a bűnös.
Petya
- A hozzászóláshoz be kell jelentkezni
oké, köszi :)
- A hozzászóláshoz be kell jelentkezni
....ehe, meg esetleg a többi is azon a soron :)
- A hozzászóláshoz be kell jelentkezni
:D
- A hozzászóláshoz be kell jelentkezni
Ha ettől leállnak, akkor 2 hetente ugyanúgy le kell állniuk az automatikus teszttől is :)
A másik lehetőség, hogy a következő teszt idejére bemész, és megvárod.
Petya
- A hozzászóláshoz be kell jelentkezni
Tudomásom szerint a kváziszinuszos táp fűrészfog-hullámforma amplitúdójú jelet szolgáltat, ami az aktív PFCs áramkört elkezdi "lökdösni", erős melegedést produkálva benne.
- A hozzászóláshoz be kell jelentkezni