Sziasztok!
Adott egy nagios 2.5 szerver.
Azt szeretném beállítani, hogy egy host ha elmegy downba akkor csak a harmadik ellenőrzéskor küljön mailt.
Max check atttempt ....escalation...stb...
De hogyan?
Elég fontos lenne mert ellepnek az olyan levelek, hogy down...majd up 1 perc múlva /nyílván a hálózati torlódás miatt/ mert a célgép bizony elérhető volt mindig, csak éppen akkor nem jött válasz a pingre...
Előre is köszönöm!!!
- 1831 megtekintés
Hozzászólások
Senkinek sincs ötlete? :(
A leírást már olvastam, de nem világos...
- A hozzászóláshoz be kell jelentkezni
A flap arról szól, hogy engeded-e azt, hogy jöjjön hibajegy akkor is, ha esik-kel a hostod. (flip-flappol) De nem tudom, hogy mekkora időintervallumon belül tekinti flappolásnak a dolgot. Nyilván két nap már nem flipflappolás :O
--
unix -- több, mint kód. filozófia.
- A hozzászóláshoz be kell jelentkezni
Bár, ha esik - kel a gép, az azért nem jó, hacsak nem direkt szüröd ilyenre.
--
unix -- több, mint kód. filozófia.
- A hozzászóláshoz be kell jelentkezni
enable_flap_detection=1 a nagios.cfg -ben szerintem.
--
unix -- több, mint kód. filozófia.
- A hozzászóláshoz be kell jelentkezni
Flap detection be van kapcsolva.
De akkor is hamis infót kapok vissza, mert valójában nem flappel, csak mondjuk egy pingre nem jön vissza a válasz a hálózat pillanatnyi terheltsége miatt.
Érdekes szervíz esetében ha beállítom, hohy max check attempts 3 aakor csak a harmadiknál küldi az üzit.
Hostnál ez miért nem megy?
Sztetek?
- A hozzászóláshoz be kell jelentkezni
Érdekes állat eza nagios :)
Nekem az audio alert nem megy, pedig beállítottam a doksi szerint :O
(lásd az annaknyitott topikot)
--
unix -- több, mint kód. filozófia.
- A hozzászóláshoz be kell jelentkezni
Ebbe én is belefutottam. Az az érzésem, hogy a host ellenőrzésnél a max_attempt-ben megadott számú ellenőrzés lefut, de gyors egymás utánban, nem lehet megadni közöttük intervallumot, mint egy service-nél, nincs is ilyen változó.
Sztem 2 megoldás van.
1.
Az egyik, hogy a host ellenőrzésnek sokkal magasabb tűréshatárt kell adni, mint a rajta futó service-nek van. Nagy válaszidőt, meg 99% veszett csomagot. A csomag által szállított példában is ilyesmi van. Így ha a service elhasal, utána még van esély, hogy a host állva marad a magas küszöb miatt.
2.
Ha akkora a terhelés, hogy ez sem működik, akkor a host ellenőrzésére a check_dummy 0 -t kellene beállítani, ekkor mindig OK-val tér vissza a host, és a indulhat a service következő check attemptje a megfelelő időintervallum után.
Ezzel a megoldással gyarkorlatilag host sosem hal le, csak a rajta futó service, így a riportolást, rendelkezésreállást, a felügyeletet is service alapon kell értelmezni.
- A hozzászóláshoz be kell jelentkezni
Értem! És ezt hogyan tudom kivitelezni?
- A hozzászóláshoz be kell jelentkezni
Nekem így néz ki a ping ami megy a hostra és service-re.
check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5 -t 15
- A hozzászóláshoz be kell jelentkezni
+ itt még érdekelne az is, hogyan tudok sms-t kapni ha valami elmegy downba.
Most az a megoldás van, hogy van t-email-es mailcím. Ha erre beesik levél arról jön sms is.
Van ennél jobb és olcsóbb megoldás??? :)
- A hozzászóláshoz be kell jelentkezni
En is igy hasznalom.
- A hozzászóláshoz be kell jelentkezni
Nálam Nokia 3210 a monitorozó gépre rákötve USB -n, és Gnokii küldi ki az SMS -t.
- A hozzászóláshoz be kell jelentkezni
Köszi a megoldásokat.
Még annyi, hogy ti hogyan oldottátok meg azt, hogy a host csak pl a harmadik down-nál küldjön levelet?
Nagyon bosszant, hogy service-nél ezt be lehet állítani.
Host esetében is ott van a max check attempts, de pik-pak lefut.
Nem tudok interval-t állítani mint a service-nél.
Valaki segítsen mert tanácstalan vagyok! :(
Köszi skacok
- A hozzászóláshoz be kell jelentkezni
Nekem max-check-attemps 3, es a check-host-alive fut le ellenörzéskor:
define command{
command_name check-host-alive
command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,60% -c 5000.0,100% -p 30
}
- A hozzászóláshoz be kell jelentkezni
nekem a -p 5.
Nem 30.
Ez rendben is van, de ha nézed a logot és nem tud pingetni akkor másodpercek alatt ráfut a 3/3-ra és már jön is a levél.
Míg ugyanez service-nél lehet állítani, hogy mondjuk 1 perc múlva próbálja újra.
- A hozzászóláshoz be kell jelentkezni
Hát igen, a hostnál nem lehet retry_check_interval-t állítani, mert ilyen nincs a nagiosban.
Tomcsi check_host_alive-ja is csak akkor jön vissza hibával, ha 30 ping elszáll, sok a csomagvesztés és a viszzatérési érték. Ha Te is ezt használod, és még a max_attemptet is megemeled 3-ról 10-re, talán közeledsz a megoldáshoz.
Mondjuk vhogy így:
define host{
host_name host_name
alias alias
address address
max_check_attempts 10
check_interval
check_period 24x7
check_command check_host_alive
contact_groups contact_groups
notification_interval 0
notification_period timeperiod_name
notification_options d,r,f
}
- A hozzászóláshoz be kell jelentkezni
Na ez az.
Én megemeltem 20-ra a max check attempts-et.
Erről ennyit. :)
- A hozzászóláshoz be kell jelentkezni
Hello!
Milyen adatkábelt használsz hozzá? Lehet még szerinted ilyet kapni?
Petya
- A hozzászóláshoz be kell jelentkezni
Ez engem is érdekelne
- A hozzászóláshoz be kell jelentkezni
Üdv!
Próbálom Debian Sarge alá telepíteni a nagios-t, de ehhez le akarja szedni az openntpd-t Mi köze a kettőenk egymáshoz? Miért nem megy a kettő együtt?
# apt-get install nagios-text nagios-plugins
Reading Package Lists... Done
Building Dependency Tree... Done
The following extra packages will be installed:
fping libradius1 nagios-common ntp ntp-server ntp-simple ntpdate qstat
radiusclient1 smbclient snmp
Suggested packages:
ntp-doc smbfs
The following packages will be REMOVED:
openntpd
The following NEW packages will be installed:
fping libradius1 nagios-common nagios-plugins nagios-text ntp ntp-server
ntp-simple ntpdate qstat radiusclient1 smbclient snmp
0 upgraded, 13 newly installed, 1 to remove and 0 not upgraded.
Need to get 6497kB of archives.
After unpacking 16.3MB of additional disk space will be used.
Do you want to continue? [Y/n] n
szerk: most látom, hogy ntp-t akar feltenni, és az üti ki az openntpd-t. Kérdés: miért nem jó az openntpd, miért kell neki az ntp?
Petya
- A hozzászóláshoz be kell jelentkezni