Nagios host figyelés

Sziasztok!

Adott egy nagios 2.5 szerver.

Azt szeretném beállítani, hogy egy host ha elmegy downba akkor csak a harmadik ellenőrzéskor küljön mailt.
Max check atttempt ....escalation...stb...
De hogyan?
Elég fontos lenne mert ellepnek az olyan levelek, hogy down...majd up 1 perc múlva /nyílván a hálózati torlódás miatt/ mert a célgép bizony elérhető volt mindig, csak éppen akkor nem jött válasz a pingre...

Előre is köszönöm!!!

1831 megtekintés

Senkinek sincs ötlete? :(
A leírást már olvastam, de nem világos...

0 szavazat

A hozzászóláshoz be kell jelentkezni

A flap arról szól, hogy engeded-e azt, hogy jöjjön hibajegy akkor is, ha esik-kel a hostod. (flip-flappol) De nem tudom, hogy mekkora időintervallumon belül tekinti flappolásnak a dolgot. Nyilván két nap már nem flipflappolás :O

--
unix -- több, mint kód. filozófia.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Bár, ha esik - kel a gép, az azért nem jó, hacsak nem direkt szüröd ilyenre.
--
unix -- több, mint kód. filozófia.

0 szavazat

A hozzászóláshoz be kell jelentkezni

enable_flap_detection=1 a nagios.cfg -ben szerintem.

--
unix -- több, mint kód. filozófia.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Flap detection be van kapcsolva.
De akkor is hamis infót kapok vissza, mert valójában nem flappel, csak mondjuk egy pingre nem jön vissza a válasz a hálózat pillanatnyi terheltsége miatt.

Érdekes szervíz esetében ha beállítom, hohy max check attempts 3 aakor csak a harmadiknál küldi az üzit.
Hostnál ez miért nem megy?

Sztetek?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Érdekes állat eza nagios :)
Nekem az audio alert nem megy, pedig beállítottam a doksi szerint :O
(lásd az annaknyitott topikot)

--
unix -- több, mint kód. filozófia.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ebbe én is belefutottam. Az az érzésem, hogy a host ellenőrzésnél a max_attempt-ben megadott számú ellenőrzés lefut, de gyors egymás utánban, nem lehet megadni közöttük intervallumot, mint egy service-nél, nincs is ilyen változó.

Sztem 2 megoldás van.

1.
Az egyik, hogy a host ellenőrzésnek sokkal magasabb tűréshatárt kell adni, mint a rajta futó service-nek van. Nagy válaszidőt, meg 99% veszett csomagot. A csomag által szállított példában is ilyesmi van. Így ha a service elhasal, utána még van esély, hogy a host állva marad a magas küszöb miatt.

2.
Ha akkora a terhelés, hogy ez sem működik, akkor a host ellenőrzésére a check_dummy 0 -t kellene beállítani, ekkor mindig OK-val tér vissza a host, és a indulhat a service következő check attemptje a megfelelő időintervallum után.
Ezzel a megoldással gyarkorlatilag host sosem hal le, csak a rajta futó service, így a riportolást, rendelkezésreállást, a felügyeletet is service alapon kell értelmezni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Értem! És ezt hogyan tudom kivitelezni?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nekem így néz ki a ping ami megy a hostra és service-re.
check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5 -t 15

0 szavazat

A hozzászóláshoz be kell jelentkezni

+ itt még érdekelne az is, hogyan tudok sms-t kapni ha valami elmegy downba.
Most az a megoldás van, hogy van t-email-es mailcím. Ha erre beesik levél arról jön sms is.
Van ennél jobb és olcsóbb megoldás??? :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

En is igy hasznalom.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nálam Nokia 3210 a monitorozó gépre rákötve USB -n, és Gnokii küldi ki az SMS -t.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszi a megoldásokat.
Még annyi, hogy ti hogyan oldottátok meg azt, hogy a host csak pl a harmadik down-nál küldjön levelet?
Nagyon bosszant, hogy service-nél ezt be lehet állítani.

Host esetében is ott van a max check attempts, de pik-pak lefut.
Nem tudok interval-t állítani mint a service-nél.

Valaki segítsen mert tanácstalan vagyok! :(

Köszi skacok

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nekem max-check-attemps 3, es a check-host-alive fut le ellenörzéskor:

define command{
command_name check-host-alive
command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,60% -c 5000.0,100% -p 30
}

0 szavazat

A hozzászóláshoz be kell jelentkezni

nekem a -p 5.
Nem 30.
Ez rendben is van, de ha nézed a logot és nem tud pingetni akkor másodpercek alatt ráfut a 3/3-ra és már jön is a levél.
Míg ugyanez service-nél lehet állítani, hogy mondjuk 1 perc múlva próbálja újra.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hát igen, a hostnál nem lehet retry_check_interval-t állítani, mert ilyen nincs a nagiosban.

Tomcsi check_host_alive-ja is csak akkor jön vissza hibával, ha 30 ping elszáll, sok a csomagvesztés és a viszzatérési érték. Ha Te is ezt használod, és még a max_attemptet is megemeled 3-ról 10-re, talán közeledsz a megoldáshoz.

Mondjuk vhogy így:


define host{
	host_name	        host_name
	alias	                alias
	address	                address
	max_check_attempts	10
	check_interval	
	check_period	        24x7
        check_command	        check_host_alive
	contact_groups	        contact_groups
	notification_interval	0
	notification_period	timeperiod_name
	notification_options	d,r,f
   	}

0 szavazat

A hozzászóláshoz be kell jelentkezni

Na ez az.
Én megemeltem 20-ra a max check attempts-et.
Erről ennyit. :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hello!

Milyen adatkábelt használsz hozzá? Lehet még szerinted ilyet kapni?

Petya

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez engem is érdekelne

0 szavazat

A hozzászóláshoz be kell jelentkezni

Üdv!

Próbálom Debian Sarge alá telepíteni a nagios-t, de ehhez le akarja szedni az openntpd-t Mi köze a kettőenk egymáshoz? Miért nem megy a kettő együtt?


# apt-get install nagios-text nagios-plugins
Reading Package Lists... Done
Building Dependency Tree... Done
The following extra packages will be installed:
  fping libradius1 nagios-common ntp ntp-server ntp-simple ntpdate qstat
  radiusclient1 smbclient snmp
Suggested packages:
  ntp-doc smbfs
The following packages will be REMOVED:
  openntpd
The following NEW packages will be installed:
  fping libradius1 nagios-common nagios-plugins nagios-text ntp ntp-server
  ntp-simple ntpdate qstat radiusclient1 smbclient snmp
0 upgraded, 13 newly installed, 1 to remove and 0 not upgraded.
Need to get 6497kB of archives.
After unpacking 16.3MB of additional disk space will be used.
Do you want to continue? [Y/n] n

szerk: most látom, hogy ntp-t akar feltenni, és az üti ki az openntpd-t. Kérdés: miért nem jó az openntpd, miért kell neki az ntp?

Petya

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nagios host figyelés

Hozzászólások