Nagios host figyelés

Fórumok

Sziasztok!

Adott egy nagios 2.5 szerver.

Azt szeretném beállítani, hogy egy host ha elmegy downba akkor csak a harmadik ellenőrzéskor küljön mailt.
Max check atttempt ....escalation...stb...
De hogyan?
Elég fontos lenne mert ellepnek az olyan levelek, hogy down...majd up 1 perc múlva /nyílván a hálózati torlódás miatt/ mert a célgép bizony elérhető volt mindig, csak éppen akkor nem jött válasz a pingre...

Előre is köszönöm!!!

Hozzászólások

Senkinek sincs ötlete? :(
A leírást már olvastam, de nem világos...

Flap detection be van kapcsolva.
De akkor is hamis infót kapok vissza, mert valójában nem flappel, csak mondjuk egy pingre nem jön vissza a válasz a hálózat pillanatnyi terheltsége miatt.

Érdekes szervíz esetében ha beállítom, hohy max check attempts 3 aakor csak a harmadiknál küldi az üzit.
Hostnál ez miért nem megy?

Sztetek?

Ebbe én is belefutottam. Az az érzésem, hogy a host ellenőrzésnél a max_attempt-ben megadott számú ellenőrzés lefut, de gyors egymás utánban, nem lehet megadni közöttük intervallumot, mint egy service-nél, nincs is ilyen változó.

Sztem 2 megoldás van.

1.
Az egyik, hogy a host ellenőrzésnek sokkal magasabb tűréshatárt kell adni, mint a rajta futó service-nek van. Nagy válaszidőt, meg 99% veszett csomagot. A csomag által szállított példában is ilyesmi van. Így ha a service elhasal, utána még van esély, hogy a host állva marad a magas küszöb miatt.

2.
Ha akkora a terhelés, hogy ez sem működik, akkor a host ellenőrzésére a check_dummy 0 -t kellene beállítani, ekkor mindig OK-val tér vissza a host, és a indulhat a service következő check attemptje a megfelelő időintervallum után.
Ezzel a megoldással gyarkorlatilag host sosem hal le, csak a rajta futó service, így a riportolást, rendelkezésreállást, a felügyeletet is service alapon kell értelmezni.

Köszi a megoldásokat.
Még annyi, hogy ti hogyan oldottátok meg azt, hogy a host csak pl a harmadik down-nál küldjön levelet?
Nagyon bosszant, hogy service-nél ezt be lehet állítani.

Host esetében is ott van a max check attempts, de pik-pak lefut.
Nem tudok interval-t állítani mint a service-nél.

Valaki segítsen mert tanácstalan vagyok! :(

Köszi skacok

Hát igen, a hostnál nem lehet retry_check_interval-t állítani, mert ilyen nincs a nagiosban.

Tomcsi check_host_alive-ja is csak akkor jön vissza hibával, ha 30 ping elszáll, sok a csomagvesztés és a viszzatérési érték. Ha Te is ezt használod, és még a max_attemptet is megemeled 3-ról 10-re, talán közeledsz a megoldáshoz.

Mondjuk vhogy így:


define host{
	host_name	        host_name
	alias	                alias
	address	                address
	max_check_attempts	10
	check_interval	
	check_period	        24x7
        check_command	        check_host_alive
	contact_groups	        contact_groups
	notification_interval	0
	notification_period	timeperiod_name
	notification_options	d,r,f
   	}

Üdv!

Próbálom Debian Sarge alá telepíteni a nagios-t, de ehhez le akarja szedni az openntpd-t Mi köze a kettőenk egymáshoz? Miért nem megy a kettő együtt?


# apt-get install nagios-text nagios-plugins
Reading Package Lists... Done
Building Dependency Tree... Done
The following extra packages will be installed:
  fping libradius1 nagios-common ntp ntp-server ntp-simple ntpdate qstat
  radiusclient1 smbclient snmp
Suggested packages:
  ntp-doc smbfs
The following packages will be REMOVED:
  openntpd
The following NEW packages will be installed:
  fping libradius1 nagios-common nagios-plugins nagios-text ntp ntp-server
  ntp-simple ntpdate qstat radiusclient1 smbclient snmp
0 upgraded, 13 newly installed, 1 to remove and 0 not upgraded.
Need to get 6497kB of archives.
After unpacking 16.3MB of additional disk space will be used.
Do you want to continue? [Y/n] n

szerk: most látom, hogy ntp-t akar feltenni, és az üti ki az openntpd-t. Kérdés: miért nem jó az openntpd, miért kell neki az ntp?

Petya