Sziasztok,
Nálunk ZABBIX használatával történik a szerverek monitorozása. Esténként mikor megy a VMware mentés akkor néhány percre megszakad a hálózat valamint ugy be-beszaggatnak a mentendő gépek hogy jobbnak láttam erre az időszakra nem figyelni a klienseke.
Ezt az időszakot úgy próbáltam áthidalni hogy a mentés ideje alatt 'Maintenance' módot állítottam be a gépeken.
A 'Maintenance' mód mellett beállítottam a 'No data collect' opciót is hogy ne is gyűjtsön adatot.
Erre mikor vége van a beállított maintenance módnak a zabbix mégiscsak küld "Server is not reachable" üzentet.
Tehát bármikor a karbantartási idő alatt megszakad a kapcsolat az időszak utáni első percben küld a mocsok egy üzenetet.
Találkozott már valaki ezzel a hibával?
- 5299 megtekintés
Hozzászólások
Mivel maintenanceben nem mert, ezert a trigger nodata vagy mas fuggvenye erheto okbol riaszt.
Vagy allitsd be, hogy merjen maintenance alatt.
Vagy vedd rovidebbre a maintenance ablakot. Majd vegyel fol meg egyet a maradek idore, ami viszont merjen.
- A hozzászóláshoz be kell jelentkezni
De ha a nem mérés alatt a nodata inditja be a triggert miért a végén szól csak.
A maintenance ablakom 6 óra. Már az elején szólnia kellene nem csak a végén.
Vagy a trigger bekapcsol de a maintenance mód miatt nem küld jelzést?
hozzá tartozik a problémához még hogy nem inden szervernél csinálja
- A hozzászóláshoz be kell jelentkezni
Errol eleg hosszu vitak voltak, anno hogy melyik is a jobb az agent ping, vagy a no data, anno volter rajzolt is hozza egy jo kis diagrammot.
https://www.zabbix.org/wiki/Troubleshooting#Zabbix_says_.22Agent_unreac…
Elso lepeskent neked is javaslom hogy nezd meg a triggert kondiciokat, ahogy lovagX is mondta, erdemes bekapcsolni az adatgyujtest is erre az idoszakra mert erdekes dolokat lehet talalni. Mert ha a kifejezes az hogy nincs adat 300 masodperce akkor nem kell meglepodni ha utana panaszkodni fog hogy ha hamarabb vegeter az idoszak mint ahogy eleg adatod lenne.
Az adatgyujtes nelkuli maintenence inkabb hosszutavu karbantartasra, vagy nagy mennyisegu hostnal erdekes, mert lehet vele eroforrast sporolni, de ha rovid idorol van szo akkor nem erdemes, vagy pedig akkor ha SLA-t akarsz szamolni...
Amugy altalanossagban pedig azt mondanam hogy a VM-eken allist be fuggosegkent a host, elerhetoseget, persze ha legalabb 2.2-et hasznalsz ami VMware cuccoknal az Autodiscovery miatt meg inkabb erdekesebb, es csak a hypervisort tedd be a karbantartasba, lehet hogy mar igy csinaltad, de abbol amit irtal nekem nem ez jott le.
Jah es meg egy aprosag, ha nem tudod hol akad el akkor probald ki ezt (https://www.zabbix.org/wiki/Docs/action_simulator)
ui.: ha mar zabbix akkor ezt lesseteke meg es irjatok hozza hogy ti mit gondoltok hogy lenne szep es jo https://www.zabbix.org/wiki/Template_gallery
- A hozzászóláshoz be kell jelentkezni
Elvileg* a nodata maintenance utani elso meresnel erteklodik ki, igy nem kellene jeleznie.
Viszont ha bemasolnad a pontos trigger kifejezest, akkor okosabbat is tudunk mondani.
* "https://www.zabbix.com/documentation/2.0/manual/maintenance : When “no data” maintenance ends, triggers using nodata() function will not fire before the next check during the period they are checking."
- A hozzászóláshoz be kell jelentkezni
A triggerem
{HOSTNAME:agent.ping.nodata(5m)}=1
- A hozzászóláshoz be kell jelentkezni
Kiprobaltam, en is kaptam egy riasztas. (2.2.3) Hat ez ilyen.
Egyebkent en simple check-el neznem (icmpping vagy net.tcp.service), ami egybol 0-ra ad vissza ha nem megy a gep.
- A hozzászóláshoz be kell jelentkezni
Tegnap délután beállítottam hogy a maintenance mód alatt is szedjen adatot.
Nem jött riasztás reggel. Remélem nem csak a véletlen műve :-)
- A hozzászóláshoz be kell jelentkezni
Hidd el hogy jol fog meg jonni masra is az az adat(karbantartasi ablak, inditasi sorrend optimalizacio, varhato kieses stb), de amugy meg tuti nem veletlen.
- A hozzászóláshoz be kell jelentkezni