Monitoring szoftver

Fórumok

Sziasztok,

 

ki milyen monitoring szoftvert ajánlana és miért? :)

Sokáig használtam Nagios-t, de az elég régen volt (5-6 éve), akkor átálltam Icingára.

Most szerver upgrade van, és nem biztos, hogy Icingát tennék vissza.

A peremfeltételek:

  • a klienseken Nagios agent-ek vannak jó lenne, ha nem kellene végigmenni minden gépen újratelepíteni (bár ez még akár megoldható lenne), és beállítani (na ez már időigényesebb)
  • ezen kívül van pár saját plugin, ezt sem akarom nagyon átírni
  • szinte csak és kizárólag Linux, azon belül 95% Debian a monitorozandó host
  • néhány Windows van, ahol figyeljük a CPU-t, mem-et, diszk telítettséget

Kollektor nem kell, de vissza lehessen nézni, hogy mikor milyen események voltak, mondjuk 1 évig. Szerepkörök, jogosultság kezelés mindenképp kell - de ezek gondolom alapból vannak.

Jó lenne mindent a felületről megcsinálni, ill ha lenne clusterezési lehetőség, tehát másik gépre is tenni egyet, és failover céllal, valamint ha egy host/service az egyikről nem érhető el, akkor be tudjam állítani, mit mondjon nekem a program.

 

Köszi.

Hozzászólások

kb 10 éve centreon használunk. Annó nagios hoz kerestünk webes frontented, akkor ez lett. Akkor még nagios volt alatta az engine, azóta viszont már dobták a nagios-t és írtak sajátot, viszont a nagios pluginet ugyanúgy működnek. Viszont sok nagiosos cucc mk-status, thruk stb már nem fog menni. Van hozzá mobil app is ami push notificationt kezel a Droideon.

Fedora 42, Thinkpad x280

Zabbix-ot használok legalább 5 éve. Van hozzá agent Linuxra és Windowsra is. Tud működni aktív és passzív módban is (NAT mögött). Ez is tud sokféle értesítési csatornát (email, SMS, Telegram stb.) és vannak hozzá appok androidra is. Sőt van grafana plugin az adatbázisához. Cluster-ezést nem használtam, de elvileg azt is tudja. Az 5.0 LTS verziót érdemes föltenni jelenleg. (Van későbbi verzió is de az nem LTS). Hogy miért használom: azért mert ingyen van, és kicsi a költségvetés.

Nagios agent-tel nem kompatibilis, tehát a legfontosabb elvárásodnak nem felel meg. Bár annak valószínűleg szinte semmi nem felel meg (Nagios-t kivéve.)

sensu (nagion on steroids for modern times)

Szia!

Leírás alapján OS/Service alapú szolgáltatásokat akarsz figyelni ( nem SNMP alapon ), ahol az OS-re kell telepíteni valamilyen Agent-et.

Igények és  a fentiek alapján:
- check_mk raw edition ( https://checkmk.com/product/editions )

-Nagios -ra épűl, tehát a Nagios Agent-el kompatibilis,
-Jogosultságkezelés van,
-cluster opció van ( raw edition is tudja ),
-webgui - mindent a össze lehet "kattintani"  ( nagios konfighoz nem kell nyúlni, mert azt önmagának generálja le a cucc),
-Riasztásnál van többfajta csoport-beállítás, kinek miről mi menjen.
-Pluginek: https://checkmk.com/product/integrations

https://www.influxdata.com/ ha valami mást akarsz. Az 1.x es szeria meg tud nativ nagios inputot kezelni, a 2.x nel van egy közbülső telegraf réteg ami tudja ugyan azt.

Nagyon jók a collectorok, könnyű custom collectort írni 

---...---
TLoF

Az influxdb az csak egy sima tsdb. Ami monitoringra jó az a telegraf és a kapacitor. Arra tök jó hogy az aktuális állapotot megnézed, még visszanézed hogy mi volt régen. De nekem riasztásokat nem sikerült rendesen beállítani. A telegraf+influxdb pároshoz lehet kész grafana dashboard-okat letölteni, de a grafana féle alert se túl flexibilis. Pl. Maintenance period-okat nem sikerült megoldanom egy év alatt se.

kalapacs+szeg esete. nalunk van icinga a mindenfele riasztasra, meg collectd ami a metrikakat gyujti. egyik szol ha valami befosott, masikban meg lehet nezni h ha valtozik a trend :)

A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!