icinga V1 lecserélése

 ( dzsambo | 2017. február 26., vasárnap - 23:17 )

Sziasztok!

Több év icinga használat után eljött az idő a leváltására. Nincs különösebb gondom vele, viszont már nem nagyon fejlesztik és a 2-es verzióval nem sikerült megbarátkoznom.

Főként Cisco-s hálózati eszközök, Ubuntu/Debian szerverek és pfSense tűzfalak és pár Windows-os szerver lenne monitorozva, 2000-2500 körüli ellenőrzéssel. Mivel kicsi gépeim
vannak ( Core 2 6400 és 4 GB memóra ), de sok van belőlük ezért valami load balancer-es megoldást keresnék. De nem tudom mi lenne a megfelelő. Ki mit ajánlana? Nem zárkózom el semmitől, de mivel kevés a szabad időm ezért olyan megoldás lenne a jó számomra ami nem túl bonyolult és hamar meg lehet tanulni.

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Zabbixot használok, és szerintem jó. Nem is bonyolult, amíg nem akarsz speciális, egyedi dolgokat monitorozni.
Az adatbázis lesz a szűk keresztmetszet, az nagyon viszi az io-t. Meg a RAM-ot.

A helyedben clusteren gondolkodnék, és virtualizálnám a szervert, a proxykat,és a frontendet.
A DB-t fizikai vason tartanám, persze ez sokmindentől függhet.

---
"A megoldásra kell koncentrálni nem a problémára."

+1

Nagyon jo es jol eloszthato rendszer, proxybol sok akar, zabbix server, db server. A db ala ssd-t javaslok.

Ido atlatni az igazi erteket, foleg az lld-t, de nem talaltam meg megoldhatatlan monoitorozando eroforrast vagy leirhatatlan riasztasi logikat.

Nem kell ssd ha nem vagy moho adatokat illetoen. Azaz a meresek ismetlodeset nem veszed nagyon rovidre (5perc ala), es a history hossza se legyen tobb hetes. Mert ez a ketto hatarozza meg a history tabla meretet. Ami nem azonnal fog jelentkezni, hanem amikor eljon a megadott keep historyban megadott idoszak vege. Ekkor mar a haziasszony is elkezd izzadni.

2500 meropont 3-5 perces ismetlodessel 8-14 meres/sec, ez nem sok.

Tudom, de ha icinga / nagios 2500 méréspontja van most az azonnal fog változni és legalább egy nagyságrendet, de inkább kettőt.

raid 10-es tömbben 330k mérési pont és kb 1500 host még kezelhető, de a lekérdezések már lassabbak mint kellene.

Az ssd igényt visszaszívom de hasznos lehet.

Ha a kollégának van 2 gépe akkor ugoron neki az appliance cd-vel. Csináljon egy szervert és egy proxy-t és elég lesz.

+1
Amit én hajtok, az 1500 hoston 29000 értéket mér. 240 mért érték jön be másodpercenként.
Bírja, de valóban nagyobb intervallumokra a grafikonok már lassulnak.

Most akarom majd particionálni a history és history_uint táblákat.

[Szerk:] az kimaradt, hogy PostgreSQL.

---
"A megoldásra kell koncentrálni nem a problémára."

+1

Az erőforrásigény kapcsán viszont egy kis érdekesség: én kb 25db hostot monitorozok vele, mindegyikre rá van húzva a default OS template, + értelem szerűen webre a web, e-mailre a mailszerverekkel kapcsolatos gyári templatek, és ezen kívül még 2-3db saját. Összesen kb. 1200db itemem van. Mindegyik templateben jócskán van 5 perces lekérdezési idő alatti item. A housekeeper átlagosan 1 évig tart meg mindent.

Az egészhez egy 5 dolláros DigitalOceanos vps-t használok FreeBSD-vel (1 core, 512MB ram, 20GB ssd). Ezen van a Zabbix frontend és a szerver is, a httpd alatta Nginx, a db Mysql. Swapelni nem szokott, a loadja minimális, 1.5 év után pedig 8.5GB a tárhelyhasználat. Zabbix 3.0.2.

Egyébként érdemes körülnézni itt:

https://www.zabbix.com/documentation/3.0/manual/installation/requirements

A fenti amúgy hobbi projekt, egy forintom sincs belőle, így nagyon megnézem hogy mennyit költök rá, ezért baszom a fillért :)

DB ha lesz az külön vasakon fog futni, ssd-s raid tömbbel.

Zabbix-ot is nézegettem régen, de a logikájára nem sikerült rájönnöm. Igazából semmit nem sikerült úgy beállítanom, hogy működjön.

Nem kell Zabbixot választani ha nem tetszett.
Konkretizáld magadban az elvárásaidat, és ahozz válassz valamit ami számodra kényelmes is, és jó is.

Gondolatébresztő:
Mivel Cisco eszközök is vannak a buliba, SNMP támogát kelleni fog (szerencsére ez már 'majd mindenhol alap).
A Win és Linux serverek miatt agent oldalon kell a multiplatform.
Hosszú távon az elosztott működés támogatása is szükséges lehet.

Ez segíthet a választásban:
https://en.wikipedia.org/wiki/Comparison_of_network_monitoring_systems

---
"A megoldásra kell koncentrálni nem a problémára."

Elfelejtetted megirni, mi a bajod az icinga v2-vel.
Igy max. kaphatsz egy listat, de azt talalsz a wikipedia-n is.

Mindenesetre van egy omd nevu disztrobucio, ami magaban foglal egy rakas monitorozo eszkozt, arra mindenkepp jo, h megnezd es kiprobald egyik-masikat.

Még amikor bejelentették akkor kezdtem el játszani vele, de nem boldogultam vele. Most ránéztem és egész sok doksi van hozzá, bár ez a definiálós dolog kissé fura számomra.

Az omd-t megnéztem és hát nem túl friss, pl.: icinga 1.13.1 amiből már 1.14 is van 1 éve.

A mostanival pontosan mit olvason? Mire riasztasz? Milyen sw hw-id vannak?

+1

A mostani monitorozás snmp-n és nrpe-n megy és mindent lekérek amit tudom, hogy hogy kell vagy látom értelmét lekérdezni. Sw: ubuntu/debian és Windows hw: APC pdu, ups, Cisco switch és router, HP nyomtató