( ggallo | 2023. 06. 15., cs – 15:47 )

Elsőként a "lehetőleg ingyen"-re reagálnék: szerintem nagy butaság "szabadidőben" kitanulni és megvalósítani egy komplett monitorozó rendszert egy ekkora cég, ekkora hálózatára. Aztán vállalni is érte a felelősséget. Mert ugye ha már monitorozunk, és valamiről nem úgy vagy nem időben szól, akkor már a Te felelősséged. Amíg nem monitorozunk, addig a főnök baja, hogy miért nem vett monitorozó rendszert.
Ha 5-10 fős kis cégről beszélnénk, meg nagyon érdekel a téma, akkor még talán oké az ingyen munka. De ahol 1200 munkaállomás van, az eléggé tőkeerős, hogy kifizessen egy normális rendszert. Merthogy ha Te csinálod, akkor jó eséllyel pont annyit kapsz majd érte, mint amibe az ingyenes nyílt forrású szoftver kerül...
Más oldalról Te tudod, hogy akarsz-e ekkora munkát ingyen csinálni nekik...

A monitorozás meg a hálózat központi konfigurálás azért két teljesen külön terület. Vannak szoftverek, amelyek mindkettőt nyújtják, de jellemzően gyártó specifikus, nem univerzális. És fizetős. Legalábbis én még pénzért sem láttam olyan univerzális központi management szoftvert, ami ilyen vezérlési lehetőségeket tartalmazott...

"Univerzális" monitorozásra szerintem jelenleg a legkényelmesebb a Zabbix. Nagyon sok adatot gyűjt alapból, és könnyen bővíthető. Mi kb. 2 éve álltunk át Nagios-ról, amit kb. 15 évig használtunk. Most szerintem jobb a Zabbix (~20 éve jobb volt a Nagios, csak az kb. ott is maradt, ahol akkor volt). Pláne, ha sok az SNMP eszköz.

Az alkalmazás teljesítmény mérés és elemzés megint egy más terület, oda meg jobbak a time series adatbázisok (InfluxDB, Prometheus a két legismertebb), és azokra lehet saját (pl. Grafana) dashboard-ot összerakni, amin majd látható (ha jó a dashboard), hogy valószínű mi okozza a lassulást.