Nekem is nagyon sokáig Munin volt az "igásló", szerettem is és tényleg egyszerű. Most mi is mindenhol Prometheus/Grafana vonalon mozgunk - illetve néhány Dashboard közvetlenül SQL-ből dolgozik.
Ami a Muninban tényleg jó volt, hogy nagyon egyszerű volt saját scriptekkel bővíteni és a szerveren elég volt csak felvenni az új hostot.
A Prometheus konfigurálás nem sokkal bonyolultabb ha nincs semmi extrára szükség. Ha van, akkor kicsit fájdalmasabb bővíteni. A Prometheus filozófiája hogy írjál/használj minden komponenshez saját exportert. Ez egy minden VM/container csak egy dolgot csinál rendszerben még oké, de a szokásos kis/középvállalati itt a szerver ami mindent is csinál a levelezéstől, HTTP proxyzáson keresztül az SMB megosztásig már kicsit fájdalmas, ja és az a tűzfal és a VPN szerver is. Ha nincs benne a default halmazban amit monitorozni akarsz akkor saját exportert írni bonyolultabb mint egy scriptet. Mi ezt úgy hidaltuk át hogy írtunk egy "mini Munint" ami 1-2-5-60 percenként lefuttatja a megadott scripteket és a Prometheus a textfile collectorral gyűjti a kimenetet. További előny hogy magát a scrape-elést sem lassítja ha időigényes egy-egy mérés. Így csak egy-egy scriptet kell hozzácsapni a rendszerhez ha van valami egzotikus hardver vagy szoftver amit figyelni kéne. Van MuninExporter is de azzal volt valami gond, ha jól emlékeszem talán nem jó neveket adott a metrikáknak és emiatt nem tudtuk könnyen vizualizálni, meg akkor már nem akartunk párhuzamosan két rendszert üzemeltetni.
A Munin HTML felülete elég egyszerű, amit mér, azt rajzolja. Ez kezdetben jó, nincs az az érzés mint egy frissen telepített Grafana-nál, hogy izé, mit is akarok látni? Nem mentetted le véletlenül a Dashboardot a mi Grafanankból? Nem éred most el? Hmmm... Mi is volt rajta? Viszont utána testre tudod szabni. Nem kell kerülgetni a felesleges/szinte soha nem használt grafikonokat, összerakhatod úgy ahogy neked tetszik. Az ügyfelek egyöntetű véleménye az volt, hogy soha többet nem akarnak Munint nézegetni, a Grafana sokkal kényelmesebb nekik - igaz nem ők konfigurálják hanem mi. Az általános tapasztalat hogy egyszer kell megcsinálni és utána nem nagyon kell hozzányúlni.
Emellett Prometheusban tudsz az összegyűjtött adatokon műveleteket végezni - pl: az átvitt adatmennyiségből sebességet vagy a múlt heti mérésekhez képest eltérést számolni -, meg tudod jeleníteni ugyanazt a metrikát több forrásból - pl: az összes adatbázis szerver CPU terhelése egy grafikonon.
Összességében a Munin felett eljárt az idő. Nem zárom ki hogy esetleg drasztikus módosítások után esetleg ismét felragyogjon a csillaga, de az már nem az a Munin lesz amit most ismerünk.
Szóval ez egy kicsit bővebb lére eresztett +1.