( joco01 | 2018. 01. 20., szo – 11:45 )

Felelevenítem ezt egy kicsit. Ránéztem több megoldásra, ami fentebb volt javasolva (csak doksi/demo, nem tettem fel), és az a baj, hogy szerintem rengeteg pluszmunkát igényelnek. Elhiszem, hogy ez professzionális környezetben embert és szakértelmet kíván, de nekem se időm, se szakértelmem, és ez csak egy darab otthoni szerver, next-next-finish konfiguráció kellene, "jó lesz a default is" hozzáállással.

Amit én igazán szeretnék, az az, hogy felteszem, és alapból ott van 100 grafikon meg 100 bekonfigurált alert, amiket egyszer egy okos ember már összerakott, és én maximum elveszek belőle vagy hozzáadok 1-2-t. Ez kb. az, amit annak idején a Microsoft System Center Essentials tudott egy az egyben (abból az is SCOM). Csak nekem Linuxra kellene, lehetőleg open source.

Biztos összeszedte már valaki, hogy pl. a >90% softirq rossz. Kis ferdítéssel én azt se tudom, mi az, és miért kéne figyelni. Persze nekiállhatnék egyesével, hogy diszk terület figyelés, CPU terhelés figyelés, hőmérséklet figyelés, stb., eljutnék egy tucatig, rámenne a sok idő, de még mindig van 100 másik metrika, ami mutathat valamit.

- Netdata: Baromi jó, hogy kapok sok chartot alapból, ez eddig a legpozitívabb. De alertingről alig esik szó a doksikban. Pedig az pont olyan fontos, ha nem fontosabb, mint a grafikon. Nem kedvtelésből akarok grafikont nézegetni, hanem csak azt akarom látni, ha baj van. És az is baj, hogy nem perzisztál adatot, pedig én pl. akarnék olyat, hogy SMART érték tendenciák X évre visszamenőleg.
- Grafana: Csinos, de az a baj, hogy alapból üres, tőlem várja el, hogy rakjam össze egyesével a grafikonokat. Én meg pont nem azt akarom, hanem ő szedje elő az adatforrásból az összes létező metrikát, és tegye be kategóriák szerint pár menüpontba, hogy nekem már csak válogatni kelljen közülük.
- Prometheus: Szintén tetszik az alap ötlet, de ez egy üres héjat ad csak. Default alerting rule-okat nem láttam benne. A beépített grafikonja fényévekre van attól, amit én szeretnék.
- InfluxDB alapú megoldások: Itt az a baj, hogy N darab szoftverre van szétszedve a dolog. Ami általában jó, de az én céljaimra pont nem. Alapból nem tudja a bal kéz, mit csinál a jobb esete. Annyi rétegen megy át egy-egy metrika, hogy a végén már nem fogja tudni magától a rendszer, hogy abból milyen érték számít jónak vagy rossznak, tehát nekem kell konfigurálni rengeteg mindent.

Remélem, nem írtam hülyeséget.