"Darabos" a munin

 ( Proci85 | 2017. február 17., péntek - 15:22 )

Sziasztok

Egy régi problémát szeretnék megoldani.
Ha nagy terhelést kap a szerver, akkor a munin nem szolgáltat grafikont...pont, amikor a legnagyobb szükség volna rá. Az MRTG ezzel szemben soha nem hagy ki.
Távolról kérdezem le a munint, cgi módban fut, tehát helyben nem generál semmit.
A távoli hoston:
./munin-node.conf:global_timeout 900
./munin-node.conf:timeout 180

Mióta távolról kérdezem le, gyakrabban csinálja.
Nagy terhelés általában backup során generált magasabb IO-t jelent, de a rendszer még bőven gyors reagálású, ezért nem értem. Látszólag volna tartalék. A jelenség egyidőben nem minden grafikonon jelentkezik. Kivétel nélkül mindig a diszkre vonatkozó grafikonoknál, de mellette akár az uptime vagy mysql grafikont is kihagyja...akár órákra, míg fut a backup.

Merre keressem a hibát?

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Ez jo esellyel azert lesz mert nem tud idoben lefutni a plugin, de lehet valami hiba miatt egyaltalan.
Nezd meg mennyi ido alatt futna le normal terheles mellett es az emlitett nagy terhelesen, pl telnet a kerdeses gep munin portjara es fetch , vagy futtasd lokalban munin-run .

Nem lehet valami prioritási dolog? Pl. a backup max. prior-ral megy, a munin pedig a legkisebbel?
Illetve a vm.dirty* is nagyban befolyásolja a gép "reszponzivitását" keményebb IO mellett.

Persze először kellene egy tesztkörnyezetet összehozni olyan load-dal, aminél a munin nem fut le.

Alapból nem piszkáltam, de az ötlet jó. Köszi!
Most találtam a neten: ionice -c3 script.sh

man:
-c, --class class
Specify the name or number of the scheduling class to use; 0 for none, 1 for realtime, 2 for best-effort, 3 for idle.

Ennek eredményeképp a munin eddig egyszer sem hagyott ki, plusz a top szerinti iowait sem olyan magas, mint korábban.

Mármint a backup.sh-t futtatod így gondolom.
Én általában az "ionice -c 3 nice -n 19 low_prio.sh" módszert követem.
Bár ha jól emlékszem az ionice csak cfq ütemezővel megy, szerveren pedig _általában_ célszerű deadline-t használni, illetve az SSD-k korában a noop.