linux debian - magas load average - indok?

Tisztelt Fórumtársaim!

A szerveren naponta 1x felmegy 7-8 fölé a load average,az utóbbi időben 3x is,de néha több napig.
Átlagban elég alacsony a LA, amikor felmegy nem a processzor miatt,hanem az IO műveletek miatt.
A gépen szoftvered raid1 van.
Ilyenkor nem megy fel a memória használat,sem a CPU használat,csak IO művelet van.

iotop se adott értelmes választ, maga a TOTAL READ/WRITE nagyon magas,de egyik processz sem az.

Újrainditás követően is felmegy az LA,amikor ez az 5-10-15-20 perce van.

Kiírattam a blokkokat,és aszerint szűrtem syslogból,de csak kjournald-t láttam,ami elvileg nem kell számításba venni. Attól nem lehet nagy az LA a cikkek szerint, írtak valami noatime-ot,hogy tegyem be fstab-ba,vagy mountoljam úgy fel, most bevan kapcsolva,de ugyanaz.

Szeretnék elindulási irányt kérni tőletek,hogy merre keresgéljem az okát ennek?

Muninról képeket itt tudjátok megnézni:
http://imgur.com/a/VlvRt#4

Köszönöm a válaszokat

6075 megtekintés

Egy _tipp_:
munin disk pluginek csokra. Több esetben is tapasztaltunk már hasonlót miatta. A munin rajzolások igencsak tudnak szépeket művelni, ha fűfavirág be van téve neki (főleg, ha nem erőmű van alatta). A képeid közül kitűnik, hogy a munin processing time-ban nem csak időnként van kimaradás, hanem szinte folyamatosan hiányos a mérés. Én futnék egy kört a munin körül.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönöm a válaszod,de emlékeim szerint a munin elött is ilyen volt!

Kikapcsolom egy az egybe a munint és kiderül,
Nem egy erőgép, de nem is egy asztali gép, de kipróbálom, hátha ez lenne a baja.
Esetleg másnak valami hasonló tapasztalat?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Én megnézném, hogy valami locate/updatedb-féleség nincs-e aktivizálva. Újabban lehet úgy ütemezni a kis drágát, hogy csak akkor fusson, ha alacsony a gép terhelése viszont ha az atime nincs letiltva, akkor rövid ideig képes ilyen csúfságok elkövetésére is.
Persze csak mint ötlet, nem állíthatom, hogy ez a megoldás.
Mindenesetre a crontabok környékén körülnéznék alaposabban, illetve ha van process accounting a gépen, akkor abban megnézném, hogy az adott időszakokban mi minden volt aktív.
Ha tényleg a kjournal+atime okozza a magas loadot, akkor előtte valaminek végig kellett szaladnia a két diszkeden és belenézni a fájlokba.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Alig van crontab beállítva, szóval ez sajnos nem probléma, bárcsak ilyen egyszerű lenne :(

Az utánanéztem az updatedb bejegyzéseket, nem találtam semmit, minden default,és nincs semmi bekapcsolva aminek nem kellene, annyi hogy nem egy időbe fut,hanem így randomba, valamikor éjfélkor valami délelött délután.

"Ha tényleg a kjournal+atime okozza a magas loadot, akkor előtte valaminek végig kellett szaladnia a két diszkeden és belenézni a fájlokba."

Ezt nem teljesen értem, mit értesz az alatt,hogy végig szalad?
Még a kjournak nem nagyon néztem utána, de az az ext3 naplózó fájlrendszer kernel része,de hogy mit naplóz,meg ilyeneket azt nem tudom.
Erről tudsz valami konkrétabbat mondani?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Végigszalad=
Pl. azt, amit az updatedb művel: végigolvassa az összes(? ez nem igaz, de a példa szempontjából nincs jelentősége) fájlokat és indexet készít róluk. Viszont... ha nincs noatime a mount opciók között, akkor minden fájlhozzáférés (úgy emlékszem, minden open, de ez nem 100%) generál egy írást is, amivel a rendszer rögzíti az utolsó hozzáférés időpontját.
A kjournald meg az ext3 journal írását/szinkronizálását/etc végzi - ha mégsem, akkor valaki úgyis kijavít. ;)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Gondolom nem friss telepítésről beszélünk. Mióta csinálja? Volt valami frissítés, vagy nagyobb változtatás?
Distro, kernel, stb?
Azért a 12:00 előtti load idején az apache is kúszik felfelé és a tűzfal is teker.
Mi fut rajta?
Load idején egy tcpdump lehet, hogy elárulna pár dolgot.

0 szavazat

A hozzászóláshoz be kell jelentkezni

2 hónapos telepítésről van szó,és kb 1 hónapja csinálja.
Debian, 2.6.32-5-amd64

apache2,mysql,postgresql,postfix,courier és társai,ftp,openvpn de amikor a loadaverage high,akkor kilőttem minden ilyen service-t.

A legfurcsább az volt,amikor a történet egyikén újrainditottam a gépet,és rá amikor bekapcsolt rá 2 másodpercre ugyanaz a LA volt(~7.5).
A TCPDumport kifogom próbálni, köszönöm a tippet.

Semmi változás nem volt,debian 6, konkrétan semmi egyik nap jó volt,másiknap nem.

A szolgáltatónak írtam,és azt mondták,hogy nem lehet kompatibilitási probléma, más nem jelezte. (Bérelt gép,blade)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Es van valami olyan webes szolgaltatas, ami nem a szokvanyos honlap kategoria?
--
zsebHUP-ot használok!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hát, ami olyannyira nagy io művelet végez olyan nincs.
Ezt hogy tudnám kideríteni? milyen toolal a legegyszerűbb hogy mi veszi el ilyenkor az erőforrást?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az atop ment historikus adatkat. A /etc/default/atop vagy /etc/init.d/atop scriptekben lehet állítani a mintavételezést, az állítsd be jó fürgére (30 sec mondjuk kezdésnek, de ilyenkor tolja ám a logot, hely legyen neki), és hátha.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezt holnap kifogom próbálni, amint akad rá időm, ez jónak tűnik.

0 szavazat

A hozzászóláshoz be kell jelentkezni

az atop győzött, mysqld volt a bűnös mindenesetben.
atop -a logfájl és ott t-vel lapozgatva pirossal megjelent a raid merevlemezek és alatta csökkenő sorrendbe mysqld és kjournald

Nagyon köszönöm szépen!

illetve még egy kérdés,ti mit szoktatok arra használni,hogy a mysql ne őlje le a gépet?

Én régen csináltam egy perl scriptet ami mindig lekérdezte hogy melyik fut x percnél tovább,és megkérte szépen,hogy állítsa le, ennél van humánusabb módszer?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Limitálni a lekérdezések által használható erőforrásokat - sajna csak az Oracle RDBMS-t ismertem ilyen téren, MySQL esetében csak találgatok, hogy talán a mysqld.conf környékén lehet keresgélni.
De attól tartok, hogy ha nincs összefüggés az adatbázisban folyó műveletek és a kliensek forgalma közt, akkor valami karbantartó dolog futhat a háttérben, amit nem célszerű agyonvágni.

Ez nem humánusabb egyébként, csak "kulturáltabb" ;)

0 szavazat

A hozzászóláshoz be kell jelentkezni

SlowQuery logban érdemes lehet nézelődni. Első körben a lekérdezéseket kéne optimalizálni, ahol nem muszáj, ott ne fusson select *, indexet meglesni, tenni, ha nincs és szükséges, stb.
AZtán persze vannak mysql konfigban elvégezhető tuningok is, Google rengeteg találatot adhat rá (amikkel azért óvatosan érdemes bánni).

0 szavazat

A hozzászóláshoz be kell jelentkezni

Bind nem fut?

Esetleg valaki rátenyerelt az F5-re és a MySQL tekeri a hdd-t, esetleg az apache teszi ugyanezt...

Vagy... ISPConfig ? abban van egy script ami végig tekeri az összes logot és át teszi adatbázisba.

Szerk:
"Újrainditás követően is felmegy az LA,amikor ez az 5-10-15-20 perce van."
Erre még az jutott eszembe: töröld az apache és a mysql bin logjait. Nekem volt már, hogy ezek okoztak nagy gubancot.

--
openSUSE 12.2 x86_64

0 szavazat

A hozzászóláshoz be kell jelentkezni

linux debian - magas load average - indok?

Hozzászólások