Memória kezeléssel gondjaim vannak

 ( peterson | 2010. november 26., péntek - 7:33 )

Üdv Mindenkinek!

Egy szerveren nehézségekbe ütköztünk a memóriával, és nem tudom miért.
Bízom benne, hogy Nektek lesz ötletetek.

Körülmények:

  1. valós fizikai bérelt szerver, nem VPS
  2. 4GB RAM
  3. Intel(R) Core(TM)2 Quad CPU
  4. OS: Debian Lenny
  5. Kernel: 2.6.26-2-686
  6. Főbb alkalmazások: lighttpd, memcached
  7. kb fél éve vettem át, (kisebb fájásoktól eltekintve) működött rendesen

minap viszont mintha a memóriakezelés el...ódott volna:
dmesg-ben ilyen üzenetek:

[120365.387061] INFO: task postdrop:5649 blocked for more than 120 seconds.
[120365.389879] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[120365.389943] postdrop D a7df8c05 0 5649 5648
[120365.389946] f4c9a9c0 00000082 f7471520 a7df8c05 000054ab f4c9ab4c c3021fc0 00000001
[120365.389951] 00000000 01622f7c 00013a2f 00000000 00000000 00000000 000005fb 000000ff
[120365.389956] f78a2c00 f4969edc f78a2c50 006cca93 f895be28 f78a2c14 00000000 f4c9a9c0

Ez most éppen egy postdrop, de van ilyenből php-cgi, memcached, krond, és egyebek...

Megjelennek ilyen üzenetek is:

Nov 25 18:32:03 www kernel: [ 8847.694692] php-cgi[6158]: segfault at 0 ip b6ca288c sp bfcb80c0 error 4 in memcache.so[b6c99000+11000]

A php-cgi itt is csak egy példa.

Mindemellett úgy fest, hogy nem nagyon akar 2GB fölé menni a memóriafogyasztás (3,5 GB körül szokott lenni korábban), inkább elkezd swapolni. Ugyanakkor a rendszer látja a memóriát, sőt, néha egy-egy pillanatra ír is a 2GB feletti részbe, de azonnal felszabadítja.

A gépet, és a rendszert 'bizisten senki nem bántotta már vagy 2hete...

Nekem is úgy tűnik, hogy hibás a RAM, és azok az alkalmazások, akik "aknára lépnek" azok ráfaragnak.

Memória csere megtörtént, a helyzet változatlan. Memcached reinstall is volt, mint gyenge kísérlet, de az sem hozott változást.

Találtam gugliban egy fórumot, ahol kernel bug-nak írták a jelenséget, de nem a 2.6.26 -hoz.

Van egy olyan tipp is, hogy alaplapi a hiba. De a support buzerálásával lassan túlzás kategóriába érünk, mielőtt alaplapot cseréltetnék velük, igazolni kellene hogy tényleg az a hibás.

Természetesen minden más ötletre is nyitott vagyok.

Előre is köszönöm a segítségeket.