interrupt para

Fórumok

Sziasztok!

Adott egy vadi új IBM Blade Center, HS21 pengékkel.
Olyan gondom van a rendszerrel h. a hálózati kártya és majdnem minden hardware ami benne van, rengeteg interruptot generál, ami oda vezet h. iszonyú sok lesz a CPU-n az iowait%.
Találkozott már valaki hasonló problémával?

Vhogy. így néz ki egy mpstat:

Linux 2.6.18-92.1.22.el5 (network1) 02/24/2009

10:07:44 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:07:44 PM all 0.16 0.01 0.34 2.90 0.05 0.08 0.00 96.46 2933.54
10:07:44 PM 0 0.24 0.04 0.67 5.48 0.01 0.01 0.00 93.56 1015.34
10:07:44 PM 1 0.03 0.00 0.21 2.33 0.01 0.00 0.00 97.42 3.18
10:07:44 PM 2 0.49 0.01 0.19 0.13 0.00 0.00 0.00 99.18 0.00
10:07:44 PM 3 0.05 0.00 0.23 9.16 0.01 0.10 0.00 90.45 67.36
10:07:44 PM 4 0.12 0.00 0.21 0.32 0.02 0.02 0.00 99.30 90.19
10:07:44 PM 5 0.10 0.00 0.17 0.39 0.00 0.00 0.00 99.33 0.00
10:07:44 PM 6 0.04 0.00 0.03 0.28 0.00 0.00 0.00 99.64 0.38
10:07:44 PM 7 0.20 0.00 1.01 5.12 0.35 0.47 0.00 92.85 1757.08

Valakinek van esetleg valami ötlete h. mi okozhatja, ill. hogyan lehetne megoldani?

Köszi,

Zoli

Hozzászólások

Helló! Az iowait-tel kapcsolatban kering néhány félreértés. Az iowait olyan idle állapota a CPU-nak, amikor azért nincs processz rajta, mert ami futhatna, azok io műveletek befejezésére várnak (pl: egy darab diszk-intenzív processz fut => 100% környéki iowait). Amúgy a 3000 interrupt/s nem sok, annál is inkább, hogy ezeknek a perces átlaga többet mondana, mint a fenti, fene se tudja milyen időintervallumra vett átlag.

Amúgy a megszakításokat számolja a kernel, eléred a /proc/interrupts alatt ezek értékét. De érdemes inkább perces vagy ötperces átlagot nézni, hogy tudjál róla valamit mondani. Hosszútávú monitorozásra használj pl. munint.

+1
Az io wait nem elpazarolt cpu idő (mert a cpu tudna mást csinálni, ha lenne más).
Túl sok információértéke nincs, ezért pl. Solaris 10-től kezdve nem is mérik. (Illetve minden parancs, ami korábban kijelezte, 0-t ír rá).

A fenti interruptok nekem nem tűnnek soknak - ráadásul az idle -idő 90% feletti, vagyis a vas egyfolytában unatkozik.
Valószínűleg valami olyan cucc fut rajta, ami sokat beszélget hálózaton, és a diszkhez is hozzányúl néha.

Természetesen, ha az alkalmazással vannak problémák (pl. túl nagy válaszidők), akkor tovább kell vizsgálódni, de csak a fenti számok alapján ítélve, nincs semmi gond.

szerk: Most megnéztem egy viszonylag terhelt webszerveren, és ott folyamatosan 1000-10000 között van a cpu-nkénti interupt szám. (másodpercenként), időnként 20000 körüli értékekkel.