Tud valaki tanácsot adni net-snmp (5.7,5.8) kapcsolatban, hogyan lehetne rábírni, hogy ne egye 100% on a cpu-t ezáltal a lekérés kb 80% timeoutra fut.
Vannak linuxos koncentrátorok, ahol az ügyfelek pppoe-val vannak végződtetve + ospf routing. Ahol sok a session az snmpd 100% hajtja azt az 1 nyomorult szálat, és elhasal. Ahol kevesebben vannak ott elmegy 50-90% on és ugye szolgáltat infót is.
Próbáltam már mindenféle modult kikapcsolni de semmi se segített eddig, fórumokon szintén küzdenek páran hasonló gonddal. Eredmény semmi.
Jelenleg ennyi modul van kikapcsolva.
-I -smux -tcptable -udptable -var_route -mteTriggerTable -mteTrigger -mteTriggerConf -ifTable -ifXTable -interface -ipCidrRouteTable -inetCidrRouteTable -ipv6 -tcp -udp -tcpConnectionTable -udpEndpointTable -ipIfStatsTable -ipAddressTable -ipDefaultRouterTable
Viszont a CPU továbbra is 100%
Ahogy olvasgattam régen mintha tobb szálú lett volna a snmpd de ez megszünt.
A lényeg, ha sok interface van akkor az leöli ahogy látom.
Valaki jár/járt hasonló cipőben? Van esetleg 5lete mit lehetne tenni ?
Egyik hozzászólásban említve lett ez a patch: https://github.com/bvanassche/net-snmp/commit/76ad711
Az 5.9 es net-snmp-be már benne van. Forgattam egyet, egyelőre jónak tűnik a helyzet. Minden modul bekapcsolva se ugrik meg nagyon az snmpd cpu használata.
- 235 megtekintés
Hozzászólások
Hogy szólítod meg az snmpd-t, milyen klienssel?
Nem mindegy hogy az SW amit használsz snmpwalk-ot vagy snmpbulkwalk-ot ( Internally a GETBULK parancs ) használ belül.
Az snmpbulkwalk vagy snmpbulkget az több változót le tud kérdezni egy requestben..
- A hozzászóláshoz be kell jelentkezni
A kliens vagy a dude nevű cucc, vagy a centreon-engine. Viszont egy sima snmpget is timeoutra fut.
Fedora 42, Thinkpad x280
- A hozzászóláshoz be kell jelentkezni
Nagyságrendileg hány darab interfész az a nagyon sok?
- A hozzászóláshoz be kell jelentkezni
~1500 kornyeken van most. A routing tabla olyan 3500 kornyeken van. Ahol fele ennyi iface van, a routing tabla gondolom hasonlo ott is sok az snmpd cpu hasznalat de meg nem 100%, igy mukodik.
Fedora 42, Thinkpad x280
- A hozzászóláshoz be kell jelentkezni
Az nem kevés. Ezt láttad?
https://github.com/bvanassche/net-snmp/commit/76ad711
https://sourceforge.net/p/net-snmp/mailman/message/36791643/
illetve, immáron regex támogatással:
commit bf4964241391b197e1ce2afca225b684f94f7451
Author: Bart Van Assche <bvanassche@acm.org>
Date: Sun Apr 12 01:54:58 2020 +0000
IF-MIB: Fix regexec() argument types
Fixes: e6795b2d67b4 ("IF-MIB: Add regex support for include_ifmib_iface_prefix")
Vajon milyen erőforrás igénye lehet mondjuk 500 interfészenként külön snmpd példányt indítani? Akkor lenne esélye szétskálázódni több CPU magra...
- A hozzászóláshoz be kell jelentkezni
Ebbe bele se akartam menni, mert akkor hogy fog a sok daemon 1db 161 es udp porton hallgatozni ?
Fedora 42, Thinkpad x280
- A hozzászóláshoz be kell jelentkezni
Csak van annyi eszük , hogy SO_REUSEPORT SO_REUSEADDR-t használnak.
- A hozzászóláshoz be kell jelentkezni
Azért az Apache/Nginx vonalon mar sikerult ezen tullendulni :), de innen jut eszembe:
Indítani tobb peldany kulon portokon, mint kulon daemon/kontener/virtualis gep es felhuzni ele egy Nginx-et? https://docs.nginx.com/nginx/admin-guide/load-balancer/tcp-udp-load-bal…
- A hozzászóláshoz be kell jelentkezni
Nálunk is volt hasonló gond, egyik cpu core volt csak kihajtva, de az rendszeresen 100%-on.
Emékei szerint irqbalance megoldotta a problémát. Ha esetleg érdekesek lehetnek a részletek, akkor megnézem az archív leveleim ebben a témában.
szerk: egy strace esetleg nem árhat, hogy mitől teker ennyire a processz
- A hozzászóláshoz be kell jelentkezni
A gond az, hogy az 1db snmpd 1 db cpu -t hajt ki ezek az irqbalance nem fog segiteni. Egyebkent fut a szerveren es dolgozik is szepen.
Fedora 42, Thinkpad x280
- A hozzászóláshoz be kell jelentkezni