Enterprise IT infrastruktúra felügyelet

Sziasztok!

Szükségem lenne pár tapasztalatra enterprise monitoring rendszerekről. Performancia, kezelhetőség stb. bármi jól jöhet.

Microsoft termékek kilőve.

Amire szükség lenne: autodiscover,cacti mactrack plugin -hoz hasonló modul ismerje a komolyabb brand -eket, esetleg tudja figyelni az aktív hálózati eszközökön kívül még a szervereket is.

Nagios XI -ben is gondolkodom ezzel kapcsolatos tapasztalatok esetleg?

Előre is köszönöm!

Hozzászólások

Mielőtt beindul a tolongás, hadd engedjek meg magamnak egy kis offtopikot:
"Microsoft termékek kilőve." - Miért?

Üdv,
Marci

Ez azért kicsit kisarkított sztori, de legalább érthető. :D Szóval nekem az se gond ha a topic -nál maradunk és továbbra is várom az építőjellegű hozzászólásokat :D

EliteBook 8540p
Fedora 21
Startup finished in 2.637s (kernel) + 875ms (initrd) + 1.777s (userspace) = 5.290s

Jaja ez is szempont, illetve nálam magasabb szinteken ez a döntés, illetve mivel linux admin féle vagyok így nem nagyon értek az ms cuccokhoz... De legfőképpen mert ezt kértem a topic -ban, nem azt, hogy vitassuk meg, hogy miért nem MS termékekre vagyok kíváncsi :)

köszi...

EliteBook 8540p
Fedora 21
Startup finished in 2.637s (kernel) + 875ms (initrd) + 1.777s (userspace) = 5.290s

"cacti mactrack plugin -hoz hasonló modul"
Hogy ne is menjünk messzebb: miért, mi a baj a cactival?

Semmi gond a Cacti -val, van olyan telephely ahol használjuk. Viszont jó lenne egy olyan rendszer amit könnyen konfigurálhatunk magas rendelkezésre állásra, és mindenféle csili dashboard játszik amivel a kevésbé hozzáértőket is sikerül elkápráztatni stb...

pl Nagios XI ár/érték -be ezt hozza.

Illetve ha valami kevésbé hozzáértő konfigurálja akkor ne kelljen konfig fájlokba bindzsiznie, hanem valami logikusan felépített "egyszerű" webui -n keresztül összetudja kattintgatni.

EliteBook 8540p
Fedora 21
Startup finished in 2.637s (kernel) + 875ms (initrd) + 1.777s (userspace) = 5.290s

ZenOSS

Community eleg jo, bar hianyzik belole a RCA modul, illetve a vmware es felho management.

Pro:
- agentless
- autodiscover through ssh, snmp
- CMDB with dependencies (megkonnyiti az RCA-t, meg a community editionben is)
- python api
- it could be modified
- shiny GUI
- good connectors to external alerting, etc systems
- hundreds of plugins

Cons:
- agentless (mar akinek ez cons)
- python api (mar akinek ez cons)
- modification requires deep knowledge of python and api
- too few connectors to external systems
- restricted module usage (csomo csak az enterprise-ban erheto el)

En nagyon szeretem a nagios-t mert olyan mint egy Lego, epitokovekbol azt csinalok amit akarok. De ez egy nagyvallalati rendszernel verszopas es rengeteg ido. Ugyanakkor a custom scriptekkel minden, de minden megoldhato. Iszonyat jol ki van talalva a bele. Kar hogy mindent neked kell belefejleszteni. :D

Mivel en az agentless technologia hive vagyok a ZenOSS-t preferalom a Zabbix-szal szemben, de elismerem a Zabbix erdemeit.

Az ssh-n bemegy és körülnéz az néha rosszabb/vállalhatatlanabb, mint az agent felpakolása. Egyébként meg jópofa "agentless"-nek nevezni valamit, ami beállított, működő snmpd-t igényel, amit kizárólag az "agentless" monitoring miatt pakolnak fel a gépekre.
Való igaz, nem nagios vagy épp zabbix agent, hanem általános snmpd, amitől kérdezni lehet. Miközben az előbbiek kényelmesen tudnak eseményt jelenteni a szervernek - az snmp trap-ek küldése/fogadása viszont... na az (is) sajtreszelő kategória :-P

Azért mire az 1.2.3.4.3.2.4.5.67.8.5.3.2.3.43.136.23.21.3.satöbbiből kideríted, hogy micsoda, és mért annyi, és a csavarhúzó MIB-jét befaragod a zesenempémonitoring alá... A homogenitás ilyen szinten nem érdekes/másképp jön elő normális helyen: OS-eket saját agent-tel, csavarhúzót meg snmp-n, mert ott az van :-P

Negatív példának k.va jó... (A Zabbix is képes SNMP-alapon dolgozni). Grafikonokat már lehet benne értelmesen, akár ad-hoc összerakni, zoom-olni, vagy sem? Több eseményből tud-e riasztást generálni (Olyasmire gondolok, hogy "ha a=42, és b vagy c "fail", és ha ez az állapot az utolsó két check idején fennállt, akkor riasztani kell")?

Igen, az ilyen dolgok eleinte a "nem kell az" kategóriába kerülnek, aztán amikor szükség lenne rá, akkor jön a rúdaszpirin, hogy de mégis hogy csinálja meg az ember...

A grafikonok ad-hoc ossuerakasa es zoomolasa mindig is mukodott.
A correlacios riasztas is mukodott mindig. Amikor eloszor talalkoztam vele olyan 2006 magassagaban ez mind volt mar a community editionben is. Az enterpriserol meg ne is beszeljunk. Te ismered egyaltalan a "elrettento peldat"? Mert nekem nem ugy tunik. En se szaroztam le a Zabbixot. Igaz nincs is miert, mert tenyleg jo. De ne ferditsunk mar, hogy minden mas szar. Tertek mar at Zabbixrol Nagiosra egyes helyeken.

AMit én láttam, az csak elrettentő példának volt jó. A webes felületet https-re rakni külön móka volt, a linuxoknál konzekvensen 5% fenntartott területtel számolt valami miatt, néha berohadtak a riasztások...

Lehet, hogy a vas volt alulméretezve, de... A Zabbix messze kézreállóbb volt, és egy általános "health" képernyőt Zabbixban jóval egyszerűbb volt összerakni, mint ebben a csodában.

Én csak azt tudom, hogy mit NE:
HP OVO (vagy akárhogy is hívják az hivatalosan)

Ez nagyon eterspájz, meg mindent tud - papíron.

A gyakorlatban pedig egy ingyenes nagios is keterbe veri minden téren - ha szakértő rakta össze.

Disclaimer: I am not speaking on behalf of my employer, this is my personal opinion

--
zrubi.hu

Ha Nagios-ban gondolkodsz nézd meg az Icinga-t .

https://www.youtube.com/watch?v=EZ4X2Cpl68k&nohtml5=False

Itt 1 összehasonlító Videó 45 percben. Nagios fork.

"Taking advantage of the tremendous number of supported hard- and software, Icinga leaves all legacy limitations behind. It delivers an easily scalable solution, with clustering, load balancing, automated replication, and even business process monitoring out-of-the-box. Based on a new configuration format with advanced language features - like conditional processing and complex type support - monitoring agile environments works like a breeze. Existing modules for Puppet, Chef and Ansible ramp up the rollout time and ensure a continuous and up to date monitoring environment."