[Firmware Bug]: the BIOS has corrupted hw-PMU resources (MSR 38d is 330)

Fórumok

Sziasztok!

HP DL360 G6 (6 magos Xeon van benne, ami G6/G7-hez is jó, a proci BIOS-ból is támogatot, stb) szerverre szépen felment a CentOS 7, kernel upgrade, raktam rá drbd-t, libvirt-et és lxc-t, majd reboot után ez van, emergency mode-ba kapcsol, nem indulnak el a szolgáltatások, a régi kernellel sem:

[Firmware Bug]: the BIOS has corrupted hw-PMU resources (MSR 38d is 330)

Kipróbáltam mindent amit olvastam:

- HP leírása alapján: Setup-ban CTRL+A, majd a frissen megjelent menüben a "Processor Power and Utilization Monitoring." disabled-re állítottam. Infó:

http://h20565.www2.hp.com/portal/site/hpsc/template.PAGE/public/kb/docD…

- SETUP-ban: Power Management Options / HP Power Regulator-nál OS Controll mode-ra állítottam

- boot paraméterekben is megadtam nmi_daemon=0 vagy ilyesmit, ez most nincs előttem sajnos, majd update-elem ezt a részt

- ioatdma -ban van állítólag a hiba, beleírtam az /etc/modprobe.d/blacklist.conf -ba: blacklist ioatdma , de tudom, hogy újra kellene még fordítani hozzá dolgokat, amit próbálnék kikerülni, ha van más megoldás.

Ezt a 4 dolgot találtam rá, mint solution, egyik sem működik.
Mi a javaslat?

Legfrissebb firmware van fent, legfrissebb ILO2.

Hozzászólások

Van valami egyszerű és gyors módszer, hogy összehasonlítsam a CentOS 7 telepítő kernelének paramétereit a jelenleg futó kernel paramétereivel, hogy mi a különbség a beállításokban és esetleg azok visszaállításával újra tovább menjen a szerver az emergency mode-ból?

Vagy mi lehet a módja, hogy kiderítsem, hogy mi okozza?

...
dmar: ATSR flags: 0x0
This system BIOS has enabled interrupt remapping on chipset that contains an erratum making that feature unstable. The maintain system stability interrupt remapping is being disabled. Please contact your BIOS vendor for an update
Switched APIC routing to physical flat.
..TIMER: vector=0x30 apic1=0 pin1=2 apic2=-1 pin2=-1
smpboot: CPU0: Intel(R) Xeon(R) CPU X5650 " 2.67 Ghz (fam: 06, model: 2c, stepping: 02)
Performance Events: PEBS fmt1+, 16-deep LBR, Westmere events, Broken BIOS detected, complain to your hardware ven
[Firmware Bug]: the BIOS has corrupted hw-PMU resources (MSR 38d is 330)
Intel PMU driver.
perf_event_intel: CPUID marked event: 'bus cycles' unavailable
... version: 3
... bit width: 48
... generic registers: 4
... value mask: 0000ffffffffffff
... max period: 0000000007ffffff
... fixed-purpose events: 3
... event mask: 000000070000000f
NMI watchdog: enabled on all CPUs, permanently consumes one hw-PMU counter.
smpboot: Booting Node 0, Processors #1 #2 #3 #4 #5 #6 #7 #8 #9 #10 11
Brought up 12 CPUs
...

Kikapcsolt Intel VT-d (IOMMU) esetén eltűnik a "This system BIOS has enabled interrupt remapping..." hibaüzenet, de nem változik semmi.

Sakk-matt,
KaTT :)