VMware ESXi host különös hiba

Fórumok

Sziasztok!

Van egy vCenter Server 6 Essentials, és vSphere 6 Essentials PLUS-ból álló rendszerünk. Kb 3 éve elégedetten használtuk két HP szerveren a 6.0-s verziót, és egy IBM szerveren a 6.5-ös verziót. Aztán egy nap úgy döntöttem, hogy ideje frissíteni a 6.0-t, a már régóta kint lévő 6.7 u3-ra. Kényelmi okokból az upgrade mellett döntöttem, mert így megúsztam a host testre szabását (hálózatok, storage, stb). Látszólag minden rendben lezajlott, mind a két HP szervert frissítettem, majd a vcentert új telepítésként deployoltam. Néhány óra sem telt el, amikor fura dolgokat kezdett produkálni a rendszer, ha kértem a vcentertől egy sima shutdownt, órákig nem történt semmi, de ugyanez vonatkozott egy live migrálásra is. A host saját webes felületén sem nagyon akarta végrehajtani a dolgokat, majd egyszer csak a vcenter jelezte, hogy a host nem válaszol. A futó gépek szerencsére rendben voltak, csak nem lehetett őket menedzselni se vcenteren, se a hoston keresztül.

Tegnap újra húztam az egyik HP szervert, a már bizonyított 6.5-ös verzióval, szűz telepítést választottam, majd mindent beállítottam rajta. Végeztem cpu terhelő teszteket, kihajtottam a hostot 99%-ra, meg se kottyant neki. Aztán szépen ráterheltem a virtuális szervereket. Erre ma reggel szóltak a kollégák, hogy egy shutdown parancsot 1 órája nem képes megoldani. A hostra csak másodjára engedett belépni, de ott sem tudok sehová navigálni, mert nem reagál semmire.

Mi a fene baja lehet? Tegyem vissza a 6.0-s verziót? Vagy a régebbi vcentert? Bár erre nem magyarázat, hogy a host felületén sem lehet egy idő után menedzselni.

Előre is köszönöm, ha tudtok segíteni!

Hozzászólások

Ha jól értem, a probléma a két HP gépen jelentkezik csak. Az lehet tudni, hogy pontosan milyen HP gépek? (Támogatott rajtuk 6.0-nál újabb ESXi?)

Első körben a dmesg kimenetében keresnék csúnyaságokat. A 6.7u3 upgrade egyébként milyen módon történt? A HPE által kiadott ISO-ból? Image profile frissítés ESXi-6.7.0-20191204001-standard verzióra megvolt?

HP DL360 Gen9 szerverek, tudtommal támogatottam, ezt az iso-t tettem fel rájuk:

VMware-ESXi-6.5.0-Update3-14990892-HPE-Gen9plus-650.U3.10.5.0.67-Dec2019.iso
 

A stabil 6.0-ra ezt tettem fel upgrade módban: VMware-ESXi-6.7.0-Update3-15160138-HPE-Gen9plus-670.U3.10.5.0.48-Dec2019.iso

Az iso-kat a vmware oldaláról töltöttem le, a "OEM Customized Installer CDs" aloldalról.

A sima 6.7u3 telepitese utan en is tapasztaltam ilyesmit Dell vason, viszont azota kijott meg 2 tovabbi update, es a 2019 decemberi telepitese utan megszunt a problema.

vCenter milyen verzió? Ugye a HP gépeken minden firmware friss?

"After successfully ignoring Google, FAQ's, the board search and leaving a undecipherable post in the wrong sub-forum don't expect an intelligent reply."

kurva szar elmélet. A HP ki is ad egy PDF-et minden release-re hogy milyen driverek vannak a custom ISO-ban és ahhoz milyen FW verzió passzol.

Szép kis PSOD-k meg egyéb finom hibák vannak különben (pl. Broadcom kártya nem forgalmaz többé, Intel 10G kártya elfelejt VLAN-ul meg ilyenek :D )

"After successfully ignoring Google, FAQ's, the board search and leaving a undecipherable post in the wrong sub-forum don't expect an intelligent reply."

Az öngyilkos ssd-ket már ne is említsük. Siralmas, hogy mire képes ma a QA.

https://support.hpe.com/hpsc/doc/public/display?docId=emr_na-a00092491e…

 

Hálókártyával is szívtunk épp január elején. Nem néztem utána végül hogy tényleg inkompatibilis e vagy sem a kártya és a szerver, egy kolléga foglalkozott vele.

Dell Broadcom szerintük (Dell support) nem ok, friss firmware-el sem, most küldtek Intelt helyette. Pedig látszik a host-okon szépen, lehet konfigurálni csak épp nem megy.