Debian 11 upgrade után DMAR DRHD handling fault status reg 2

Fórumok

Sziasztok,

 

van egy gép, amin frissítettem a Debian 10-et 11-re - nem hiszem, hogy közvetlen a frissítés eredménye, valszeg új installnál is előjött volna

ez.

Természetesen körbenéztem, és találtam több hibajegyet is, pl ezt, amire a workaround a cmdline-ba (nagyjából mindenhol ezt írták, ahol megtaláltam a hibát):

intel_iommu=igfx_off

De sajnos nem segített. A fenti screenshot az új kernellel készült - minden boot után kb fél perccel elszáll a kernel (hálózat addig sincs...).

Van valakinek ötlete, mi lehet a gond, ill mit érdemes még kipróbálni?

A gép egy ProLiant DL380 G6.

Most így néz ki a cmdline:

BOOT_IMAGE=/vmlinuz-4.19.0-17-amd64 root=/dev/mapper/vgkvm3-lvroot ro quiet intel_iommu=igfx_off

de ez ugye a régi kernel.

 

Köszi minden infót.

Hozzászólások

Próbáltad más kernellel? Ha nem egy próbát megér, vagy csinálj sajátot.
Proxmox kernel-t tudod a proxmox repoból telepíteni. Vagy ott van még a Xanmod meg a Liquorix (bár utóbbiakba olyan szinten belenyúltak hogy szerverre nem biztos hogy ...)

Próbáltad más kernellel?

Igen, a 4.19-el :). Amúgy viccet félretéve, az 5-ös sorozatból nem, csak a Debian által szállított 5.10-el.

vagy csinálj sajátot.

Nincs az az Isten... :)

Proxmox kernel-t tudod a proxmox repoból telepíteni. Vagy ott van még a Xanmod meg a Liquorix (bár utóbbiakba olyan szinten belenyúltak hogy szerverre nem biztos hogy ...)

Köszi, nagyon nem trükköznék ezzel, a gép a város (Budapest) másik oldalán van, még soha nem jártam a szerverszobába - ezt csak infóként, sajnos minden restartnál kell valaki személyzet, akit ezzel szórakoztatok.

(Hosszú felsorolni az okokat, de ez most mindegy is...)

Szóval az iLO nem dísznek van ott, természetesen kértem, hogy állítsák be, deeee... (lásd feljebb)

(Hosszú felsorolni az okokat, de ez most mindegy is...)

A lényeg, hogy az iLO is valami ősrégi firmware, és ebben az állapotában használhatatlan. Mindegy, a részletekbe nem akarok belemenni :)

ezen még ILO2 van.
Több dologra is van lehetőséged:
1) ILO-ba elvileg SSH-val is be tudsz lépni, és nyilván reboot-t is tudsz nyomni neki
2) talán serial console-t is tud forward-olni (ehhez persze serial console-t is kell állitani a kernelnek)
3) winXP-vel biztosan tudod a Java console-ját használni.

Köszi,

 

az ILO-n keresztül a reboot működik, ennyi tulajdonképp elég. KVM konzol van, ha nagyon kellene máshoz.

2) talán serial console-t is tud forward-olni (ehhez persze serial console-t is kell állitani a kernelnek)

Ezzel szerintem sokra nem megyek. A gond az volt, hogy boot után nem sokkal kernel crash jött. Hiába lenne kernel support, ha kernel nincs... :)

De amúgy a kernel paraméter megoldotta az 5-ös kernellel a működést, azóta volt már pár upgrade és restart is.

Én ilyet is találtam, egy próbát megér:

kernel parameters set “intel_iommu=off”

DL380 G5-re meg fel sem lehet telepíteni...
(P400i a raid vezérlő)
A Debian11 telepítő, már a nyelv megkérdezése előtt egy rakás hibát dob, majd a "Hardver felderítése 0%"-nél kifagy a képernyő, ha itt várok, olyan 3-5 órát, akkor továbbmegy, de a rendszerlemezek választásánál, nem látszik sem HDD, sem pedig a Raid vezérlő által felkínált (virtuális) lemez, csak a telepítő USB pendrájv.

 

DL380 G8-on (Debian 11) XEN virtuális környezetben, a Debian 11 HVM guest kb 2 hét után kernel pánikkal csontra fagy.
(Ugyanez Deb10/Deb10, illetve Deb9/Deb9 kombinációban gond nélkül működött. (deb9-óta csak upgrade volt, nem újratelepítés))

 

(ugyanaz a fenti gép)
DL380 G8-on, a Debian 11 domain0-án kiadva a poweroff parancsot, a gép nem leáll, hanem a "Systemd: Reached target shutdown" kiírása után a képernyő kifagy, a ventilátorai 100%-ra felpörögnek, a gép áramfogyasztása pedig a normál üzem 2x-3x-ra megy fel (a szünetmentes kiírja), és így marad egészen addig, amíg a 230V-ból ki nem húzom, vagy a Powergomb hosszú nyomásával le nem állítom.

 

Szóval van még min kalapálni...

Ezzel azt szeretnéd mondani, hogy tulajdonképp szerencsésnek érezhetem magam? :)

DL380 G5-re meg fel sem lehet telepíteni...
(P400i a raid vezérlő)

Szerintem egy ilyen volt a kezeim között pár évig, anno még Debian 5/6 körüli verzióval. A P400-at simán felismerte.

Nem lehet, hogy kell a firmware-nonfree telepítő? (Ha próbáltad ezzel, bocsánat)

A cciss múltbéli jelenlétét megerősítem, viszont, az most komoly, hogy hpsa-ból előbb tűnik el/hagyják ki, a "régebbiek" támogatását, mint Linux kernelből az i386 architektúrát ??

Fel sem lehet varázsolni rá?

Azért ilyen "hamar" (használtan került hozzánk, 5 éve) nem szeretném még kidobni azt a vasat, egyszerűbb feladatokra még jó lenne, ráadásul a CPU-i, még mai napig megállnák a helyüket.

az most komoly, hogy hpsa-ból előbb tűnik el/hagyják ki, a "régebbiek" támogatását, mint Linux kernelből az i386 architektúrát

A hpsa driver kifejezetten az "újabb" kártyákhoz (ProLiant G6+) készült. Az volt a mondás, hogy a régi kártyákhoz használd a cciss drivert, ami pedig támogatott a hpsa alatt, ahhoz inkább használd azt - volt egy csomó olyan kártya, ami mindkét driver által támogatott volt. Hogy a cciss driver mikor lett az enyészeté, azt nem tudom, mert a legutolsó G5-ös ProLiant gépet is kb. 10 éve elvitettem elektronikai hulladéknak.

Most nézem, hogy állítólag utólag implementálták a régebbi kártyák támogatását is a hpsa driverbe. A forráskód alapján most már látszólag a P400 is szerepel a hpsa által támogatott kártyák listájában...

Jelenleg a Gen8-as ProLiant sorozathoz már nagyjából ingyen lehet hozzájutni. Komplett gépeket lehet beszerezni 30-40 ezer Ft környékén. Csak a villanyszámlán visszahozza az árát pár hónap alatt.

Oh, értem, köszi, ez új volt.

Ezek szerint a P410-es már újabb kártya?

# uname -a
Linux kvm3 4.19.0-17-amd64 #1 SMP Debian 4.19.194-3 (2021-07-18) x86_64 GNU/Linux

# lsmod | grep hpsa
hpsa                  106496  2
scsi_transport_sas     45056  1 hpsa
scsi_mod              249856  4 scsi_transport_sas,sd_mod,hpsa,sg

...
04:00.0 RAID bus controller: Hewlett-Packard Company Smart Array G6 controllers (rev 01)
	Subsystem: Hewlett-Packard Company Smart Array P410i

Egyelőre csak a Debian netinstall-lal próbáltam.

Rinyált firmware hiány miatt, de az csak a hálókártya drivere volt, megpróbálom majd egy "full" (DVD image) debian-al, illetve ezzel a non-free-féle verzióval, azon hátha rajta van.

Kerestem hozzá BIOS, illetve Raid vezérlő frissítést, de mindenhol csak a HP enterprise account szükségességébe botlottam, az meg nekünk nincs.

Megnéztem a firmware-11.2.0-amd64-netinst.iso -val, de nem ismerte föl a Raid vezérlőt,  ezután megpróbálkoztam a  firmware-7.11.0-amd64-netinst.iso -vel, az gond nélkül felment rá, de abban még cciss van.

Most még az lehet, hogy kicsit régi firmware van a vezérlőn (4.06) és azért nem ismeri fel a Debian 11-es ssa driver.

Elvileg van újabb firmware (7.24) rá: https://support.hpe.com/hpesc/public/swd/detail?swItemId=MTX_1a18b79301…  de ehhez meg Windows (Server 2012) kell..

Még ez is lenne, csak azt nem tudom, hogy egy USB-re telepített Windows 2012 képes-e ezt telepíteni, vagy mindenképp a szerverre kell installáljam a windowst?

Sajnos ezek a Debian szokásos nyűgjei, firmware hiányozhat, ha a nonfree nincs engedélyezve és nem tetted fel belőle a firmware-t, meg a régi csomag/kernelverziók nem feltétlen stabilabbak a közhiedelemmel ellentétben, gyakran újabb kerneleken vannak optimalizációk, driver bugok javítva, amit ezek a lassan frissített LTS-szerű disztrók nem épp a leghamarabb kapnak meg, vagy mert az új verziót sokára szállítják vagy ugyan a régi verziókba backportolásra kerül az adott javítás, de arra is esetleg várni kell. Az a baj, hogy ezt hiába írtam le eddig is, hogy a 10-100 éves támogatási idő nem minden, meg a rolling nem feltétlen instabilabb, sokan nem értik. Szerintem még a Red Hat is ebbe az irányba ment a CentOS Stream-mel, és nem az volt a cél, hogy megszivassák a konzervatív verziót használókat, meg fizetős RHEL-re tereljék őket.

“I didn’t start using Linux so I could have friends.” (Luke Smith, 2019) 🐧