Debian 11 + NVIDIA driver 535 === Xorg crash

Fórumok

Az NVIDIA 535-ös driver-ét, ha megpróbálom felrakni, akkor kinyírja a Xorg-ot.
Xorg log: http://oscomp.hu/depot/Xorg-nvidia-535.log
Csak a lényeg:

[    35.065] (II) Initializing extension XINERAMA
[    35.099] (EE) 
[    35.099] (EE) Backtrace:
[    35.101] (EE) 0: /usr/lib/xorg/Xorg (OsLookupColor+0x135) [0x55ed4afe4915]
[    35.102] (EE) 1: /lib/x86_64-linux-gnu/libpthread.so.0 (funlockfile+0x50) [0x7efddf1ca140]
[    35.104] (EE) 2: /usr/lib/x86_64-linux-gnu/libnvidia-glcore.so.535.86.10 (_nv012glcore+0x93ac) [0x7efddb86750c]
[    35.104] (EE) 3: /usr/lib/x86_64-linux-gnu/libnvidia-glcore.so.535.86.10 (_nv012glcore+0x95c8) [0x7efddb867728]
[    35.104] (EE) 4: /usr/lib/x86_64-linux-gnu/libnvidia-glcore.so.535.86.10 (_nv012glcore+0x22717) [0x7efddb880877]
[    35.104] (EE) unw_get_proc_name failed: no unwind info found [-10]
[    35.104] (EE) 5: /usr/lib/xorg/modules/extensions/libglxserver_nvidia.so (?+0x0) [0x7efddd815508]
[    35.104] (EE) 
[    35.104] (EE) Segmentation fault at address 0x88
[    35.104] (EE) 
Fatal server error:
[    35.104] (EE) Caught signal 11 (Segmentation fault). Server aborting

Erre a "unw_get_proc_name failed: no unwind info found" cuccra hiába keresgettem, mert csupa irreleváns dolgot találtam csak.

A hiba már hónapok óta fent áll egyébként, de eddig vártam, hogy hátha kijavítják; csak jelentik a Debian userek... Nem tették. Jelentettem én, trackerben is, fórumon is, de eddig nem válaszoltak. Úgyhogy most az NVIDIA repo-ja tiltva van, ahogy eddig is az 535 kijövetele óta. Jobb híján.

Valaki találkozott már esetleg ezzel a hibával? Esetleg meg is oldotta?
Minden konstruktív javaslatot, ötletet előre is köszönök.

Hozzászólások

Szerkesztve: 2023. 08. 13., v – 21:13

Ez pontosan milyen NV GPU? Csak azért kérdem, mert egyes kártyákhoz lehet nem ez az NV driver kell, hanem egy régebbi vagy újabb driverág, illetve a kernel, mesa verziója is számíthat. Azért kérdezem.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Akkor jó, mert ahhoz a kártyához tényleg az 535.x-es driverág való. A bootladerben nem adtál hozzá véletlenül nomodeset kernelparamétert? A X.org configja hogy néz ki?

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Én nem adtam hozzá semmit:

linux	/boot/vmlinuz-5.10.0-24-amd64 root=UUID=4cfd0792-25c7-4f85-8113-f63d7df3224f ro amd_iommu=on random.trust_cpu=on 

De még ha benne is lenne, eddig működött. Az xorg.conf:

# nvidia-settings: X configuration file generated by nvidia-settings
# nvidia-settings:  version 525.85.12

# nvidia-xconfig: X configuration file generated by nvidia-xconfig
# nvidia-xconfig:  version 525.85.05

Section "ServerLayout"
    Identifier     "Layout0"
    Screen      0  "Screen0" 0 0
    InputDevice    "Keyboard0" "CoreKeyboard"
    InputDevice    "Mouse0" "CorePointer"
    Option         "Xinerama" "0"
EndSection

Section "Files"
EndSection

Section "InputDevice"

    # generated from default
    Identifier     "Mouse0"
    Driver         "mouse"
    Option         "Protocol" "auto"
    Option         "Device" "/dev/psaux"
    Option         "Emulate3Buttons" "no"
    Option         "ZAxisMapping" "4 5"
EndSection

Section "InputDevice"

    # generated from default
    Identifier     "Keyboard0"
    Driver         "kbd"
EndSection

Section "Monitor"
    Identifier     "Monitor0"
    VendorName     "Unknown"
    ModelName      "Asustek Computer Inc VG279"
    HorizSync       162.0 - 162.0
    VertRefresh     40.0 - 144.0
    Option         "DPMS"
EndSection

Section "Device"
    Identifier     "Device0"
    Driver         "nvidia"
    VendorName     "NVIDIA Corporation"
    BoardName      "NVIDIA GeForce GTX 960"
EndSection

Section "Screen"

# Removed Option "metamodes" "DP-0: nvidia-auto-select +0+0 {ForceCompositionPipeline=On, ForceFullCompositionPipeline=On}"
    Identifier     "Screen0"
    Device         "Device0"
    Monitor        "Monitor0"
    DefaultDepth    24
    Option         "AllowIndirectGLXProtocol" "0"
    Option         "nvidiaXineramaInfoOrder" "CRT-0"
    Option         "Accel" "1"
    Option         "RenderAccel" "1"
    Option         "Stereo" "0"
    Option         "metamodes" "1920x1080_144 +0+0 {ViewPortIn=1920x1080, ViewPortOut=1920x1080+0+0 ForceCompositionPipeline=On, ForceFullCompositionPipeline=On}"
    Option         "SLI" "Off"
    Option         "MultiGPU" "Off"
    Option         "BaseMosaic" "off"
    SubSection     "Display"
        Depth       24
    EndSubSection
EndSection

Évek óta ugyanaz és működik.

Ez is rendben lévőnek látszik. Akkor más ötletem nincs, csak az, hogy próbálj kernelt frissíteni. Ha nem is a legfrissebbre, de egy 5.10-esnél azért újabb LTS-re, 5.15 vagy 6.1-esre.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Szerkesztve: 2023. 08. 13., v – 21:33

Szia!

Nem repo-ból szoktam frissíteni, hanem innen:
https://www.nvidia.com/download/index.aspx

Kiválasztod melyik széria, utána leszed egy ~400 MB fájlt, elindítod és lefordítja a drivereket ( next, next, next, finish )
Persze kell hozzá pár dolog:

$> apt-get install build-essential linux-headers

A fenti megoldásnál minden olyan csomagot ami nvidia-val kapcsolatos le kell szedni, mert azokkal összeakad Pl.: "xserver-xorg-video-nvidia".

Valamint az opensource drivereket is letiltani:

/etc/modprobe.d/nvidia.conf

blacklist nvidiafb
blacklist nouveau

Ezután:

$> update-initramfs -c -d -u

Régebben így csináltam, de most változtatni kényszerültem. Nem az opensource drivereket használom, hanem az NVIDIA binárisait és DKMS-sel fordulnak, amikor felrakja az újat. Eddig működött. Amúgy a repo-ból nekem egy raklap egyéb (fejlesztői cuccok, stb.) is fent van; szükségem van arra a repo-ra.

ilyen nem volt, olyan volt, hogy kernel frissites utan nem fordult le a dkms-el, mig ki nem javitottak, az elozo kernelt hasznaltam.

neked aztan fura humorod van...

Szerkesztve: 2023. 08. 22., k – 20:41
https://download.nvidia.com/XFree86/Linux-x86_64/535.98/
https://download.nvidia.com/XFree86/Linux-x86_64/535.98/README/commonproblems.html

@KicsiBocs, @debtamas88: Az NVIDIA közben már visszaírt, kaptak egy-egy nvidia-bug-report.sh kimenetet a működő 530-as és a döglött 535-ös driverrel; azt írták, szólnak, ha fejlemény van, de még nem szóltak.