RTX3090 idle power anomália

Fórumok

Adott a fenti kártya. Ha van rádugva monitor, idle módban a teljesítmény felvétele 20W, hőfoka 40C, venti 0%.

Ha nincs rádugva monitor, a teljesítmény idle módban random 30 és 40W között, hőfok 45 és 55C között, venti 0%.

Mivel monitor nélkül használom a gépet, valahogyan el kellene érni ezt az 20W-os idle módot.

 

Valakinek ötlet? Tapasztalat? Bármi?

 

Szerk:

A ChatGPT szerint vegyek dummy HDMI plugot. Most tényleg? 2026 van, nem 1996.

 

Solution 1:

Lásd z0l posztját, működik. Csak részben működik. Ha használom a kártyát nem midig áll vissza az alacsony fogyasztás, viszont fizikai monitorral mindig visszaáll. Fizikai monitorral sem áll vissza mindig, biztosan csak a 'Solution 2' működik.

 

Solution 2:

Az 'nvidia-sleep.sh suspend' majd az 'nvidia-sleep.sh resume' parancsok után midig lemegy alacsony fogyasztású módba, akár van rajta monitor, akár nincs.

 

Solution 3:

Posztban írtam, hogy Arch-al is ugyanaz a helyzet mint Debian-nal. Felraktam az Arch-ra az Omarchi-t és minden megjavult. Mindegy, hogy tele van VGA memória vagy nincs, mindegy, hogy van rajta monitor vagy sem, ha nincs dolga a GPU-nak, akkor minden esetben 18-20W a fogyasztás.

Valószínűleg valami hiányosan konfigolt power manager okozza a túlfogyasztást, amit az Omarchy szkriptjei megoldanak.

Hozzászólások

A Quadro M6000 is ezt csinálja, 31W monitor nélkül és 14W monitorral. Ezen ráadásul csak display meg DVI port van :)

Úgy látom, hogy el lehet menteni a monitor EDID-jét és kernel parameter-ből betölteni:


Kernel-level fake EDID (no X needed) This makes the DRM/KMS layer think your HDMI connector is “connected” and has a valid EDID, so nvidia-drm creates a fb console (fb0) even when nothing is plugged in. Steps: - With HDMI temporarily plugged in, find the connector name and save its EDID:  - Find connector: ls /sys/class/drm | grep HDMI    Example you’ll see something like: card0-HDMI-A-1  - Save EDID from your real monitor (best for compatibility):    sudo mkdir -p /lib/firmware/edid    sudo cat /sys/class/drm/card0-HDMI-A-1/edid > /lib/firmware/edid/headless.bin - Enable modesetting for NVIDIA (if not already):  - Check: grep -q 'modeset=1' /etc/modprobe.d/nvidia-kms.conf || echo 'options nvidia-drm modeset=1' | sudo tee /etc/modprobe.d/nvidia-kms.conf - Add kernel params to force that connector “on” with your EDID and a mode:  - Edit /etc/default/grub and append to GRUB_CMDLINE_LINUX:    nvidia-drm.modeset=1 drm.edid_firmware=HDMI-A-1:edid/headless.bin video=HDMI-A-1:1920x1080@60e    Notes:    - Replace HDMI-A-1 with your actual connector name.    - 1920x1080@60e forces a 1080p60 mode. You can pick another mode that exists in your EDID. My config: # cat /etc/default/grub | grep nvidia GRUB_CMDLINE_LINUX_DEFAULT="nvidia-drm.modeset=1 nvidia-drm.fbdev=1 drm.edid_firmware=HDMI-A-1:edid/headless.bin video=HDMI-A-1:1920x1080@60e" - Make sure firmware is available early and update boot config:  sudo update-initramfs -u -k all  sudo update-grub - Reboot with HDMI unplugged. - Verify:  - dmesg | grep -E 'EDID|HDMI-A-1|nvidia.*drmfb'

Köszi! Ez sem sokkal elegánsabb mint dummy HDMI plug. Nem igaz, hogy nincs egy 'Hadless mode = On'. Mert senki nem használja mostanság ezeket a kártyákat bányászatra és AI futtatásra.

Futok vele egy kört, de ha nincs más megoldás akkor inkább veszek egy dummy HDMI-t. Azzal nem kell szopni, ha változik a szoftver.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

Mivel nézed a fogyasztást?

u.a kártya, és nem teljesen idle állapotban, 15W nvidia-smi szerint.

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.95.05              Driver Version: 580.95.05      CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3090        Off |   00000000:03:00.0  On |                  N/A |
|  0%   33C    P8             15W /  350W |     773MiB /  24576MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A            3736      G   /usr/lib/xorg/Xorg                      302MiB |
|    0   N/A  N/A            3982      G   /usr/bin/gnome-shell                     49MiB |
|    0   N/A  N/A            6682      G   ...b/thunderbird/thunderbird-bin         99MiB |
|    0   N/A  N/A            9584      G   .../7672/usr/lib/firefox/firefox        167MiB |
+-----------------------------------------------------------------------------------------+

 

Majd megnézem monitor nélkül is, de ahhoz kell laptop.

nvidia-smi vagy nvtop, most éppen van rajta monitor:

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 590.48.01              Driver Version: 590.48.01      CUDA Version: 13.1     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3090        On  |   00000000:15:00.0  On |                  N/A |
|  0%   33C    P8             19W /  350W |      11MiB /  24576MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

Nálad még érthető a 15W, hiszen fut néhány process, de nálam 19W megy el a semmire.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

Szerintem csak azért, mert elfogadják az emberek, hogy ennyit fogyaszt és kész. Engem sem érdekelt volna, ha nem látom másoknál a 20W körüli értéket. Sok distro-ban egyszerűen nem korrekt a power management.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

nekem nincs rajta monitor, idle:

|   0  NVIDIA GeForce RTX 3090        On  |   00000000:01:00.0 Off |                  N/A |
|  0%   40C    P8             16W /  350W |   11156MiB /  24576MiB |      0%      Default |

viszont arra emlexem, hogy az elejen az nvidia-smi nagyon lassan (2-3 masodpercig) futott le, es mindig felporgette a kartyat is. utanaolvasva kiderult, hogy ha nincs rajta monitor, akkor nincs is inicializalva a kartya, es az nvidia-smi futtatasakor mindig csinal egy initet, az melegiti be kicsit, es nyilvan mire az lefut mar megno a hofok/fogyasztasa is. valami varazs opcioval kell perzisztensre allitani ha jol emlexem, es akkor nincs minden nvidia-smi futtatasnal init-uninit.

talan ez volt az:  nvidia-smi --persistence-mode=1

Sajnos nem. Nincs köze az nvidia-smi futtatáshoz, kézzel tapperolva is mindig meleg volt, szinte foghatatlan. Most langyos.

Érdekes, hogy ha az 'nvidia-sleep.sh suspend' paranccsal elaltatom a kártyát, akkor is felmelegszik. Pedig ilyenkor még az 'nvidia-smi' sem látja. Az 'nvidia-sleep.sh resume' után minden ok. 

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

Szervízként fut. Valóban, az nvidia-smi első futtatása után több eszköz jön létre. 

Na de hogyan lesz ebből nulla fogyasztás, ha nem használom a kártyát? Vagy ne legyek telhetetlen, a 19W is majdnem fele az kiinduló értéknek.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

Milyen disztród van? Ha jól emlékszem Ubuntu-t emlegettél.

Kezd Debián specifikus power management problémának tűnni. Futnom kell egy kört az Arch-al.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

Eddig nem futott. Most felraktam egy Hyprland-et, de ugyanaz a helyzet. Egy modell futtatása után hol lemegy 20W környékére, hol 35 W környékén marad.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.

Hőmérővel :-) . Ugyanúgy 50 fok körüli a kártya hűtőbordája mint amikor 35-40W között fogyaszt suspend nélkül.

Meg kellene nézni, hogy mi pluszt csinál az Omarchy és az Ubuntu az Arch-hoz és a Debian-hoz képest.

Életem azon szakaszába léptem, amikor ha azt mondod nekem, hogy 1+1=5, akkor én elfogadom és leszarom, hogy hülye vagy.