Virtualizáció

Proxmox szerver lefagy!

Fórumok

Sziasztok!

Az egyik P93 szerver, amelyet a Hetznertől bérelek, random lefagy.

Software:
A legfrissebb Proxmox VE 7.2-4 (kernel: 5.15.35-2-pve) fut rajta, az alatt pedig 13 virtuális gép.

Hardware:
Intel® Xeon® W-2295 18-Core CPU
256 GB (8 x 32 GB DDR4 ECC) RAM,
2 x 3.84 TB NVMe SSD Datacenter Edition -> rendszer és VM-ek, ZFS + compression,
2 x 16 TB SATA Enterprise HDD -> backup, ZFS + dedup (szerk.: azóta kikapcsolva) + compression,
Hardware RAID nincs

Amit eddig tettem a megoldás érdekében:
Kicseréltettem a RAM-okat, a tápegységet, majd az egész szervert,
kikapcsoltam a NUMA-t, az SSD emulation-t (bár ez tudtommal semmit nem csinál) és az IO thread-et is minden VM-nél,
22 CPU mag és 144 GB RAM van most kiosztva a VM-eknek (3 CPU és 32 GB RAM a legtöbb 1 VM esetén)

A "tünetek":
Ha ssh-n bejelentkezve ér a fagyás, akkor a konzolon hasonló üzenetek kezdenek ömleni:
 

Message from syslogd@Server at Jun 12 11:19:57 ...
 kernel:[101078.245390] NMI watchdog: Watchdog detected hard LOCKUP on cpu 26

Message from syslogd@Server at Jun 12 11:19:57 ...
 kernel:[101080.968427] NMI watchdog: Watchdog detected hard LOCKUP on cpu 0

Message from syslogd@Server at Jun 12 11:19:57 ...
 kernel:[101085.584163] watchdog: BUG: soft lockup - CPU#1 stuck for 23s! [kvm:497638]

Message from syslogd@Server at Jun 12 11:19:57 ...
 kernel:[101085.588163] watchdog: BUG: soft lockup - CPU#2 stuck for 26s! [kvm:995268]

Message from syslogd@Server at Jun 12 11:20:09 ...
 kernel:[101097.612269] watchdog: BUG: soft lockup - CPU#14 stuck for 22s! [kworker/14:2:1965617]

Message from syslogd@Server at Jun 12 11:20:25 ...
 kernel:[101104.376759] NMI watchdog: Watchdog detected hard LOCKUP on cpu 28

Message from syslogd@Server at Jun 12 11:20:25 ...
 kernel:[101112.091159] NMI watchdog: Watchdog detected hard LOCKUP on cpu 5

Message from syslogd@Server at Jun 12 11:20:25 ...
 kernel:[101112.599352] NMI watchdog: Watchdog detected hard LOCKUP on cpu 31

Message from syslogd@Server at Jun 12 11:20:25 ...
 kernel:[101113.588410] watchdog: BUG: soft lockup - CPU#2 stuck for 52s! [kvm:995268]

Message from syslogd@Server at Jun 12 11:20:25 ...
 kernel:[101113.600410] watchdog: BUG: soft lockup - CPU#9 stuck for 22s! [atop:1970572]

Message from syslogd@Server at Jun 12 11:20:29 ...
 kernel:[101114.959585] NMI watchdog: Watchdog detected hard LOCKUP on cpu 1

Message from syslogd@Server at Jun 12 11:20:29 ...
 kernel:[101117.592445] watchdog: BUG: soft lockup - CPU#4 stuck for 23s! [kvm:835684]

Message from syslogd@Server at Jun 12 11:20:33 ...
 kernel:[101121.628481] watchdog: BUG: soft lockup - CPU#24 stuck for 22s! [kworker/24:2:374]

Message from syslogd@Server at Jun 12 11:20:37 ...
 kernel:[101125.612516] watchdog: BUG: soft lockup - CPU#14 stuck for 48s! [kworker/14:2:1965617]

A VM-ek elérhetetlenekké válnak, a Proxmox WEB UI elkezd "homokozni". A Hetzner felületén indított hardware reset után a gép újra megy.
Van, hogy naponta háromszor fagy le, van hogy megy 8 napig is.

A syslogban nincs semmi furcsa a lefagyás előtt.

Kérlek, segítsetek megtalálni és megszüntetni a lefagyások okát.

[Megoldva] Hyper-V host :: Disk(s) encountered critical IO errors

Fórumok

# Fizikai Win Srv 2016 Std: Hyper-V Manager 10.0.14393.0
=> VM: Win Srv 2016 Std (AD)

# Előzmények
- fizikai szerver újraindítása után nem indult el automatikusan, hanem saved allapotba került
- elindítottam és jó lett
- kevés volt a hely, töröltem 300GB-ot
- uninstallálni akartam egy programot, utána lefagyott

# VM hiba: 
- Disk(s) encountered critical IO errors
- State: Paused-Critical
- bootoláskor: "Press any key to boot from CD or DVD ..." (itt nem reagál semmire)
- VM Connection: The application encountered an error while attempting to change state of 'VM'
Virtual hard disk has not yet recovered from previous error. Current status: 1.

# Kérdésem:
State: Paused-Critical: kevés lehet a tárhely?

Minden ötletet örömmel fogadok, előre is köszi.
Hyper-V guruk, légyszi, írjatok nyugadtan privátban is, köszi.

[Update1] VM ment 30 percet, lefagyott. Újraindítottam elindul, de "Disk(s) encountered critical IO errors"-t mutat és lefagy.
[Update2] 40GB felesleges ERP mentés törlése
[Update2] snapshot point törlése, jelenleg minden ok :-] Halleluja.

Brrr, ilyet még nem láttam.

Proxmox KVM guest fájlrendszer eltűnik

Fórumok

Sziasztok!

Visszatérő probléma, eltűnik a fájlrendszer KVM alapú guest gépeken. A guest jeleneg is fut, írható a fájlrendszer, de az fdisk az alábbi kimenetet adja. Többet nem fog elindulni ha újraindítom.

Valakinek ötlet? Persze a mentés sem megoldás mert ez a hiba a Proxmox Backup Serverre is lemegy, a mentett kép is hibás.

root@web:~# fdisk -l
Disk /dev/sda: 250 GiB, 268435456000 bytes, 524288000 sectors
Disk model: QEMU HARDDISK
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes

[MEGOLDVA]KVM gpu átadással Windows VM, virtualizáció elrejtése

Fórumok

Sziasztok! 

Windows 10 VM alatt szoktam játszani GPU passtrough segítségével. Minden tökéletesen ment kb 2 évig, DE egy hete az EAC (EasyAntiCheat) detektál és nem enged semmilyen EAC-t használó szerverre csatlakozni. A host gép Debian 11.3 stable-t használ. CPU:Skylake-Client-IBRS

Hibaüzenet:[EAC] Game Client Violation: Cannot run under Virtual Machine.

Az én steam accountom más gépén tökéletes és a játék is elindul.

Amiket próbáltam, de nem segített : 

     -5 hónapos rendszer backup, hátha valami frissítés kavart be

     -másik steam accounttal ugyanazon a VM-en

     -tök másik win11 VM, ugyanazzal a GPUval

     -HW id csere a VM configjába

     -kiegészítésként a virtuális gép xml-be:

cpu részhez:
<feature policy='disable' name='hypervisor'/>

Csak a hypervisor kikapcsolása után láttam ezt a systeminfo powershell parancs kimenetén :

Hyper-V Requirements:      VM Monitor Mode Extensions: Yes
                           Virtualization Enabled In Firmware: Yes
                           Second Level Address Translation: Yes
                           Data Execution Prevention Available: Yes 

 

<kvm>
    <hidden state='on'/>
  </kvm>

     - Próbáltam a háttértáraknál a VirtIO helyett SATA controllert használni

Milyen módon tudnám elrejteni a virtualizáció tényét a VM számára?

Válaszotokat köszönöm előre is.

Proxmox snapshot... [megoldva]

Fórumok

Udv Mindenkinek,

belefutottam egy nagyon nagy problemaba, szerintem hibaztam, hogy veletlenul kitoroltem egy snapshotot.

Nem indul a vm, megneztem a konfig fileokat, amit kitoroltem, sajnos "parent" a vm konfigjaban.

Fogyoban volt a disken a hely , ezert tortent a veletlen torles.

Mit tudok tenni a vm normalis mukodese erdekeben?

Elore is koszonom!

Proxmox7 Raid vs ZFS

Fórumok

Sziasztok!

A felállás: Dell szerver 128GB RAM,  Hw Raid vezérlő.

2db SSD raid1-ben ezen fut proxmox

2db SSD raid1-ben ezen vannak vm-ek

4db HDD Raid5-ben backup

MI a véleményetek azzal kapcsolatban, hogy vm-es ssd-ken jobb volna e ZFS-t használni, illetve RAID5 helyett jobb lenne e ZFS rendszert használni?

wine-nal tökéletesen futó programok

Fórumok

Sziasztok.

Érdekelne, ki milyen programokat tudott begyűjteni az elmúlt 20 évből, ami még mindig használható, esetleg interneten el is érhető.

A windows kegyes gyártója az oprendszereire írt programokat folyamatosan kilövi a világűrbe, így régi esetleges kedvendeinket máshog ykell elindítanunk.

Csak egy példa: A SoundForge, amit annak idején megvásároltam, nálam még mindig fut.

ESXi datastore != Virtual Disk (eltérő méret)

Fórumok

# PowerEdge T440:
- PERC H750 (akksi, 8GB)
- RAID1 2x 960GB Dell Mixed Use SSD SATA
- 32GB RAM

# RAID1 beállítás:
- Logical Sector Size: 512B
- Strip Element Size: 64KB
- Current Write Cache Policy: Write Back
- Read Cache Policy: Read Ahead
- Disk Cache: Default

# iDRAC9:
- Virtual Disk: 893.75GB

# ESXi:
- DellEMC Custom Image for ESXi 7.0 U3 Install CD
- datastore1: VMFS6 (type), Version 6.82, Local    Yes, Block size    1MB
- capacity: 765.5GB

# Probléma, kérdéseim:
- iDRAC9: 893.75GB-ot lát, míg az ESXi csak 765.5GB-ot
- jól gondolom, hogy ez az ESXi Block size 1MB miatt van?
- mit kéne tennem, hogy a teljes 893.75GB-ot használhassam?

Előre is köszi minden ötletet és tanácsot! :-]