Proxmox VE KVM virtuális lemez fájlrendszer eltűnik

Fórumok

Sziasztok!

Már vagy negyedjére fordul elő fél év alatt és kezd már bosszantó lenni.

Proxmox 6.1, 6.2, 6.3 is megcsinálta, hogy random vagy ma éjjel gép importálása közben egy másik KVM gép ( Debian van rajta ) virtuális lemezéről eltűnt a fájlrendszer. Gparted Live boot után RAW lemez. Adatok rajta vannak, testdisk látja és vissza is tudom állítani. Egy-egy gépen amin előfordult eddig szerencsére nem volt sok cucc, pl. csak levelezés így VPS mentés visszatölt, rsync az előző napi mentésből és kész ( persze egy nap bukta így is ), de így is gáz.

Szóval adott most Proxmox 6.3, teljesen default telepítés. Fut rajta A,B,C VPS és a D VPS importálásakor a C virtuális lemeze megpusztult. A host gépben új lemezek, Dell Perc vezérlő. Kb. 120 Gb-os VPS-t importáltam. De volt olyan eset, hogy éjjel megment, semmi tevékenység nem volt. 

Járt így valaki még? Gondolom igen mert 3 különböző fizikai gépen is csinálta már nekem, így esélyes, hogy másnak is. Proxmox-al meg eddig nem volt bajom, 8+ éve használom.

Hozzászólások

Milyen diszket használsz? LVM, zfs vagy melyik?

Szia!

Proxmox 5.4
7 node 34 VM

Kizárólag egy gép (VM) csinálja, ami nagyon régi, de még nem engedik lekapcsolni. Nekünk kb. fél évente történik és mivel ki lesz vezetve
nem kezdtünk hibakeresésbe. A hibaelhárítást ugyan úgy csináljuk, ahogy Te.
A VM: Fedora release 10, Kernel 2.6.27.9-159-fc10.i686

Köszönöm. Ezen most 4 gép volt. Én meg azt hiszem le fogom kapcsolni a többit amíg betöltöm a következőt, hátha az erőteljes lemez terhelés zavar be. Egy gépen cserélni akarom a Proxmoxot mert a backup cuccuk megtetszett és csak a 6.3-tól van benne. Át kell tennem a többi hostra a gépeket. 3 hostom van csak, nincs központi tárolás...  #1 SMP Debian 4.19.160-2 (2020-11-28) x86_64 GNU/Linux VirtIO a vezérlő és sata virtuális csatoló van.

Szerkesztve: 2021. 04. 14., sze – 10:03

Host reboot segít esetleg? Nekem XenServerrel volt olyan, hogy menet közben elszállt egy VM fájlrendszerre formázatlan diszkként látta a linux meg i/o hibákat írt, az egész mintha sérült volna...a virtuális diszk, minden más VM ugyanazon a diszk alrendszeren meg tökéletes volt.

Próbáltam sok mindent, másik guest alá csatolva sem láttam, aztán végül a host gépet újraindítottam. Mintha semmi nem történt volna, bebootolt a problémás gép, 0 hibával, minden adat megvolt. Ezt 3x megcsinálta más gépekkel, ekkor váltottam proxmoxra. Ott még nem tapasztaltam a fenti jelenséget, de most már nem alszom nyugodtan :)

Régóta használok Proxmox-t de ilyennel nem találkoztam.
Debian 7/8 guest-nél kernel (3.x) volt néha, hogy befosott és szétfagyott a VM valami kernel driver/bug miatt, de ez megszűnt amikor újabb kernel (4.x) -re váltottak stable ágon.

Bemásolnád a VM konfigját és a HOST gépen a mount paramétereket? ( lehet abban van valami )

lvm thinben van vagy native?

A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

https://pve.proxmox.com/wiki/Storage:_LVM_Thin

"native" eseten lefoglalja a fizikai teruletet, es azt mar nem tudja mas hasznalni. thin eseten a terulet csak akkor lesz lefoglalva ha irnak ra.

lehet itt zavarodik ossze valami, hogy egy ures teruletet "rendel" a meglevo lv-hez, ezert "nullazodik" ki a particio. de ez csak tipp

A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

Lehet igazad... Az első esetben nem figyeltem és megtelt a fizikai partíció... De alapból LVM-thin lesz, régen nem ez volt. Natív LVM meg azt hiszem már nem is engedi a snapshotot. Régen nem azt figyeltem jeleneg mennyi szabad hely van a fizikai köteten, hanem, hogy a kiadott virtuális lemez méretek elférjenek rajta.

Szerintem itt lesz a gond...

Importálás előtt megnéztem mennyi szabad hely van, azon el kellett férjen a behúzott gép. Viszont én abban a tudatban voltam, hogy a kisztott lemez méretek le vanna foglalva és azt látom. Most számoltam egyet.

1TB lemezek vannak ebben a gépben. 794 Gb az LVM-THIN partíció. A meglévő 3 db gép és a betöltött gépnek összesen 864 Gb lemez lett kiosztva. Hely még volt, de túlléptem a méretet amennyiben minden gép megtelt volna.

Kollégánál is hasonló fordult elő - én gyanítom, hogy a mentési eljárással van összefüggésben. (Ő -eddig- nem nyomott suspend-et mentéshez/exporthoz)
(rejtett sub)

Valaki panaszkodott nemrég, hogy a discard opcióval baja volt, adatvesztés lett belőle. Esetleg?

Megint megcsinálta... a hostot újra indítottam így úgy néz ki nincs baj... Most is importáltam. A guest-en inode problémákat jelett az sda1.