virtualizáció image (blokk) deduplikáció

Fórumok

Több, nagyon hasonló telepítésű vrtuális gépet használnék (nem egyidőben!) Debian Linux-on. A guest OS változó, Win7 / Win10, Ubuntu, Debian és valamilyen (Free?)BSD várható - egyesek minimális telepítéssel, mások több programmal. Mivel lehet megoldani, hogy a guest-ek közös részei (pl kernel, alap alkalmazások) csak egyszer legyenek a lemezen? Egyáltalán milyen image formátum javasolt (pl QCOW2 esetén a tömörítéstől függően működhet a deduplikáció)?
Egyelőre csak a ZFS on Linux állományrendszer használata tűnik lehetőségnek RAW image formátum mellett.

Hozzászólások

Mennyit tudnál így spórolni? 10 gigás nagyságrendben, vagy csak néhány gigányit? Vagy még annyit se?
Szerintem nem igazán éri meg ezzel foglalkozni, de érdekel hogy mire jutsz.

Ez is része a dolognak, hogy számottevő lemezterület megtakarítást lehet-e elérni vagy sem.
Alap Win7 telepítés önmagában 10+ GB lehet. Ha három ilyen virtuális géped van, az 40+ GB helyet foglalhat. Deduplikációval ha csak ~8 GB tárhelyet takarítasz meg a második Win7 géptől kezdve gépenként, már az számottevő lehet.

Ez erre volt válasz: Ott még nem túl gyakori az említett több TB-os kapacitás. Az ár nem volt téma, persze, hogy nem olcsó. Nem is javasoltam, hogy ilyet vegyen. Közben utánanéztem és kissé le vagyok maradva, mivel a sor így néz ki, 400GB, 800GB, 1,6TB, 3,2TB, 3,84TB, 7,68TB, 15,36TB.
Visszatérve az árra, 1TB méretűt ~80.000 Ft-ért lehet kapni.

Azért ha sas-es ssd-nél amit raid5-be raksz? Persze ez a legextrémebb példa.

Egy másik apróság ha zfs-ben gondolkozol akkor azt is vedd számításba, hogy a dedup-hoz számolj 16-gb RAM igényre.

Egyébként én meg a docker környékén néznék széjjel... Ott nincs is teljes op rendszer csak szolgáltatások vagy szolgáltatás csoportok.

Ja persze, értem én, elméletben szép ez.
És nem is hülyeség amire gondolsz, és értelme is lenne, csak neked vm image-en belüli _file_ szintű dedup kellene, de csak blokk szintű dedup-ot "tudsz" csinálni az egész container-ről.

Jó eséllyel nem fog egybeesni a VM szektormérete a host blockméretével, szóval hosszú távon a 13-ból átlag 8 giga megtakarítás szerintem nem lesz tartható. Persze ha egy "ős" vm-et klónozol akkor nagyon sok mindent "nyersz", de ha az egyik vm-en tolsz egy windows update-et (netán egy defrag-ot) akkor máris borul a mutatvány egy része.

Ugyanakkor a sarki kiskerben bruttó 14k alatt indul a 128 gigás SSD-k ára, szóval ha írt átlag 8 GB tárhely-megtakarítást veszem VM-enként akkor ennyiből kijön 15 VM megtakarítása. És a ZFS sincs ingyen, ahhoz nem árt ECC RAM, ahhoz pedig megfelelő proci és lap, a dedup pedig kifejezetten igényli a sok memoárt...

Tudom nem megoldás számodra, de pont erre van megoldás Hyper-V-n. Lehet csinálni egy base image-t és az egyes VM-ek csak a különbséget írják a saját vhdx-re. ez azért hosszú távon tényleg nem éri meg, a frissítések miatt a különbségi diszkek is nagyra nőnek.

Ezt akartam javasolni és ezt meg lehet csinálni QCOW2-vel vagy ZFS ZVOL-al is. Csinálsz minden rendszerből egy alap telepítést, amibe beletolsz mindent ami TUTIRA azonos kiindulópont, aztán mindig csak ezt fork-olod. Többet nyersz vele, mint a deduplikációval. Helyben lehet, hogy kicsit kevesebbet spórolsz, viszont a dedup overhead-je nélkül.

----------------------------------^v--------------------------------------
"Probléma esetén nyomják meg a piros gombot és nyugodjanak békében!"

A dedupot és a tömörítést egy alrendszerben tartsd és erre a feladatra akár offline dedup is bőven elegendő.