Egyenlore, mint uzemelteto, mar attol is boldog lennek, ha volna egy ~ 30e felhasznalora meretezheto imap szerver, ami ha egy korlevel, benne egy 10megas csatolt media tartalommal szetmegy 3000 usernek, akkor az csak egyszer van letarolva fizikailag.
(szolj, ha van).
Az adatdeduplikacio mehet bit szinten, ezek a hagyomanyos tomoritok. Mehet block szinten, errol van ebben a vitaszalban szo. Mehet file szinten, bizonyos ertelemben ezt csinalja az rsync, es mehet alkalmazas-specifkus szinten, lasd a fenti kivansagomat. Mindegyiknek van helye es ertelme.
Azokban a filesystemekeben, ahol az adattarolas teljes map-tabla alapjan megy/mehet, vagyis ahol a virtualis block -> logikai block kozotti lekepezes barmi lehet, ott egy ilyen funkcio (hasonloan a filesystemen beluli snapshothoz) nem elkepzelhetetlen. Ilyen pl a linuxos LVM2, a netapp-féle wafl, a hiradasok szerint sun oracle zfs, a linuxos btrfs, vmware vmfs. (aki szerint a linuxos LVM2 nem illik ide, az rossz vitaszalat olvas).
Vegul is, egy snapshot is adatdeduplikacio elven megy, azzal a konnyitessel, hogy nem kell megkeresnie, hogy mik az egyezo blockok, mert tortenetileg tudja. De milyen jo volna mar, ha egy kesobbi rw snapshotban a user visszair egy eredetivel megegyezo blockot, akkor erre rajonne a rendszer, es nem vesne fel?