Deduplikációs tesztre lenne szükségem.

Sziasztok!

Azt szeretném tesztelni, hogy az adataink, állományaink mennyire deduplikálhatóak, anélkül, hogy létrehoznék egy deduplikációval rendelkező tárolót.

Létezik ilyen alkalmazás? Ismertek valami eljárást dologra?

Köszönöm
Oli

Hozzászólások

Meglevbő megoldásról nem tudok, így én írnék magamnak egyet, a megoldáshoz pedig hard linket használnék.

Fuszenecker_Róbert

Hát igen, igaz, amit írsz, én is ZFS-t haszálnék inkább.
Én abból indultam ki, hogy archiválásra kívánja használni a topicindító, ha a fájlok utólag már nem lesznek módosítva, akkor a hard link is jó megoldás (ezt megcsinálja az rsync is a --link-dest opcióval). Ha viszont nem archiválásra használja, akkor marad a ZFS. Csak sajnos azzal nekem is akadt némi problémám Linuxon.

Könnyebb lenne válaszolni, ha tudnánk, mire is kell pontosan (vagy nagyjából) :-)

Fuszenecker_Róbert

Kérdés itt az, hogy az egyforma fájlokat vagy az egyforma blokkokat akarod megtalálni.
Az első nagyon egyszerű, a második már nem annyira.
Az elsőre ez megoldás lehet: http://code.google.com/p/fdupes/
A másodikhoz, ha írsz is valamit, akkor nem árt ismerni egy kicsit azt,
hogy az a szoftver, amivel később esetleg deduplikálni akarsz, hogyan dolgozik.