Szerintem, hogy ha a blokkokat hasheli, és a hash alapján dönti el, hogy duplikáció-e, akkor az úgy nem lesz jó....
SHA-512 esetén is csak 2 az 512-en féle különböző blokk lehet így.
Könnyen belátható, hogy minél nagyobb az adatmennyiség, annál valószínűbb, hogy lesz két azonos hash, amik nem azonos adatot takarnak.