( blr | 2010. 01. 18., h – 00:29 )

Köszönöm az infókat. A konklúzió: kisebb a valószínűsége annak, hogy a három hash és a méret azonossága esetén különböző az eredeti adathalmaz, mint hogy egyszerre szálljon el két lemez a RAID5 tömbből.
Egyébként a napi változás nem sok, de az összes adat igen (kb. 7-800 GB), ráadásul a kedves alkalmazottak előszeretettel küldözgetnek hatalmas csatolmányokkal körleveleket, illetve játszák azt, hogy lementenek valamit magukhoz, aztán onnan átmásolják a publikus területre. Ebből következően az egész simán "tömöríthető" minimum a felére, ha elhiszem, hogy a három hash egyezősége "kimondja" két blokk egyezőségét. (Azért a blokkokra bontás, mert pl. ha valakinél 1-2 GB egy mailbox fájl, annak úgyis többnyire csak a vége változik, illetve ha egy fotóban kiretusálok egy karcolást, az sem feltétlenül érinti az egész fájlt.)

(Reméltem, hogy sejtésemet alapvetően alátámasztjátok, mert közben kb. 90%-ban elkészültem a kóddal :)