( asch | 2023. 06. 09., p – 14:39 )

Vödrökbe akarjuk tenni a fájlokat a hash prefixei szerint. A cél az volna, hogy minden vödörbe ugyanannyi fájl kerüljön. Ha kriptó a hash, akkor joggal számíthatunk arra, hogy minden vödörbe ugyanannyi fájl kerül, illetve ezeknek a méretei is egyformák lesznek átlagosan. Így akár az első vödör akár fizikai diszk volume is lehet, a diszkjeinken ugyanakkora lesz a terhelés nagyjából.

A véletlenszerű mintavételezés törvényei szerinti szórással természetesen. Ha nem kriptó a hash, szerintem akkor is elvileg teljesülnie kell ennek, kivéve ha a hash valamiért tud korrelálni azzal amit tárolunk. Az biztos, hogy a kriptó jó, a nem kriptón meg gondolkodni kellene, hát akkor legyen kriptó. Elegendő annyit kriptóhashelni a metaadatokból, amik már egyedi módon azonosítják a fájlt. Tehát a teljes tartalmat nem feltétlenül kell, ha mondjuk hívások időbélyeggel és hívószámmal vannak tárolva, mert ez a páros már egyedi.

Kriptó hash esetén "Ízlés kérdése" lesz, hogy kezeljük-e az ütközéseket, ugye elvileg rendkívül ritka lesz. Lehet mérlegelni, hogy belefér-e. És mi fog történni, elszáll az egész, vagy csak hibásan működik ütközés esetén? Én egyszer használtam kriptó hash-t hasonló célra, és lekezeltem az ütközést ennek ellenére. Tesztelni kellemetlen, mert a kriptó ütközéshez nem tudtam tesztesetet gyártani, a hash algoritmust le kell cserélni a tesztben egy ütközőre, hogy tesztelhessük az ütközés esetén történő viselkedést.