Ez azért kérdéses. A hash számítás azért annyira nem húzós, még így is bőven a diszk a szűk keresztmetszet. Még memórialapoknál is megcsinálható virtuális gépek között (ESX/ESXi biztosan csinál is ilyet). Én inkább ott látom a bajt, hogy a hash komparálásnál valahonnan a vinyóról kell levadászni a már meglévő hash-ek indexét, ami minimum néhány seekelés. Hash egyezésnél (ami azért szerintem nem lesz annyira nagyon ritka) ténylegesen komparálni is kell a blokkok tartalmát, ami újabb seekelés. A gyors szekvenciális transzfert garantáltan tönkreteszi, szóval inkább SSD-khez lesz jó.
Illetve hát index méret vs. hamis pozitívok száma közötti kompromisszum kérdése az egész. Ha kicsi az index, akkor folyamatosan memóriában cache-elhető, viszont sok lesz a hash ütközés. Érdekesnek mindeképpen érdekes, hogy hogyan lehet valami optimumot találni az implementációhoz.
---
Linux is bad juju.