Nem tudom.. Nekem ez még mindig gyanús így..
- 1 részről mert ha duplikációk vannak, akkor ennél jócskán többnek kéne lennie (főleg egy 6 milliós minta esetén -> sokkal kisebb oldalakon is erősebb duplikációs ráta van).
- Más részről meg ha feltételezem, hogy előre sortolt adatról van szó, akkor nyomban felmerül a gyanú, hogy a 6 milla már nem 6 milla, hanem nyomban több
Ennyi alapján azt is mondhatnánk, hogy egy komolyabb (nagyobb) dictionary-ben lévő szavakat tolták át sha1-re, és töltötték fel netre.
____________________________________
Az embert 2 éven át arra tanítják hogyan álljon meg a 2 lábán, és hogyan beszéljen... Aztán azt mondják neki: -"Ülj le és kuss legyen!"..