( arpi_esp | 2022. 07. 15., p – 20:36 )

amúgy is ékezet nélküli 7 bites a string amire keres (a key a dict-ben), az eredmény meg már csak biteken van tárolva differenciálisan...

sikerült leküzdeni 14.2 megára, kis RLE tweakelessel, de sztem itt a vége, innentől már csak valami entropy coding (pl. huffman) segíthet. de legalább már nagyon gusztustalan a kód, de még is érdemlik a mozillás humán reviewerek :)

http://thot.banki.hu/ekezet/content.js

megnéztem a subtree dict méreteket is, 6-32 végigpróbálva 9-10 a legjobb, alatta/fölötte már nagyobb. úgyhogy most 10 lett.

ahhoz képest, hogy a python pickle file 64 mega, a .json 72, az utf8-as bináris fa 41, nem rossz a 14 :)