EPUB -> StarDict szótár: saját angol-magyar szótár készítése LLM segítségével

Szeretnék új angol szavakat tanulni és angolul olvasni. A gond mindig az volt, hogy nem tudtam hatékonyan szótárazni, és sokszor rengeteg ismeretlen szó jött szembe. Végül vettem egy PocketBook ebook olvasót, gondoltam, hogy ezen könnyebb lesz a szótárazás - hát nem így történt. Nem találtam hozzá igazán megfelelő StarDict szótárakat, amit letöltöttem, abból sokszor vagy hiányzik egy szó, vagy rossz jelentést ad.

Sokkal jobb lenne egy könyvspecifikus szótár, ami csak az adott könyvben előforduló szavakat tartalmazza, a szövegkörnyezetnek megfelelő jelentésekkel. Ez LLM-el el is készíthető. Elsőként egy kisebb könyvet választottam. Ez kb 1600 mondatból áll, és kb 3700 szót tettem bele a szótárba.

A szótár készítéséhez egy python script gyűjteményt csináltam, amivel egy EPUB formátumú ebookból lehet angol-magyar szótárat készíteni. A script gyűjtemény 6 db script-ből áll, amiket sorban le kell futtatni.

(Megjegyzés: A blog törzse egy javítás után jelenik majd meg: https://hup.hu/comment/3237857#comment-3237857 .)