( blr | 2020. 05. 30., szo - 22:15 )

Szerkesztve: 2020. 05. 30., szo - 22:16

.doc és .docx esetén az oldalszám elég problémás, ugyanis amit az exiftool mond, azt nem légből kapja, hanem tényleg az szerepel a fájl metaadataiban. Aminek viszont egy szövegszerkesztő esetén gyakorlatilag nincs értelme. Ezeket (ha erőforrásigény nem gond) LO-val PDF-be exportálnám, annak az oldalszámát meg már meg tudtad állapítani.

Van docx2txt, abból a karakterszám megvan (nagyjából, mert pl. a review-k miatt problémáid lesznek). PDF-ben a karakterek számlálása már sokkal keményebb dió, mert ott számolni kellene elválasztójelekkel és a ligatúrákkal. Mire kell? Mennyire kell, hogy pontos legyen?