PDF-metaadat-turkálót keresek

Fórumok

Keresek olyan programot, ami a PDF-ek különböző metaadatait hajlandó mejeleníteni (még jobb lenne, ha szerkeszteni is lehetne, de az a kevésbé érdekes). Win/Lin/FreeBSD :-) egyaránt jöhet.
Magyarázat: belefutottam egy Java-ban írt alkalmazásba, amely PDF-et generál. Sajnos a tesztek azt mutatják, hogy Windows alatt és Linux alatt valami karakterkódolási probléma miatt nem ugyanolyan lesz az eredmény, Szeretném viszonylag pontosan kideríteni, hogy mi az eltérés, hogy az ismeretlen fejlesztőnek kellően precíz hibajegyet küldjek.
Sajnos az Evince semmi olyat nem mutat amiben eltérnek, az Adobe Reader legalább annyit mutat, hogy a wines verzió saját kódolást használ (de hogy mit azt már nem), míg a linuxos ANSI-kódolású. A pdftk dump_data paraméterrel szintén nem mutat semmi érdemlegeset. Több ilyen eszköz sajnos nem jutott eszembe. (Példát sajnos nem tudok prezenálni.)

Hozzászólások

Elnézést benéztem. Nem dob exceptiont. De mondjuk nem is működik.

$ pdfmetadata.py samples/simple4.pdf
Traceback (most recent call last):
File "/home/zgabor/bin/pdfmetadata.py", line 9, in
from pdfminer.pdfparser import PDFParser, PDFDocument
ImportError: cannot import name PDFDocument

(A pdfminer saját vackai működnek. Fenti FreeBSD-ről jön, de ugyanez volt tegnap Linuxon.)

Köszi, meg fogom nézni. Nálam valami debian korcson (xubuntu talán) repoból ment fel és ott működik is.

update: megnéztem a githubon. Tavaly novemberi dátummal találtam pár megjegyzést, hogy "kissé" átalakították a PDFDocument működését (és el is költözött az eredeti helyéről)
Szóval ezzel dolgozni kellene egy kicsit, hogy nálad is működjön, viszont tartok tőle, hogy nem tudna annyit mondani, mint mondjuk az adobe reader...
A jelenlegi, ami a régi verzióra épül, a töredékét sem mutatja meg (pl. a fontokról úgy látom, mélyen hallgat :( )

update2: gányolás rulZ jelszóval, készítettem egy olyan verziót, ami működik az újabb pdfminer-rel.
https://github.com/haa-zee/python-sandbox/blob/master/probak/pdfmetadat…

Foxitreader?
A pdftk/GuIpdftk mit nem mond meg?

---
--- A gond akkor van, ha látszólag minden működik. ---
---

Pdftk-val tömörítsd ki, és akkor egészen olvasható lesz szabad szemmel is.

--

Esetleg a Xpdf-ben lévő pdfinfo program meta kapcsolójával nézd meg a kérdéses állományt.

Tipp: nincs beagyazva a betutipus amit hasznal, es a masik OS-eken nincs az a karakter/kodolas benne abban a betutipusban, amit probal hasznalni.
Egyebkent anno a php-s fpdf-et hasznaltunk, mikor pdf-et kellett generalnunk.

Sajnos a fontok be vannak ágyazva. Abba meg nincs beleszólásom, hogy a fejlesztők mit használnak a pdf előállítására. Én csak belefutottam ebbe a hibába. És miután már jó időt eltöltöttem azzal, ogy a win-re megírt Java-alkalmazás jó lenne ha futna Linuxon (és mondjuk nem úgy hogy Wine-ban futtatom a wines JRE-t :-) ), nagyon örültem, mire eljutottam idáig. És eléggé zavar, hoyg látszólag ez az egyetlen hibája van :-(

Fontproblémákra a metadatok nem fognak választ adni.
Nézd meg, hogy a felhasznált fontok mindkét rendszeren azonosak-e, ha nem, az okozhat gondokat. Szintén problémás lehet ha a program nem Unicode szerint dolgozik, akkor a default codepage szerinti karaktereket fogja használni, csak éppen a PDF kódolását elfelejtik.
PDF-ek tartalmának elemzésére a PDFSharp Explorer demóprogramját tudom javasolni. (Én Windowson használom, fogalmam sincs, hogy Monóval lefordul-e. Mármint az Explorer, maga a PDFSharp biztos megy, használjuk.)

Az exiftool program is metaadatokat szed ki. PDF-en kívül számos egyéb fájlformátumot is támogat. Az exiftool a libimage-exiftool-perl csomagban található.

"belefutottam egy Java-ban írt alkalmazásba, amely PDF-et generál"

Ez melyik program?

Sajnos ezt nem mondhatom meg. Itthon fejlesztik, egy szakigazgatási szerv belső alkalmazása. Pont ugyanezen okokból nem mutathatok tesztadatot, mert nem-publikus infók vannak benne. De mivel én csak harmadkézről látom, sem jogom, sem lehetőségem nincs magával a fejlesztő céggel felvenni a kapcsolatot direktben. (Most folynak a megbeszélések, hogy a lehetne-e láncot kihagyva eljuttatnom legalább a javaslataimat és eredményeimet a fejlesztőknek; esetleg én - aki működésre bírtam Linux alatt -, beszélhessek a fejlesztővel.)