Ékezetes karakterek .PDF dokumentumban

Fórumok

Adott egy .pdf dokumentum amit egy vállalat irányítási rendszer generál.
Windows alól nézve szépen ott vannak az ékezetes karakterek, LMDE/Evince 3.2.1/xpdf 3.0.3 alatt azonban nem (ttf-mscorefonts-installer telepítve van így azt gondolom a fontokkal nem lehet baj).
Legjobb tudomásom (és a szoftver fejlesztője) szerint semmi extra nincs benne, a betütipus Arial.
Van esetleg tippetek mi a gond?

Hozzászólások

pebkac,bar nem tudom mit kellene látni. lefolyó látszik, meg átlátszó. De félek, hogy cső-nek is kéne lennie, no az nincs.
xpdf-3.02 - itt nincs cső
evince-2.32.0 - itt még cső is van

Úgy néz ki, az xpdf-et hidegen hagyják a ttf-ek. Eldugtam előle a komplett truetype könyvtárat, és pont ugyanúgy jeleníti meg 'ő' nélkül, mint előtte.

Tkp. nálam az evince is ezt csinálja, de az nem is mai darab.

Az acroread tökéletesen jelenít meg, kivéve ha ledugom a ttf-ek könyvtárát, amikor is ugyanúgy mutat, mint a másik kettő.

szerk.:
Hogy ötlet, ill. megoldási javaslat is legyen: az a sejtésem, hogy az ArialMT ill. Arial-BoldMT típusokat megfelelteti az X valami X11/type1 típusnak, ezért az egyszerűbb megjelenítők azzal renderelnek, a ttf-et hátrasorolva.
Hogy így van-e, azt talán ki lehetne próbálni valami egzotikusabb készlettel, amire talán nem talál natív X-es közelítést.

Másrészt ha pdf-et eleve úgy tudod generálni - nem tudom, hogy ez a sugallatom technikailag értelmezhető-e -, hogy a használt fontokat tartalmazza, akkor nem volnál kitéve a környezetnek.

Hasonlóképpen megoldás lehet képként - esetleg [e]ps/jpg/... - közvetítésével generálni a pdf-et, hogy végképp mindegy legyen az OS, a fontkészlet és a megjelenítő.

Debian 6.0, Adobe Reader 9.5.1, van "Cső"

Win XP, Adobe Reader 9, jól jelenik meg, azonban a szöveget kimásolva és Word-be beillesztve kalapos ő betűt kapok.

Win Xp, Google Chrome 22, jól jelenik meg és kimásolva is jó.

W8 alatt MuPDF: nem jó, PDF-XChange Viewer: OK, Adobe termék pedig sajna nincs

"vállalat irányítási rendszer generál." Itt van a kutya elásva, mégpedig hogy milyen beállítások mellett csinálja(?)... pl. fontok beágyazása, esetleg kódlap (?)

Update: Elsiklottam a leírtak mellett, az Arial beágyazva... Hmmm, itt lesz a gond.

A megnyitott dokumentum tulajdonságai között lehet megtekinteni a beágyazott betűtípusokat. Sajna, ez alkalmazásfüggő...

Évekkel ezelőtt felhagytam a szakmával, kissé halványak az emlékeim. Időnként elfordultak hasonló problémák, pl. amikor népszerű fontok többféle forrásból származó verzióját használták. Ezért is említettem a kódolást, lehet hogy más helyen van az Ő betű az említett készletben...

Hirtelen 2 tipp:
- ne legyen beágyazva. Ez kicsit rázos, mert nem tudni milyen környezetbe kerül az anyag.
- ha lehetőség van rá akkor a betűket görbeként tárolni. Hátrány a nagy fájlméret, rondább lehet a betűkép

PS:
A képként való generálás jó ötlet! Laser printnek tökéletes:
a, TIFF, B&W (bitmap), pl. G4 tömörítés, >600 dpi
b, EPS, fontok legörbítve

"Valószínű LX azért kérdezett vissza, mert pl. Evince pont azt írja a tulajdonságoknál, hogy NEM beágyazott az ArielMT."

kontra

"Az miből derül ki, hogy be van ágyazva?"

?

Evince 3.2.1 nincs kéznél, de kiváncsiságból bootoltam egy Live GnomeShell 3.6-ot, Evince File/Properties Font-fül szépen kiírja a dokumentumban használ betűket, beágyazva van-e a teljes vagy subset betűkészlet és ha nincs mivel helyettesíti.

Rossz infot közöltem PDF-XChange Viewer infoja alapján, OK. Software kukázva, részemről elnézést kérek.

MOST elégedett vagy?

Mielőtt elmentek rekontrán keresztül a csillagos égig, gyorsan színt vallok: a mc kukkolójával néztem bele nyersen (értsd: nem pdftotexttel kirenderelve), és csak referenciát láttam fontokra, de olyan tömbgyanús részeket, ami a két fontkészletet leírná nem - ami nem feltétlenül jelenti azt, hogy nincsenek is ott.

Különebn így utólag - elővéve a józan parasztit - lehettem volna kicsit erőszakosabb ;) : ezek a ttf-ek még gzipelve is 100K körüli méretűek egyenként, vagyis nagyon-nagyon-nagyon rafinált módszer* lett volna az, ami ilyen pici helyen engedi mindezt létezni.

* pl. kizárólag a valójában használt karakterek deszkriptorainak beágyazása, de ez is egy olyan dolog, amit lehet, hogy csak fantáziálok most, de valójában nem létezik.

Sorry, nyilván a leírt szövegnél a hangsúlyok nem úgy jönnek ki mindig, mint élő beszédnél. Nem akartam kötözködni, csak szimplán leírni, illetve ha valami más olvasóban úgy látod, akkor kíváncsi lettem volna rá. Evince is írhat hülyeséget.

A kommentekben tömören szeretek hozzászólni, ez lehet időnként nyersnek/troll-nak érződik, de nem ez volt a szándékom.

Nem biztos hogy kellneki, nálam nincs, de látom az ékezeteit.

root[TTF]# ls /usr/share/fonts/TTF/
D3Circuitism.ttf DejaVuSerif-Italic.ttf LiberationSerif-Regular.ttf
D3Euronism_b.ttf DejaVuSerif.ttf baloney.ttf
Darkh4.ttf DejaVuSerifCondensed-Bold.ttf deatkcv2.ttf
Darkhc.ttf DejaVuSerifCondensed-BoldItalic.ttf decocaps.ttf
Darkhe.ttf DejaVuSerifCondensed-Italic.ttf fonts.dir
Darkhi.ttf DejaVuSerifCondensed.ttf fonts.scale
Darkhs.ttf FreeSansBold.ttf luximb.ttf
DejaVuSans-Bold.ttf LiberationMono-Bold.ttf luximbi.ttf
DejaVuSans-BoldOblique.ttf LiberationMono-BoldItalic.ttf luximr.ttf
DejaVuSans-ExtraLight.ttf LiberationMono-Italic.ttf luximri.ttf
DejaVuSans-Oblique.ttf LiberationMono-Regular.ttf luxirb.ttf
DejaVuSans.ttf LiberationSans-Bold.ttf luxirbi.ttf
DejaVuSansCondensed-Bold.ttf LiberationSans-BoldItalic.ttf luxirr.ttf
DejaVuSansCondensed-BoldOblique.ttf LiberationSans-Italic.ttf luxirri.ttf
DejaVuSansCondensed-Oblique.ttf LiberationSans-Regular.ttf luxisb.ttf
DejaVuSansCondensed.ttf LiberationSansNarrow-Bold.ttf luxisbi.ttf
DejaVuSansMono-Bold.ttf LiberationSansNarrow-BoldItalic.ttf luxisr.ttf
DejaVuSansMono-BoldOblique.ttf LiberationSansNarrow-Italic.ttf luxisri.ttf
DejaVuSansMono-Oblique.ttf LiberationSansNarrow-Regular.ttf og.ttf
DejaVuSansMono.ttf LiberationSerif-Bold.ttf whatever.ttf
DejaVuSerif-Bold.ttf LiberationSerif-BoldItalic.ttf
DejaVuSerif-BoldItalic.ttf LiberationSerif-Italic.ttf

root[TTF]#

Opera alatt a googledocs-ban nézve sincs hosszú ő.
Szerintem az oprendszerbe telepített ttf fontokban lehet a hiba, van néhány dózer font, amit küön fel szoktam rakni nem dózer rendszerekre, akkor mennek a dolgok.

Letöltém, majd megnyitám:

---evince: nincs ő
---xpdf: nincsenek betűk
---foxitreader: VAN ő.

Valami FPDF 1.53-mal írták a pédéefet, két Ansi kódolású ariallal.

Szerintem rakd fel a foxitreadert, valaki itt javasolta nekem régebben, azóta mindent meg tudok enni.

http://www.foxitsoftware.com/downloads/

---
--- A gond akkor van, ha látszólag minden működik. ---
---

Az Okular a Files->Properties alatt megmutatja, melyik font fájlt akarja használni. Nálam valami Type1-eseket, úgyhogy csak "cs" van cső helyett.

Ez a type1 segített.

Valamelyes bejött a prioritástippem: innen kiderült, hogy a type1-es világban a Nimbus Sans L az Arial a.k.a. Helvetica neve, amit nálam a /usr/share/fonts/type1/gsfonts/n0190* fájlok írnak le.
Ezeket száműzve innen, majd futtatva egy fc-cache -f parancsot az evince rájön, hogy tkp. szereti ő a TTF Arialját.
Az xpdf viszont menthetetlenül soviniszta.

nem olvastam végig az összeset, csak ránézésre senki se vette észre, hogy az adott PDF Arial betűtípust használ. PDF-éknél pedig dinamikusan van betöltve a rendszerből a hivatkozott fontok.
ha ez az adott rendszeren nincs/nem elérhető, akkor csúnya a magyar specifikus karakter, egyébként jó.
ennyi.
_______
16,67 %

Lehet hogy hülyeség, de mi van akkor ha Arial helyett valami más betűtípust használnátok?
Palatino Linotype, vagy LinuxLibertine például...
Ez most csak ötletelés, nem ismerem a .pdf-ek lelkivilágát túl mélyen.

Viszont az, hogy ilyesmi előfordulhat őszintén szólva meglep. Egész idáig azt hittem, a .pdf azért olyan jó kis fájlformátum, mert bárhol nyitja meg az ember ugyan-úgy néz ki, akár vannak az adott rendszeren a használt betűtípusok, akár nem, és személy szerint nekem még problémám nem volt vele - pedig használok pár eléggé egzotikus betűtípust is a munkám során. Vagy valamit félreértek?

----------------
(:> )B

Üdv!

Hasonló problémával szívtam én is a napokban.
Ami nálam segített megoldani:
- a PDF-be beágyaztam a fontot,
- a PDF-be való konvertáláskor a True Type font Type1-re való konvertálását ki kell kapcsolni.
Ezek után már minden PDF megjelenítővel tökéletes volt az eredmény.

========
fkoppany

Köszönöm mindenkinek a tippeket és az információkat, jövő héten kiderül mire jutunk.