pdf vagy djvu

Fórumok

Kezemben van egy több oldalas nyomtatott dokumentum, melyből hordozható változatot kéne készítenem. A kérdés az hogy miként kezdjek neki, mivel ilyennel még ebben a formában nem volt dolgom.
Azt sem tudom hogy több oldalas pdf-et hogyan tudnék összehozni, meg egyáltalán pdf legyen-e vagy djvu. Úgy tudom az utóbbi nyílt forrású cucc.
Scanner van. Most első körben beszkennelem jó minőségben. S utána? Linuxban az okular például simán megnyitja a djvu fájlokat is de mi a helyzet Windows téren. Az Adobe acrobat reader is kezeli, vagy az csak pdf és punktum?

Hozzászólások

Kíváncsi vagyok a hozzászólásokra. Feliratkoztam.

:)

pdf-et is tudsz generálni openszósz lomokkal.

Tudtommal a djvu-t kifejezetten erre afeladatra javasolják (azaz szkennelt dokumentumok elektronikus kezelésére). Tudtommal az Acrobat nem olvassa, ilyen módon Windows alatt némileg kevésbé természetes a használata, de természetesen mellkelhetsz egy linket egy letölthető djvu-olvasóhoz.

Majdnem igaz, de a djvu szimpla szkennelt oldalaknál mutatkozó előnye a PDF 1.5-ös verziójában megjelent JPEG2000 támogatással gyakorlatilag szertefoszlott, így én ilyen feladatnál biztos, hogy inkább a PDF-re szavaznék, márcsak elterjedtség okán is.

Ha van elég szabad hely a merevlemezen, én biztos, hogy TIFF-be szkennelnék, esetlegesen egy kis korrekció utólag, és a végén önteném PDF-be. (Erre megoldás pl. az imagickkel JPEG2000-be tömöríteni, aztán img2pdf-fel [https://github.com/josch/img2pdf] a .jp2-ket egy PDF-be önteni.)

(A nyílt forrást formátum esetén nem igazán tudom értelmezni, de a PDF teljes dokumentációja szabadon elérhető.)

Csináltam egy tesztet egy régi anyagomból: 28 A/5-ös oldal 800 dpi-s bitmapekben (nyomdai célra készült, ezért ekkora). A fájlokat importáltam egy InDesign fájlba, és onnnan exportáltam PDF-be. A djvu-fájlt az eredeti tiffekből linux alatt cjb2-vel konvertáltam djvu-kba, aztán djvm-mel raktam össze egybe.
A djvu fájl 633 KB, a PDF CCITT Group 4-es tömörítéssel 1,1 MB lett. Viszont ezt kinyitva Acrobatban, és újramentve veszteségmentes JBIG tömörítéssel már csak 759 KB. Ha odafigyelek, és minden szemetet kidobálok, lecsökkenthető 749 KB-ra.
https://docs.google.com/a/portmed.hu/folderview?id=0B-CERbYTW8zlZllQLU1…

Windowsra Adobe helyett Sumatra.
Olvas: PDF, ePub, MOBI, CHM, XPS, DjVu, CBZ, CBR dokumentumokat.

Linux alatt gscan2pdf szkennel pdf-be

PDF akkor szerencsés, ha PC-n szerkesztett dokumentumot kell "elektronikus papír" formában publikálni.

DJVU pedig akkor szerencsés, ha papírról szkennelt dokumentumot kell elektronikus formába hozni, elektronikus formában megosztani.

én pdf-x viewer-t használok win alattt.többnyire cad-es rajzokra, belejegyezetélsre,stbstb. nem mindegy hogy mennyire gyors!:D
pdf, azért jobb mert ott a pdf-a. mint archív formátum szabvány.
djvu szerintem annyira nincs a köztudatban, átlagembereknél.

Én beolvasnám simple-scannel, és PDF-be menteném (amíg folyamatosan olvasod be az oldalakat, egy dokumentumba menti). Ennél egyszerűbb megoldás nincs.
___
Arany János: Grammatika versben

Ha az a több oldal csak néhányszor tíz, akkor szerintem a pdf jó választás lehet, valamelyest hordozhatóbb :) Könyv terjedelmű, szövegorientált anyagot már inkább érdemes lehet djvu-ba pakolni, bár az újabb pdf szabványokhoz képest nem sokkal lesz kisebb, de tapasztalatom szerint gyorsabban renderelődik mondjuk egy tableten vagy más gyengébb gépen. Hátránya, hogy az egységsugarú user nem feltétlen fogja tudni, hogy mit kell vele csinálnia, ha meg akarja nézni, és nincs társítva hozzá program :)
Amúgy pedig én calibre-t javaslom még, előállítod pdf-ben a doksit, behúzod a calibre gyűjteménybe, majd a kívánt e-book formát előállítod vele, amikor az kell.

Ez nem a calibre álláspontja, hanem az enyém. És az előttem szólóhoz hasonlóan úgy látom/tapasztaltam, hogy a lényeg ilyen esetekben az, hogy az anyag beágyazott képek sorozata, ergo teljesen mindegy, hogy az pdf-ből jön, vagy egy mappából, viszont kényelmesebb így konvertálni. Egyébiránt a más e-book formátum ilyen esetben célszerűen a djvu, a többi nem lesz túl praktikusan használható.
Szöveges-vektoros-ábrás összetett pdf dokumentumot tényleg nem célszerű konvertálni, ha rendelkezésre áll más forrásformátumban is.

Ha a tényleges fájlméret csökkentés a cél, akkor javaslom ocr programmal is a djvu használatát, met ha csak fekete fehér a dokumentum, akkor rá lehet ereszteni egy javító függvényt amivel a képek mérete jelentősen csökkenthető, emellett kereshető, indexelhető és tartalomjegyzékkel is ellátható lesz a kapott anyag:
http://jwilk.net/software/ocrodjvu

vagy

https://github.com/torinaki/ebooks-tools

esetleg,

https://github.com/quillkiragimmy/djvuocr

Az első és az utolsó, ha nem fejlődött sokat az elmúlt két évben akkor csak angolul tud. Az ó-ból gyönyörűen készít hatosokat, ő, ű, meg egy ilyen idézőjel: ” és alatta || lesz stb. Néha betalál még néhány special karakter, fogalmam sincs honnan mert az eredetiben nincs. Olyan sikeres, hogy az autokorrektor sem eszi.
☼☆♫♪♫♪☆☼
AGA@
Fork portal és az egyik logóm :)

Nos a dokumentum elkészült. A djvu mellett döntöttem annál is inkább mert sok minden más mellett elolvastam ezt is: http://ki.oszk.hu/kf/kfarchiv/2006/1/hajnal-ward.html
A 21 oldalas djvu 4.7MB lett.
A gimp xsane párossal dolgoztam, és a 300 dpi-s színes xfce-ket ppm formátumba exportáltam. A fekete-fehéreket pbm-be. Persze exportálás előtt mindegyiknél lecsökkentettem a színeket a poszter móddal. Ezután már csak a djvu fájlokat kellett létrehoznom. A fekete-fehéreket a cjb2, a színeseket a cpaldjvu-val készítettem.
A végén meg a djvm-mel összefűztem. Mindazonáltal a szkenneléssel együtt kb 2 órát vett igénybe.

Nem lehet mindkettő?
Majd eldönti a fogadó fél, hogy melyiket nyitja meg.

Fuszenecker Róbert