PDF áttördelése

 ( skynetpro | 2006. április 17., hétfő - 22:33 )

Abban szeretném a segítségeteket kérni, hogy hogyan lehetséges PDF dokumentumokat újratördelni. Ugyanis van néhány pdf ebookom amiket borzasztó kényelmetlen kisebb felbontáson olvasni (pda) mert scrollozni kell jobbra-balra.
Néztem a pda-s acrobat readert és nem tud ilyesmit.

sajnos a linuxos acroreaddal sem jött össze.

Hogyan lehetne ezen segíteni? Van erre valami trükk?

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

nincs

Zsiraf

p.s.: a pdf "lapleiro" nyelv (kicsit felturbozott PS)

Azért nem teljesen reménytelen. Próbáld meg a pdfnup-pal, ha az orientation-t is változtatod, elérhető, hogy összenyomja az oldalakat, és csak 1-et hagyjon egy lapon. Esetleg még jól jöhet a pdftk is, de lehet trüközni pstoedit-el is, az is érti a pdf-eket, csak a beágyazott képeket nem szereti. És végső soron konvertálhatod ps-be, amit megintcsak számtalan tool-lal lehet piszkálni - aztán ps2pdf-el meg visszaalakítani. Persze egyik sem tökéletes, de ha csak egyszerűen PDA-n akarod olvasni, szerintem némi kísérletezés után elfogadható megoldást lehet találni.
Batyu'

A pdfnup nem ujratordeli hanem egy fizikai oldalra tobb oldalt rak. A problema ezzel kb ugyanaz, habar scroll-ozni nem kell, de a lekicsinyitett oldalakat nem fogja tudni konnyezes nelkul olvasni... ;-)

Zsiraf

p.s.: No mindegy... A lenyeg, hogy "ujratordelni" se ps-t se pdf-t nem lehet...
p.s.2: persze a cim, telleg mast mond mint a szoveg...

j2sdk +
www.lowagie.com/iText/
+ 5 perc :D

Generates a PDF document with a custom pagesize and backgroundcolor
http://itextdocs.lowagie.com/examples/com/lowagie/examples/general/CustomPageSize.java

vagy

Generates a PDF document with the default page size and some other predefined standard pagesizes
http://itextdocs.lowagie.com/examples/com/lowagie/examples/general/DefaultPageSize.java

Köszi a válaszokat. Ezt megnézem...

Bocsi, de ezt még mindig nem értem igazán (lehet én vok béna)
Segítenél egy kicsit?

Meglepodnek, ha tudna segiteni... Baratunk valoszinuleg nagyon feluletesen olvas ;-) De mielott belemerulnel, talan ezt megnezve eldontheted, van e erre szukseged:

iText Homepage
Project description

iText is a library that allows you to generate PDF files on the fly.

The iText classes are very useful for people who need to generate read-only, platform independent documents containing text, lists, tables and images. The library is especially useful in combination with Java(TM) technology-based Servlets: The look and feel of HTML is browser dependent; with iText and PDF you can control exactly how your servlet's output will look.

Zsiraf

Most ez "szét tudja szedni" a pdf-et és újra (más oldalmérettel) létre tudja hozni? Mert ok hogy javas pdf library de nekem ez kellene.

és nem rtfm mert elolvastam

Igen. :D

Nem csak szétszed, de semmiből is csinál... :D

Vízjelet teszel alá, letitkosítod, beleírsz új objecteket, bármi, amit implementáltak. :D Kérdés ez az ágyú-veréb esete-e ? :D

Nem csak szétszed,
Ezt meg honnet veszed???

Akar hogy is olvasom, nezem en legfoljebb ilyet talalok:

Can I read an existing PDF-document with iText? Can I use a template PDF and fill it with data?
You can extract complete pages of an existing PDF document and copy them to a newly created PDF document. You could use this to add pagenumbers or to combine different small PDF into one large document (or just the opposite). You can also use iText to fill in the fields of an AcroForm. This is (or will be) explained in the tutorial. 

Szoval semmi szetszedes...

Mashol meg a kovetkezoket allapitja meg:

Is it possible to parse an existing PDF-document and convert it to another format (HTML, DOC, EXCEL)?

No, the pdf format is just a canvas where text and graphics are placed without any structure information. As such there aren't any 'iText-objects' in a PDF file. For instance: you can't retrieve a table object from a PDF file. Tables are formed by placing text and lines at selected places. 

Kb. ez azt mondja, amit en is probaltam mar megmagyarazni... csak mas oldalrol, mas aspektusban...

Zsiraf

p.s.: amugy szerkesztettel mar pdf file-t Adobe Acrobat-tal? Nem? Akkor nem is emlekezhetsz ra, hogy nincsenek bekezdesek, szavak, mondatok, csak betuk/betucsoportok...

p.s.2: de ha tudod, hogyan lehet iText-ben megoldani, legyszi...

Ad 1: Fejet hajtok :D
http://itextdocs.lowagie.com/docs/com/lowagie/text/Paragraph.html
A Paragraph is a series of Chunks and/or Phrases.

Ad 2: Arra kérsz, írjam meg iText-ben a kérdező problémáját ? :)

Ad 3: Légyszi :)
http://itextdocs.lowagie.com/examples/com/lowagie/examples/general/HelloWorld.java

import java.io.*;
import com.lowagie.text.*;
import com.lowagie.text.pdf.PdfWriter;
public class HelloWorld {
/** Generates a PDF file with the text 'Hello World' */
        public static void main(String[] args) {
                System.out.println("Hello World");
                Document document = new Document();
                try {
                        PdfWriter.getInstance(document,new FileOutputStream("HelloWorld.pdf"));
                document.open();
                document.add(new Paragraph("Hello World"));
                } catch (Exception e) {
                        System.err.println(e.getMessage());
                }
                document.close();
        }
}

Ecsem! Te igy szulettel, vagy ezt (nem)tanultad?? Amit olvasol, azt te meg is szoktad erteni?

1.: Megegyszer idezem az iText FAQ-jat, kerlek olvasd figyelmesen: ... As such there aren't any 'iText-objects' in a PDF file...

Vilagos?? Ideidezzem megegyszer?? Megertetted??? NINCS iText PARAGRAPH egyik pdf-ben sem Akarhogy is kezeli a paragraph-okat az iText, egy pdf-filebol nem tudja kiszedni "oket", mert nincsenek benne, tehat nem is tudja ujratordelni. pont.

2.: legalabbis vazold, hogyan tordelnel ujra egy pdf file-t...

3.: a peldaprogram arrol szol, hogy egy "hello world" tartalmu dokumentumot letrehozz... Ennek mi koze a problemahoz???

Zsiraf

p.s.: lattal mar ps "dokumentumot"??? Nem, akkor ajanlom nezz meg kozelebbrol egyet:

%!PS-Adobe-2.0                                                                  
/Courier findfont 24 scalefont setfont                                                                                          
230.4 72 moveto (!) show                                                        
216 72 moveto (d) show                                                          
86.4 72 moveto (e) show                                                         
72 72 moveto (H) show                                                           
201.6 72 moveto (l) show                                                        
100.8 72 moveto (l) show                                                        
115.2 72 moveto (l) show                                                        
129.6 72 moveto (o) show                                                        
172.8 72 moveto (o) show                                                        
187.2 72 moveto (r) show                                                        
158.4 72 moveto (w) show                                                        
showpage                                                                        
quit                                                                            

Legyszi mond mar meg, hogy hol vannak a szavak hatarai?

p.s.2: mielott meg kikelnel a PostScript ellen, felhivnam a figyelmedet, hogy a PortableDocumentFormat es a PostScript ezen a szinten egyaltalan nem kulombozik egymastol...

OK. Részben lehet. :)

Elöljáróban : Semmi bajom a PS-sel. :D

Nem tudom, az e-bookok ilyenek-e : tagged
Továbbá van a misztikus : reflow.api az acrobat pluginben, amit talán meg lehet támadni. Illetve itt lehet barátkoznivele.

forumlevél de ja'vue

>If I read in a pdf document that has the ability to reflow (eBook 
>functionality) when I write it back out using iText - I lose this 
>functionality. Is this an XML-well-fromed tag issue or is this a feature 
>of 'tagging' a PDF document? Am I asking the same question? Who am I?

         Only PDFs that are "tagged" are able to be reflowed.

         If you are using the PdfCopy features of iText, then that tagging 
information is not copied as part of that process...However, PdfStamper 
should work fine on tagged PDFs

No, a reszben, az elegge reszben :-)

A forumlevelben arrol van szo, hogy ha PdfCopy-val hasznalja a letezo pdf file lapjait, akkor az emlegetett TAG-ek elvesznek... A valaszado azt mondja, hogy ez igy van, viszont a PdfStamper megorzi ezeket. A PdfStamper, viszont csak arra ad lehetoseget, hogy a letezo szoveg "ala" illetve "fole" helyezhetunk dolgokat, azaz watermark-ot, illetve stamp-et lehet elhelyezni a lapokon... Meg persze oldalszamot, megjegyzest az ures helyekre ;-) (jo, meg AcroForm-ot is ki lehet tolteni vele :-))

Magat a reflow-t (ujratordelest) nem lehet elvegezni az iText-ben belul, ezt az adott file-nal az eBook reader csinalja!!!! Ha csinalja...

Zsiraf

Próbáld ki a pdftohtml-t vagy a xpdf-ben levő pdftotext-et.
Azokkal átkonvertálva már lehet egyszerűbb a tördelést megoldani.

Köszi!
a pdftohtml elég jónak tűnik, de most még böngészem a man-t hogy hogyan varázsoljak ő és ű betűket...

Szerk.: sikerült!
pdftohtml -enc UTF-8 -noframes A_boszorkanymester.pdf

Köszi mindent!
/Most egy for i in $(ls -1 *.pdf); do ... jön :D /

A pdf to html elég érdekes dolgokat tud csinálni, lévén, hogy div-et/spant pozícionál.
Sok sikert hozzá :)

Esetleg megpróbálhatod a kword-öt, ha KDE-t használsz, az tud importálni pdf-et, utána pedig azt csinálsz vele, amit csak akarsz. A képek pozícionálását nem mindig jól csinálja, de hát átteheted őket kézzel... Végül pedig akár pdf-be is nyomtathatod... :-)