sziasztok!
beszereztem ma 130 könyvet pdf formátumban (gépelt, nem szkennelt), a problémám vele viszont az, hogy a fájlnevek nehezítésként nem is rendre [ötjegyű szám].pdf, pontos szerző-cím listám sincs. feltételezem, a pdf-ben valahol nyilván van tartva a szerző és a cím, [feltételezem, hogy helyesen címkézték őket, mindegyik igényes munka ugyanabból a forrásból], és szeretném elérni, hogy a fájlnevekben szereplő ötjegyű szám lecserélődjön mondjuk erre: [author] + " - " + [title]
remélem, érthető a problémám. ötletem nincs, hogy hogy kezdjek neki. 130 könyvről beszélünk, szóval ez már bőven túl van azon a határon, ameddig nekiesnék kézzel.
- 2162 megtekintés
Hozzászólások
pdfinfo-t nézd meg!
--
Debian - The "What?!" starts not!
http://nyizsa.uni.cc
- A hozzászóláshoz be kell jelentkezni
ó. hálám a sírig.
:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog
- A hozzászóláshoz be kell jelentkezni
na aszongya: $ man pdfinfo
Pdfinfo prints the contents of the ´Info’ dictionary (plus some other
useful information) from a Portable Document Format (PDF) file.
The ´Info’ dictionary contains the following values:
title
subject
keywords
author
creator
producer
creation date
modification date
tehát benne vannak a keresett információk. nézegetem a kapcsolókat, de nem nagyon látom, hogy hogy tudnám ezeket elérni. ha paraméternek egy pdf-et adok meg neki, akkor nem listázza (még úgy se, hogy head-tailes trükközéssel tudjam kezelni).
:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog
- A hozzászóláshoz be kell jelentkezni
Nekem a pdfinfo valami.pdf szépen kilistáz mindent, ami ki van töltve. Ami üres, azt kihagyja. Szóval szerintem nem lesz könnyű dolgod. :((
--
Debian - The "What?!" starts not!
http://nyizsa.uni.cc
- A hozzászóláshoz be kell jelentkezni
Így van. Megnéztem, tényleg nincs rendesen kitöltve. Akkor storno. Nem létező információból létezőt gyártani így még nem tudok. :(
:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog
- A hozzászóláshoz be kell jelentkezni
Ha a mesterséges intelligencia nem jön be, akkor marad a szénalapú.
- A hozzászóláshoz be kell jelentkezni
ühüm. majd minden nap megcsinálok tizet. két hét, és végzek. a hetedik napon majd megpihenek.
:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog
- A hozzászóláshoz be kell jelentkezni
130 könyvet átnevezni, ha te nyitod meg akkor kb. 2 óra ha percenként 1 könyvet nevezel át. Ha ennél többet is tudsz egy perc alatt átnevezni, akkor már csak pl. 3/4 óra, ha 3 könyvet nevezel át 1 perc alatt.
Végülis megéri 1-2 órát programozni hogy utánna csak egy script fusson le. :D
- A hozzászóláshoz be kell jelentkezni
ha ki lennének töltve rendesen a tag-ek, akkor nem kéne órákat programozni, csak max. 2 perc alatt összeütni egy bashscriptet pdfinfo-val, mv-vel, head-del, tail-lel és sok pipe-pal.
:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog
- A hozzászóláshoz be kell jelentkezni
eddig mennyi időt fordítottál erre? (ide gépelés stb, kézzel az a két óra szerintem fél)
:)
- A hozzászóláshoz be kell jelentkezni
viszont az fabaltas muvelet lenne, mig a szkriptet megirni ujjgykorlat, vagy komoly programozas (kinek mi). En is az utobbit valasztanam ;-)
- A hozzászóláshoz be kell jelentkezni
jelen esetben nem a szkrip/programozói képességeken múlik, hanem a pdf-ek tartalmán, szkennelt doksival is egyszerűbb lehet néha, mint egy gépelttel amiben mondjuk hiába kresed a szerzőt nem találod (és attól még hogy szekennelt, lehet hogy a pdf készítésekor belekült ocr-el a szöveg is, adobebal már csináltam, még keresni is lehet benne)
- A hozzászóláshoz be kell jelentkezni
Mennyire hasonlóak ezek a dokumentumok? Ha az első oldalakon hasonlóan (hasonló helyen és elrendezésben, vagy nagy betűmérettel, stb.) szerepel a szerző és a cím, arra már lehet építeni.
Végső esetben először kiíratod egy állományba (
out.txt
) az első néhány oldalon lévő szövegeket + az állományok neveit. Aztán kézzel kitörlöd azokat a részeket, ami nem tartozik a szerző-cím-állománynév hármasba. Végül az így létrejött táblázat (
out.txt
) alapján átnevezteted a dokumentum-állományokat.
Vagy kiíratod a dokumentumok neveit egymás alá egy állományba (
out1.txt
). A megfelelő parancs(ok) segítségével az
out1.txt
felhasználásával egyenként megnyittatod az összes dokumentumot (egyszerre csak egy van megnyitva, amikor bezárod a megnyitottat, automatikusan nyílik a következő). Létrehozol egy új állományt (
out2.txt
), és kézzel belemásolod a szerzőt és a címet a megnyitott dokumentumból (minden szerző-cím párost új sorba). Amikor végeztél, mented az
out2.txt
-t, aztán az
out1.txt
-t és az
out2.txt
-t felhasználva a megfelelő parancsokkal átnevezteted a dokumentum-állományokat. Ez a módszer tűnik a legkiegyensúlyozottabbnak az észmunka és a rabszolgamunka arányát tekintve. Majdnem ugyanaz, mintha egyenként neveznéd át az állományokat. Talán egy kicsit lassabb, ha nem rázod ki a kisujjadból (vagy akárhonnan), melyik parancsokat célszerű használni. Némi tanulást és biztos sikert ígér. :D
:)
- A hozzászóláshoz be kell jelentkezni