pdf "intelligens" átnevezés hogyan?

Fórumok

sziasztok!

beszereztem ma 130 könyvet pdf formátumban (gépelt, nem szkennelt), a problémám vele viszont az, hogy a fájlnevek nehezítésként nem is rendre [ötjegyű szám].pdf, pontos szerző-cím listám sincs. feltételezem, a pdf-ben valahol nyilván van tartva a szerző és a cím, [feltételezem, hogy helyesen címkézték őket, mindegyik igényes munka ugyanabból a forrásból], és szeretném elérni, hogy a fájlnevekben szereplő ötjegyű szám lecserélődjön mondjuk erre: [author] + " - " + [title]

remélem, érthető a problémám. ötletem nincs, hogy hogy kezdjek neki. 130 könyvről beszélünk, szóval ez már bőven túl van azon a határon, ameddig nekiesnék kézzel.

Hozzászólások

na aszongya: $ man pdfinfo

Pdfinfo prints the contents of the ´Info’ dictionary (plus some other
useful information) from a Portable Document Format (PDF) file.

The ´Info’ dictionary contains the following values:
title
subject
keywords
author
creator
producer
creation date
modification date

tehát benne vannak a keresett információk. nézegetem a kapcsolókat, de nem nagyon látom, hogy hogy tudnám ezeket elérni. ha paraméternek egy pdf-et adok meg neki, akkor nem listázza (még úgy se, hogy head-tailes trükközéssel tudjam kezelni).

:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog

130 könyvet átnevezni, ha te nyitod meg akkor kb. 2 óra ha percenként 1 könyvet nevezel át. Ha ennél többet is tudsz egy perc alatt átnevezni, akkor már csak pl. 3/4 óra, ha 3 könyvet nevezel át 1 perc alatt.

Végülis megéri 1-2 órát programozni hogy utánna csak egy script fusson le. :D

ha ki lennének töltve rendesen a tag-ek, akkor nem kéne órákat programozni, csak max. 2 perc alatt összeütni egy bashscriptet pdfinfo-val, mv-vel, head-del, tail-lel és sok pipe-pal.

:: by BRI.
:: config :: Acer TravelMate // Ubuntu Intrepid
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog

jelen esetben nem a szkrip/programozói képességeken múlik, hanem a pdf-ek tartalmán, szkennelt doksival is egyszerűbb lehet néha, mint egy gépelttel amiben mondjuk hiába kresed a szerzőt nem találod (és attól még hogy szekennelt, lehet hogy a pdf készítésekor belekült ocr-el a szöveg is, adobebal már csináltam, még keresni is lehet benne)

Mennyire hasonlóak ezek a dokumentumok? Ha az első oldalakon hasonlóan (hasonló helyen és elrendezésben, vagy nagy betűmérettel, stb.) szerepel a szerző és a cím, arra már lehet építeni.

Végső esetben először kiíratod egy állományba (

out.txt

) az első néhány oldalon lévő szövegeket + az állományok neveit. Aztán kézzel kitörlöd azokat a részeket, ami nem tartozik a szerző-cím-állománynév hármasba. Végül az így létrejött táblázat (

out.txt

) alapján átnevezteted a dokumentum-állományokat.

Vagy kiíratod a dokumentumok neveit egymás alá egy állományba (

out1.txt

). A megfelelő parancs(ok) segítségével az

out1.txt

felhasználásával egyenként megnyittatod az összes dokumentumot (egyszerre csak egy van megnyitva, amikor bezárod a megnyitottat, automatikusan nyílik a következő). Létrehozol egy új állományt (

out2.txt

), és kézzel belemásolod a szerzőt és a címet a megnyitott dokumentumból (minden szerző-cím párost új sorba). Amikor végeztél, mented az

out2.txt

-t, aztán az

out1.txt

-t és az

out2.txt

-t felhasználva a megfelelő parancsokkal átnevezteted a dokumentum-állományokat. Ez a módszer tűnik a legkiegyensúlyozottabbnak az észmunka és a rabszolgamunka arányát tekintve. Majdnem ugyanaz, mintha egyenként neveznéd át az állományokat. Talán egy kicsit lassabb, ha nem rázod ki a kisujjadból (vagy akárhonnan), melyik parancsokat célszerű használni. Némi tanulást és biztos sikert ígér. :D

:)