OCR app (PDF)

Fórumok

Üdv!

Linux alatt van működő OCR app (PDF-ből felimserésre)? A yagf app-ot próbáltam (F22 x64), de a Recognize funkció nem működik, igaz a beolvasott PDF-et nem is látja - a lapokat üresnek mutatja. Nem kezeli rendesen a PDF formátumot(?).

Hozzászólások

Nagy ritkán ha ilyen kell, akkor a gImageReader-t használom, backend-nek tesseract-ot használ (korábbi azt hiszem IBM fejlesztés, aztán kidobták nyílt forrásúra) és eddig egész korrektnek tűnt.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

A yagf cuneiform mellett tesseract-ot is használ, ha beállítod neki. De ha nem is látod a pdf-et, akkor lehet, hogy bugos a csomag. Esetleg csinálj belőle képszekvenciát, és azt etesd meg a yagf-al.
szerk: ránéztem, nálam default a tesseract, viszont nem az a magyar nyelv.

ABBYY FINEREADER 9.0724 PRO PORTABLE

a fenti program wine alatt remekül működik....szeméyl szerint nagyon sokmindent végigpróbáltam linux alatt ez vált be legjobban...amikor még használtam windowst akkor is ennek segítségével szkenneltem/konvertáltam könyveket (100-on felül)....a szkennerből /nyomtatóból való beolvasást nem tudtam megoldani (windowson twain-t használ és egyből beolvassa felismeri a beszkennelt cuccot) de nem görcsöltem beszkennelem más programmal - képformátumba vagy pdf-be mentem és megnyitom a fenti programmal...hivatalosan is létezik fizetős linuxos változata egyébiránt..de kisebb/ritkább feladatokra kiváló ez...a linuxon az ocr eléggé elhanyagolt terület szerintem...pedig ha bizonyos intézmények (pl könyvtárak, iskolák stb) gondolkodnak átálláson nyílt forrásra abszolút növelné a szimpátiát..szerintem...

Csak djvu-n próbáltam, de a tesseract egész jó eredményt produkált. Csak kell hozzá valami wrapper (djvu-hoz az ocrodjvu van).