FineReader Pro alternatíva (PDF OCR)

Segédprogramok

Egy ideje kivágta az Abbyy a FineReader Pro mobil appja alól a felhős OCR-t. Egyszer volt csak akcióban utána permanensen 20 ezer felett árulta. Ezért is pitiáner dolognak tartom, hogy megszüntették a fizetős appjuk legfontosabb képességét.

Mobil kamerával pillanatok alatt be lehetett fotózni (scannelni) akár egy sok oldalas doksit, általában jól találja el a lap széleit, de ha nem ezt gyorsan lehet kézzel korrigálni. Egybefűzi az egészet pdf-be, majd innen mehetett a Recognize. Tudott mindenféle formátumot docx-től rtf-ig, de mindig maradtam a PDF-nél. Így megmaradt az eredetileg scannelt képe az oldalaknak, de a betűk már kereshezővé, copy-pastelhetővé váltak. Hasonló appokat bőven lehet találni, de az OCR pontosság nem túl jó.

Van valamilyen jó app erre a feladatra? Még az is megfelelne ha nem mobil app lenne hanem PC program, ami a megadott PDF-et OCR-ezi megtartva az eredeti oldalakat.

787 megtekintés

Háát... én megvettem a Readiris 17-et. Nem használom lyukasra, viszont működik. És kb. ~20,000 (kicsit felette), vagy több, ha corporate. Ingyenest nem tudok.

Ja, jut eszembe a Microsoft Lens igen jó volt papírok szkenneléséhez, de nekem pont nem telefonra kellett a cucc.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszi a választ. Nem rossz a Readiris 17. OCR minősége, azaz mennyire pontos, mennyit hibázik hogyan viszonyul az Abbyy FineReader Pro-hoz (ha azt is használtad korábban)?

Kézírást, akár magyar nyelvűt is fel tud ismerni pontosan?

0 szavazat

A hozzászóláshoz be kell jelentkezni

"Kézírást, akár magyar nyelvűt is fel tud ismerni pontosan?"

Szerintem nem: https://imgur.com/a/eICRCog

Nyomtatott szöveg esetén meg - nahát - sok múlik a scan minőségén: https://imgur.com/a/Jta595q

0 szavazat

A hozzászóláshoz be kell jelentkezni

Annyiban kiegészíteném, hogy a digitalizálás minőségén célszerű javítani. Meg szokta érni a befektetett munkát.

Ha gyenge papírra lett kétoldalasan nyomtatva, akkor át fog látszani a hátoldal. Ez kivédhető úgy, hogy a hátoldal mögé egy sötét lapot teszünk, ezzel nagyjából olyan lesz, mintha a hátoldal telibe lenne nyomtatva feketével, de legalább nem fog a szöveg egyenként átütni.

Illetve azt írják a bináris képeket jobban kedveli a tesseract. Ez imagemagick esetén a küszöbszint beállításával lehet elérni: -threshold 75%.
Ezt a tanácsot felülbírálva meg szoktam hagyni egy szűk átmenetet, pl: -white-threshold 80% -black-threshold 70%.

Normalizálás is ajánlott: https://imagemagick.org/script/command-line-options.php#normalize.

1 szavazat

A hozzászóláshoz be kell jelentkezni

FineReader pro teljesen leszoktatott a scannerről. Mobil kamerájával pillanatok alatt megvan több 10 oldal. Átlátszani nem szokott, viszont elmosódottabb ha felnagyítom. Engem nem zavar de tesseractot úgy látom igen. Pedig a Google könyvek millióit hasonló fényképezős módszerrel digitalizált, nyilván profibb kamerával mint ami mobilban van. Illetve bár kód szintjén azonos Tesseractot használnak, de belső, nem nyilvános OCR-modellek és tanítómintákkat használtak.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Asztali:
https://www.naps2.com/
tesseract van mogotte

Ha csak PDF export elég es beleférsz a 25 oldalas limitbe, akkor Adobe Scan app.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Adobe Scan app-nál is működik az a trükk, hogy egy tablónyi szuper felbontású oldalon a fél novella van?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Passz, en nem hasznalom az ocr reszet egyaltalan, csak tudom, hogy tudja.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Egy próbát megérhet: https://tools.pdf24.org/hu/ocr-pdf

A linken online, de van belőle offline verzió is, ingyenes. Képes kézzel írott szöveget is felismerni, de itt nem tudom, hogy mi számít jónak, majd eldöntöd...

A kürtőskalács egy nagy lyuk, tésztával faszán körbetekerve.

0 szavazat