FineReader Pro alternatíva (PDF OCR)

Fórumok

Egy ideje kivágta az Abbyy a FineReader Pro mobil appja alól a felhős OCR-t. Egyszer volt csak akcióban utána permanensen 20 ezer felett árulta. Ezért is pitiáner dolognak tartom, hogy megszüntették a fizetős appjuk legfontosabb képességét. 

Mobil kamerával pillanatok alatt be lehetett fotózni (scannelni) akár egy sok oldalas doksit, általában jól találja el a lap széleit, de ha nem ezt gyorsan lehet kézzel korrigálni. Egybefűzi az egészet pdf-be, majd innen mehetett a Recognize. Tudott mindenféle formátumot docx-től rtf-ig, de mindig maradtam a PDF-nél. Így megmaradt az eredetileg scannelt képe az oldalaknak, de a betűk már kereshezővé, copy-pastelhetővé váltak. Hasonló appokat bőven lehet találni, de az OCR pontosság nem túl jó. 

Van valamilyen jó app erre a feladatra? Még az is megfelelne ha nem mobil app lenne hanem PC program, ami a megadott PDF-et OCR-ezi megtartva az eredeti oldalakat. 

Hozzászólások

Háát... én megvettem a Readiris 17-et. Nem használom lyukasra, viszont működik. És kb. ~20,000 (kicsit felette), vagy több, ha corporate. Ingyenest nem tudok.

Ja, jut eszembe a Microsoft Lens igen jó volt papírok szkenneléséhez, de nekem pont nem telefonra kellett a cucc.

Annyiban kiegészíteném, hogy a digitalizálás minőségén célszerű javítani. Meg szokta érni a befektetett munkát.

Ha gyenge papírra lett kétoldalasan nyomtatva, akkor át fog látszani a hátoldal. Ez kivédhető úgy, hogy a hátoldal mögé egy sötét lapot teszünk, ezzel nagyjából olyan lesz, mintha a hátoldal telibe lenne nyomtatva feketével, de legalább nem fog a szöveg egyenként átütni.

Illetve azt írják a bináris képeket jobban kedveli a tesseract. Ez imagemagick esetén a küszöbszint beállításával lehet elérni: -threshold 75%.
Ezt a tanácsot felülbírálva meg szoktam hagyni egy szűk átmenetet, pl: -white-threshold 80% -black-threshold 70%.

Normalizálás is ajánlott: https://imagemagick.org/script/command-line-options.php#normalize.

FineReader pro teljesen leszoktatott a scannerről. Mobil kamerájával pillanatok alatt megvan több 10 oldal. Átlátszani nem szokott, viszont elmosódottabb ha felnagyítom. Engem nem zavar de tesseractot úgy látom igen. Pedig a Google könyvek millióit hasonló fényképezős módszerrel digitalizált, nyilván profibb kamerával mint ami mobilban van. Illetve bár kód szintjén azonos Tesseractot használnak, de belső, nem nyilvános OCR-modellek és tanítómintákkat használtak. 

Egy próbát megérhet: https://tools.pdf24.org/hu/ocr-pdf

A linken online, de van belőle offline verzió is, ingyenes. Képes kézzel írott szöveget is felismerni, de itt nem tudom, hogy mi számít jónak, majd eldöntöd...

A kürtőskalács egy nagy lyuk, tésztával faszán körbetekerve.

A mocsok! mindegy, megvan a login is, meg a promptot is elraktam, ha gépközelbe kerülök, fixálom! 

https://grok.com/share/bGVnYWN5_a43bc1e4-0f18-471f-99ab-b066e49e09a5

 

de a tapasztalat az, hogy végig kell nézni az összes találtatát, mert legtöbbször álmodik az AI