Egy ideje kivágta az Abbyy a FineReader Pro mobil appja alól a felhős OCR-t. Egyszer volt csak akcióban utána permanensen 20 ezer felett árulta. Ezért is pitiáner dolognak tartom, hogy megszüntették a fizetős appjuk legfontosabb képességét.
Mobil kamerával pillanatok alatt be lehetett fotózni (scannelni) akár egy sok oldalas doksit, általában jól találja el a lap széleit, de ha nem ezt gyorsan lehet kézzel korrigálni. Egybefűzi az egészet pdf-be, majd innen mehetett a Recognize. Tudott mindenféle formátumot docx-től rtf-ig, de mindig maradtam a PDF-nél. Így megmaradt az eredetileg scannelt képe az oldalaknak, de a betűk már kereshezővé, copy-pastelhetővé váltak. Hasonló appokat bőven lehet találni, de az OCR pontosság nem túl jó.
Van valamilyen jó app erre a feladatra? Még az is megfelelne ha nem mobil app lenne hanem PC program, ami a megadott PDF-et OCR-ezi megtartva az eredeti oldalakat.
- 780 megtekintés
Hozzászólások
Háát... én megvettem a Readiris 17-et. Nem használom lyukasra, viszont működik. És kb. ~20,000 (kicsit felette), vagy több, ha corporate. Ingyenest nem tudok.
Ja, jut eszembe a Microsoft Lens igen jó volt papírok szkenneléséhez, de nekem pont nem telefonra kellett a cucc.
- A hozzászóláshoz be kell jelentkezni
Köszi a választ. Nem rossz a Readiris 17. OCR minősége, azaz mennyire pontos, mennyit hibázik hogyan viszonyul az Abbyy FineReader Pro-hoz (ha azt is használtad korábban)?
Kézírást, akár magyar nyelvűt is fel tud ismerni pontosan?
- A hozzászóláshoz be kell jelentkezni
"Kézírást, akár magyar nyelvűt is fel tud ismerni pontosan?"
Szerintem nem: https://imgur.com/a/eICRCog
Nyomtatott szöveg esetén meg - nahát - sok múlik a scan minőségén: https://imgur.com/a/Jta595q
- A hozzászóláshoz be kell jelentkezni
Annyiban kiegészíteném, hogy a digitalizálás minőségén célszerű javítani. Meg szokta érni a befektetett munkát.
Ha gyenge papírra lett kétoldalasan nyomtatva, akkor át fog látszani a hátoldal. Ez kivédhető úgy, hogy a hátoldal mögé egy sötét lapot teszünk, ezzel nagyjából olyan lesz, mintha a hátoldal telibe lenne nyomtatva feketével, de legalább nem fog a szöveg egyenként átütni.
Illetve azt írják a bináris képeket jobban kedveli a tesseract. Ez imagemagick esetén a küszöbszint beállításával lehet elérni: -threshold 75%.
Ezt a tanácsot felülbírálva meg szoktam hagyni egy szűk átmenetet, pl: -white-threshold 80% -black-threshold 70%.
Normalizálás is ajánlott: https://imagemagick.org/script/command-line-options.php#normalize.
- A hozzászóláshoz be kell jelentkezni
FineReader pro teljesen leszoktatott a scannerről. Mobil kamerájával pillanatok alatt megvan több 10 oldal. Átlátszani nem szokott, viszont elmosódottabb ha felnagyítom. Engem nem zavar de tesseractot úgy látom igen. Pedig a Google könyvek millióit hasonló fényképezős módszerrel digitalizált, nyilván profibb kamerával mint ami mobilban van. Illetve bár kód szintjén azonos Tesseractot használnak, de belső, nem nyilvános OCR-modellek és tanítómintákkat használtak.
- A hozzászóláshoz be kell jelentkezni
Asztali:
https://www.naps2.com/
tesseract van mogotte
Ha csak PDF export elég es beleférsz a 25 oldalas limitbe, akkor Adobe Scan app.
- A hozzászóláshoz be kell jelentkezni
Adobe Scan app-nál is működik az a trükk, hogy egy tablónyi szuper felbontású oldalon a fél novella van?
- A hozzászóláshoz be kell jelentkezni
Passz, en nem hasznalom az ocr reszet egyaltalan, csak tudom, hogy tudja.
- A hozzászóláshoz be kell jelentkezni
Egy próbát megérhet: https://tools.pdf24.org/hu/ocr-pdf
A linken online, de van belőle offline verzió is, ingyenes. Képes kézzel írott szöveget is felismerni, de itt nem tudom, hogy mi számít jónak, majd eldöntöd...
A kürtőskalács egy nagy lyuk, tésztával faszán körbetekerve.
- A hozzászóláshoz be kell jelentkezni
"A chat nem található. Ha ezt valaki megosztotta veled, kérlek, kérd meg a küldőt, hogy kifejezetten küldjön egy megosztó linket."
- A hozzászóláshoz be kell jelentkezni
A mocsok! mindegy, megvan a login is, meg a promptot is elraktam, ha gépközelbe kerülök, fixálom!
https://grok.com/share/bGVnYWN5_a43bc1e4-0f18-471f-99ab-b066e49e09a5
de a tapasztalat az, hogy végig kell nézni az összes találtatát, mert legtöbbször álmodik az AI
- A hozzászóláshoz be kell jelentkezni