Képből szöveg ocr

Fórumok

A feladat a következő: több 100 jpeg képből szeretnék kereshető pdf, vagy doc fájlt előállítani. Van-e erre ingyenes linuxos alternatíva? Vagy egy egyszerű convert paranccsal csináljak belőle pdf-et és töltsem fel bármelyik online ocr alkalmazásba? A szöveg nem érzékeny (privacy tekintetében), tehát akár online megoldás is szóba jöhet.

Köszönöm a javaslatokat!

Hozzászólások

Szerkesztve: 2022. 05. 05., cs – 08:51

gscan2pdf nem szuper, de képböl kereshető pdf készitésre nekem eddig bejött. Betöltöd a képeket egyszerre es Tools menü, OCR menüpont majd a végén kimented pdf-be.

gImageReaderrel épp a napokban csináltam ilyet. Mondjuk nekem csak a képeken szereplő plain textre volt szükségem, de a program tud pdf kimenetet is.

Bocsi. Béna voltam. Két perc angol szöveg olvasásával és 3 csomag telepítésével meg is oldottam a problémát.

“The basic tool for the manipulation of reality is the manipulation of words. If you can control the meaning of words, you can control the people who must use them.”

― Philip K. Dick

https://www.pdf24.org/hu/

Én ezt használtam erre legutóbb, nekem nagyon bejött, behúzod az összes képet, rá nyomsz az "Indítás"-ra, és megcsinálja mindet, a végén PDF-be menthető a végeredmény.

anyam a kde-s okulart hasznalja erre, marmint pdf-ben levo kep szovegge alakitasara. kijeloli benne melyik reszet szeretne szovegkent a vagolapra tenni.

a hatterben lehet hogy egy ocr program is telepitve van, es az okular csak azt hasznalja.

neked aztan fura humorod van...

Szerkesztve: 2022. 05. 10., k – 14:42

sudo apt-get install ocrmypdf tesseract-ocr-hun

Ez pdf-ből pdf-et csinál és parancssoros.