Tesseract - nyílt forrású OCR program a Google-től

Szerszám

A Google Code Blog-ban olvasható egy bejelentés, miszerint a Google pár hónappal ezelőtt szép csendben nyílt forrásúvá tett egy karakterfelismerő programot (Optical Character Recognition - OCR). A Tesseract névre hallgató anyagot nem a Google fejlesztette. A fejlesztés a Hewlett-Packard Laboratories nevéhez fűződik, amely intézmény 1985-től 1995-ig dolgozott a szoftveren.

1995-ben a Tesseract benne volt a las vegas-i Nevada Egyetem által rendezett karakterfelismerési verseny első három helyezettje közt. Nem sokkal ezután a HP úgy döntött, hogy kiszáll az OCR üzletből, és a program ott porosodott a HP raktáraiban. Szerencsére néhány ember úgy gondolta, hogy nyílt forrású programként hasznos lehet. Az Information Science Research Institute segítségével nekiálltak a munkának. Ezután a Google-hez fordultak, hogy az néhány bug javításában a segítségükre legyen. A Google segített, majd a triviális bugok javítása után úgy döntöttek, hogy a Tesseract OCR megfelelően stabil ahhoz, hogy nyílt forrásúként újra kiadják.

Bővebben itt.

A hozzászóláshoz be kell jelentkezni
17890 megtekintés

Vegre valami ezen a fronton!
A jelenlegi open "kinalat": Ocrad, GOCR nagyon tavol van a tenyleges alkalmazhatosagtol. (legalabbis ha az ember nem akar biomajom uzemmodba kapcsolni, es kezzel napokat/heteket tolteni javitgatassal)

0 szavazat

A hozzászóláshoz be kell jelentkezni

No igen, viszont még reszelni kell rajta, hogy egyátalán leforduljon linux-on a bugtracker szerint...

Üdv
Godot

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nekem a libtiff4-dev telepítése után simán lefordult daper-en. A telepítés már nem olyan fényes, de azt írja is fordításkor.. A tesztképet szépen felismerte, viszont az általam szkennelt oldalt egyáltalán nem.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A ClaraOCR-t ki ne felejtsd a listabol Annyira eroteljesen fejlesztik, hogy meg a weboldala is megszunt, FreeBSD pl. a NetBSD-repo-bol szedi a forrast :-(

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az az apróság kimaradt hogy a cucc licence Apache 2.0.

0 szavazat

A hozzászóláshoz be kell jelentkezni

>A fejlesztés a Hewlett-Packard Laboratories nevéhez fűződik, amely intézmény 1985-től 1995-ig dolgozott a szoftveren.

akkoriban álltak át a magyar fejlesztésű Recognitára, mert az minden szempontból jobb volt a sajátjuknál, ha jól emlékszem.
Eddig is voltak opensource ocr programok, mint a GNU Ocrad, vagy a Clara OCR illetve a Kookanak is van OCR funkciója. az biztos, hogy ezek képességei elmaradnak az azóra OmniPagere keresztelt Recognitától. kíváncsi vagyok, hogy ez a 10 éves kereskedelmi OCR miben jobb náluk. egy kicsit szkeptikus vagyok.

0 szavazat

A hozzászóláshoz be kell jelentkezni

kíváncsi vagyok, hogy ez a 10 éves kereskedelmi OCR miben jobb náluk.

Számomra elég indok az, hogy működik.... a többi "free" OCR nem igazán képes erre...

---
pontscho / fresh!mindworkz

0 szavazat

A hozzászóláshoz be kell jelentkezni

jo neked, nalam csak alig alig produkal eletjeleket :)
a felismeres meg gyakorlatilag semennyire nem mukodik, meg a tesztkeppel sem

0 szavazat

A hozzászóláshoz be kell jelentkezni

"a Kookanak is van OCR funkciója"

Hát persze. Feltéve, hogy van a gépeden egy ocrad vagy gocr, merthogy az is ezeket használja.

"kíváncsi vagyok, hogy ez a 10 éves kereskedelmi OCR miben jobb náluk"

Az omnipage nem free, úgyhogy például ebben.
Az ocrad, meg a gocr meg nem OCR programok, a szó valódi értelmében; csak amolyan "gumicsontok", hogy ha sok időd van legyen mivel kínlódnod addig is amíg rájössz, hogy ideje volna már valami érdemi OCR programot keríteni...

Amúgy érdekes, hogy jóformán minden "hétköznapi" feladatra vannak nagytudású opensource programok, viszont az OCR funkcióra valahogy csak ezek a szerénykék vannak. És még azt se lehet rájuk fogni, hogy legalább rohamvágtában fejlődnének...

---
If you have money, use Windows!
However, if you also have a brain, use Linux!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nem nagyon vagyok otthon ezeknek a programoknak a belső működésében, valaki nálam hozzáértőbb világosítson már fel: az alap működési elv hasonló az ocr-ek és az érintőképernyős kézigépeken futó kézírásfelismerők között? Vagy utóbbi egész más megközelítés?

0 szavazat

A hozzászóláshoz be kell jelentkezni

a recognita egyik fejlesztőjével beszélgettem a témáról a nyáron. az ocrnél az egyik legnehezebb feladat a jelek behatárolása. ez az érintőképernyőnél egyszerű, mert egy görbét kapsz, de egy írógépes szövegnél már nehezebb, mert az egy nem homogén pixelhalmaz. a recognitának több (3?) párhuzamosan működő algoritmusa van erre a feladatra, az elsődleges a betűk körvonalát próbálják megtalálni. ez írógépes/nyomott nyomdai szövegnél például nem megfelelő.

0 szavazat

A hozzászóláshoz be kell jelentkezni

http://www.kfki.hu/chemonet/TermVil/kulonsz/k002/recognita.html

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jo olvasmany, bar szomoru latni a szemleletet, hogy egyeseknel a szoftverkeszites egyetlen hasznossagat/szepseget a profitszerzes kepzi. :-(

---------------------
Minél korszakalkotóbb ötlettel állsz elő, annál több hülyén kell átverekedned magadat.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Laikusként gondolkodtam, hogy van nekünk egy nagyon jó raster->vector átalakítónk, a potrace, ami tapasztalatom szerint többek között a betűk vektoros körvonalának nagyon jó visszaadására is képes, nem lehet, hogy valahogy ennek a vektorozó motorjára kéne építeni? Bár úgy sejtem, hogy ez a dolog egyszerűbb oldala, utána még gondolom meg kell írni egy irtó bonyolult algoritmust, ami összehasonlítja egy "álltalános" betűképpel, és eldönti, hogy az adott vektor/vektorhalmaz milyen betű is. De javítsatok ki, ha marhaságon filózok, csak ötletelek.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Akinek egyaltalan lefordult, az adna egy rovid tippet, hogy pontosan hogyan tovabb? FreeBSD-n ne'mi reszeles (Linuxism javitas, include-hulyeseg javitas) utan lefordul. Minden meg is van. El is indul. De mar a tesztkep nem akarodzik menni; miutan feldob egy xterm alakot, abban felvillan (de nem elolvashato) egy uzenet, de semmi tobb; kiveve ezt az uzenetet a konzolon:

DAWG Table is too full, nodes = 2440, edges = 3052, moves 36

Futtatas termeszetesen a:

./tesseract phototest.tif proba.txt batch

paranccsal tortent, ahogy a "doksi" (khmmm) is irja.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Sajnos nekem se sikerült életet csiholni belé, egyszerűen elindul és fut a végtelenségig. Kb 1 óra múlva öltem ki, mert már zavart, hogy semmit se csinál.

--
A nyúl egy igazi jellem. Ott ül a fűben, de akkor sem szívja!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Tesseract - nyílt forrású OCR program a Google-től

Hozzászólások