A fő cél: olyan fejlett, csúcsminőségű OCR rendszer kifejlesztése, amely felhasználható dokumentumok konvertálására, csökkentlátók segítésére, elektronikus könyvtárak üzemeltetéséhez, történelmi dokumentumok elemzésére, és általános desktop célokra.
A projekt várhatóan három évig fog futni, amelynek során 3 Ph.D. tanuló vagy post-doktori ösztöndíjas fog dolgozni. A szoftvernek már elérhető egy "Technology preview" kiadása, amelyet Apache licenc alatt terjesztenek. A OCRopus projektnek szerves része a már a HUP-on korábban is említett Tesseract OCR is.
- A hozzászóláshoz be kell jelentkezni
- 4080 megtekintés
Hozzászólások
"A fő cél: olyan fejlett, csúcsminőségű OCR rendszer kifejlesztése, amely felhasználható dokumentumok konvertálására, csökkentlátók segítésére, elektronikus könyvtárak üzemeltetéséhez, történelmi dokumentumok elemzésére, és általános desktop célokra."
Peldaul a Google Books-hoz. :)
--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.
- A hozzászóláshoz be kell jelentkezni
Jaja, de a forrást attól még kiadják.
--
'Please, just tell people to use Windows.' - Linus Torvalds on KDE and GNOME
Registered M$funboy #006 (vigyázat: memetikai dágvány!!!11)
- A hozzászóláshoz be kell jelentkezni
csak, hogy teljes legyen a kep ;)
a google vezetosege nagyon ert a munkajahoz, le a kalappal
--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.
- A hozzászóláshoz be kell jelentkezni
imho erre csak akkor lenne szüksége a googlenek, ha nem létezne megfelelő minőségű ocr a piacon jelenleg. ha megveszik az omnipage/recognitat annyi könyv digitalizálásánál használhatják amennyinél csak akarják. erre vonatkozó korlátozás nem található egyik orc kereskedelmi program végfelhasználói licencében sem. valószínűleg az sem vágja a padlóhoz a google inc.et, hogy a nagyobb hatékonység érdekében több omnipage licencet is kellene vásárolniuk.
nem valószínű, hogy open ocr program nélkül be kéne zárni a google booksot, mert már nem bírják a gépírónők a munkát :)
- A hozzászóláshoz be kell jelentkezni
meg is jobb, ha van sajat, mintha licencelni kell
meg azert a google szeret terjeszkedni
--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.
- A hozzászóláshoz be kell jelentkezni
na meg nekem se kell windows üzemeltetnem, ha szövegfelismerni akarok
- A hozzászóláshoz be kell jelentkezni
ráférne már a opensource közösségre egy normális ocr, sajna a gocr-féle próbálkozások nagyon messze vannak egy abbyytől vagy omnitól :(
- A hozzászóláshoz be kell jelentkezni
És a Tesseract?
--
[Random Topical Haiku] (Slashdot.org) I've Got A Cool Site. What The Fuck? So Much Traffic! Now My Server's Down
- A hozzászóláshoz be kell jelentkezni
Olvasd már el a hírt.
--
'Please, just tell people to use Windows.' - Linus Torvalds on KDE and GNOME
Registered M$funboy #006 (vigyázat: memetikai dágvány!!!11)
- A hozzászóláshoz be kell jelentkezni
Lityi,
vegyél vissza az aláírásodban használt -----jelek mennyiségéből, mert olvashatatlanná teszi az oldalt.
egyébként a cikk utolsó mondata,
A OCRopus projektnek szerves része a már a HUP-on korábban is említett Tesseract OCR is.
- A hozzászóláshoz be kell jelentkezni