Nyílt forrású karakterfelismerő projektet jelentett be a Google

Open Source

A Google a napokban jelentette be az OCRopus névre hallgató, általa szponzorált, nyílt forrású projektet. A projekt célja, hogy előmozdítsa a korszerű optikai karakterfelismerés ügyét. A bejelentés szerint a DFKI-nál (German Research Center for Artificial Intelligence, Kaiserslautern, Germany) dolgozó Thomas Breuel professzor vezetésével fog a IUPR research group fejlett OCR technológiákat fejleszteni.

A fő cél: olyan fejlett, csúcsminőségű OCR rendszer kifejlesztése, amely felhasználható dokumentumok konvertálására, csökkentlátók segítésére, elektronikus könyvtárak üzemeltetéséhez, történelmi dokumentumok elemzésére, és általános desktop célokra.

A projekt várhatóan három évig fog futni, amelynek során 3 Ph.D. tanuló vagy post-doktori ösztöndíjas fog dolgozni. A szoftvernek már elérhető egy "Technology preview" kiadása, amelyet Apache licenc alatt terjesztenek. A OCRopus projektnek szerves része a már a HUP-on korábban is említett Tesseract OCR is.

A projekt honlapja itt. A bejelentés itt.

A hozzászóláshoz be kell jelentkezni
4080 megtekintés

"A fő cél: olyan fejlett, csúcsminőségű OCR rendszer kifejlesztése, amely felhasználható dokumentumok konvertálására, csökkentlátók segítésére, elektronikus könyvtárak üzemeltetéséhez, történelmi dokumentumok elemzésére, és általános desktop célokra."

Peldaul a Google Books-hoz. :)

--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jaja, de a forrást attól még kiadják.
--
'Please, just tell people to use Windows.' - Linus Torvalds on KDE and GNOME
Registered M$funboy #006 (vigyázat: memetikai dágvány!!!11)

0 szavazat

A hozzászóláshoz be kell jelentkezni

csak, hogy teljes legyen a kep ;)
a google vezetosege nagyon ert a munkajahoz, le a kalappal

--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.

0 szavazat

A hozzászóláshoz be kell jelentkezni

imho erre csak akkor lenne szüksége a googlenek, ha nem létezne megfelelő minőségű ocr a piacon jelenleg. ha megveszik az omnipage/recognitat annyi könyv digitalizálásánál használhatják amennyinél csak akarják. erre vonatkozó korlátozás nem található egyik orc kereskedelmi program végfelhasználói licencében sem. valószínűleg az sem vágja a padlóhoz a google inc.et, hogy a nagyobb hatékonység érdekében több omnipage licencet is kellene vásárolniuk.
nem valószínű, hogy open ocr program nélkül be kéne zárni a google booksot, mert már nem bírják a gépírónők a munkát :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

meg is jobb, ha van sajat, mintha licencelni kell
meg azert a google szeret terjeszkedni

--
The Internet has evolved from smart people in front of dumb terminals to dumb people in front of smart terminals.

0 szavazat

A hozzászóláshoz be kell jelentkezni

na meg nekem se kell windows üzemeltetnem, ha szövegfelismerni akarok

0 szavazat

A hozzászóláshoz be kell jelentkezni

ráférne már a opensource közösségre egy normális ocr, sajna a gocr-féle próbálkozások nagyon messze vannak egy abbyytől vagy omnitól :(

0 szavazat

A hozzászóláshoz be kell jelentkezni

És a Tesseract?

--
[Random Topical Haiku] (Slashdot.org) I've Got A Cool Site. What The Fuck? So Much Traffic! Now My Server's Down

0 szavazat

A hozzászóláshoz be kell jelentkezni

Olvasd már el a hírt.
--
'Please, just tell people to use Windows.' - Linus Torvalds on KDE and GNOME
Registered M$funboy #006 (vigyázat: memetikai dágvány!!!11)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Lityi,
vegyél vissza az aláírásodban használt -----jelek mennyiségéből, mert olvashatatlanná teszi az oldalt.
egyébként a cikk utolsó mondata,
A OCRopus projektnek szerves része a már a HUP-on korábban is említett Tesseract OCR is.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

Retro hardveren miert… 2025-11-03T18:46:23+0100
tehat utalod magad, hisz'… 2025-11-03T18:46:19+0100
Vajon kiderül ki… 2025-11-03T18:44:17+0100
Az informatika első törvénye… 2025-11-03T18:40:57+0100
mp-nel minden nyilt,… 2025-11-03T18:39:16+0100
Ha eső nem lesz, lesz, ha… 2025-11-03T18:37:26+0100
tobb, mint 2 eve. mire lesz… 2025-11-03T18:34:01+0100
Na ez simán lehet :)Kicsit… 2025-11-03T18:32:47+0100
szomszéd fontosabb mint az… 2025-11-03T18:31:52+0100
Kipróbáltam már előbb, nincs… 2025-11-03T18:12:10+0100

Nyílt forrású karakterfelismerő projektet jelentett be a Google

Hozzászólások