Nagy teljesítményű scannelés

 ( renszarv | 2011. október 17., hétfő - 19:44 )

Helló

Felmerült, hogy olyasmit kéne csinálni, hogy pár száz-pár ezer formanyomtatványt jó lenne scannelni/kicsit ocr-ezni/feldolgozni. A feldolgozásról vannak elképzeléseim, az ocr részét is ki tudom találni, a scannelés része az ami nagyon ködös.
Ki milyen tapasztalatokkal rendelkezik a témában? Milyen hardvert/gyártót érdemest választani, amelyik képes beolvasni egymás után 50-100 oldalt, elérhető linux alól, és még viszonylag megfizethető áron is tudja ezt :)
Ha ehhez még szoftvert is tudtok ajánlani, annak még jobban örülnék :)

Köszi

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Vannak komolyabb multifunkciós gépek, amelyeknél alapszolgáltatás, hogy laponként behúzza az adagolóból a papírokat, beszkenneli, majd az egészet elküldi pdf-ként email címre. Ha csak alkalmi dologról van szó lehet jobban jártok ha egy fénymásoló szalon gépével csináljátok meg. (Persze az adatvédelmet is belekalkulálva, hogy mennyire problémás ha esetleg rajtamarad külsős multifunkciós gép merevlemezén.)

Vannak ezek a nagy toronyszerű multifunkciós gépek, amikben van fénymásoló, scanner, összetűzi a lapokat, stb...
Pontos típust nem tudok, de egy ismerősöm bérel egy ilyet, nyomtatott oldalanként kb. 4 Ft áron. A gép adagolóról tud elvenni scannelendő anyagot, azt igény szerint pdf vagy tiff formátumban tudja a memóriájába menteni, ahonnan FTP-vel letölthető.
Mikor kivitték neki, volt egy próbahónapja, ami után még mondhatta volna, hogy neki ez mégsem kell. Szerintem ti is valami ilyesmi konstrukcióval járnátok a legjobban.

Miután havi rendszerességgel kellene ezeket feldolgozni, úgyhogy sajnos a külsős megoldás annyira nem játszik. Ez az eszköz bérlés nem hangzik rosszul. Gondolom egy ilyen készülék amúgy több százezres tétel. Van linked, hogy kitől milyet bérel, vagy google legyen a barátom? :)

Tényleg nem tudok pontos típust, de úgy rémlik, valami Xerox.
Egy kis helyi cégtől van (Balassagyarmaton, talán Syscon a nevük), így nem biztos, hogy nem találsz közelebbit.

Ha jól emlékszem, több mint két év használat után felajánlották már neki megvételre, millió feletti áron. Ahhoz képest lehet jobban jön ki a bérlet.

Mi tőlük bérlünk ilyet. Konica-Minolta Bizhub 162.

Mi Ricoh Afficio MP2510-et használunk, ez képes adagolóról szkennelni A4-es méretig, valamint üvegről A3-ig, majd ftp/smb/email címekre továbbítani az anyagot, esetleg belső merevlemezen tárolni. A fájlformátum TIFF/JPEG és PDF lehet.
Ez inkább már milliós kategória.

Egyébként az elszámolásnál a szkennelés nálunk nem számít, nyilván kell lennie egy minimális fénymásolásnak/nyomtatásnak.

Nem a szoftver lesz a gondod, hanem a strapabírás. Nem mindegy, hogy napi 1-2, 10-20 oldal szkennelés vagy pedig havi egyszer 100-300 oldal. Amikor egyszerre sokat olvas be, akkor lényegesen jobban melegszik, stb. Erre a drágább megoldások tudnak hosszabb távon beválni. Az olcsóbbak elsőre jónak tűnnek, néhány hónap után azonban drága a csere vagy javítás.
Linuxscripting

A költség vs mennyiség, kényelem, gyorsaság komponenseket mérlegelve "fapados alternativa" a digitális fényképezés és a digitális képállományok utólagos feldolgozása.

CSZ

Anno néztem komolyan scannereket, HP meg Epson maradt képben.
Az Epson szerintem sokkal jobb volt mechanikai kidolgozottságra, ráadásul közelebb állt a valós teljesítménye a specifikációhoz.
Az állított 27 lap/perc helyett olyan 22-25-öt sikerült kihozni belőle még értelmes beállításokkal, ha jól emlékszem, akkor 150 dpi fekete-fehérben. Volt akkor egy akció, hogy a sima áráért adták szoftvercsomag nélkül a hálózati kártyát is.
A Markernél meg tudtam nézni, ki is tudtam próbálni.
Sajnos Windowsos környezetbe kellett, linux alatt nem volt időm kipróbálni. :( Évek óta elégedetten használják.

Szerintem érdemes lenne megpróbálni linux alatt akár usb-n, akár hálózaton keresztül.

Nálunk a pénzügyön egy Fujitsu scsi scanner volt. Kb 20 lap/perces sebességgel(állítólag a mostani usb 2.0-ás scannerek is tudják produkálni). Nem volt vele probléma.

Próba szkennelést biztos csinálnék a helyedben. Itt pl a Kyocera szkenner lehagy az A4-es oldal mindegyik oldalából kb 5-10 mm-t, számláknál néha oda nyomtatnak pár apróságot.

Egyes Xerox multifunkciós típusok képesek a beszkennelt állományt ún. kereshető PDF-ben menteni. Ez pontosan annyit jelent, hogy a beszkennelt kép elé bekerül a masina által OCR-ezett szöveg kvázi maszkként. Ez kijelölhető, másolható, kereshető tartalmat jelent. A Nuance cég engine-jét használják az ocr-hez. Magyarul tud és elég jó hibaszázalékkal. Sebesség átlag automata adagolóval 50 oldal/perc.

Ez az 50 oldal/perc, főleg OCR-el: elég hihetetlenül hangzik. :)

Első hallásra tényleg, de már megszoktam. 8 éve foglalkozom Xerox-szal, elég sok újítást láttam. Ez természetesen a szkennelés sebessége az eszközön, a fájl elkészítése (PDF-ocr-mentés pl. ftp-re, vagy smb share-re) persze néhány mp.-et igénybe vesz a dokumentum bonyolultságától függően, de mérföldkövekkel gyorsabb egy desktop ocr sw-nél. Arról nem is beszélve, hogy itt 1db pdf-et kapsz, a képek jpeg, a szöveg többszintű jbig tömörítéssel tárolva, nincs szükség további bűvészkedésre az állománnyal.
Ha hosszútávra lenne szükség dokumentum szkenerre, akkor azt mondanám, hogy Fujitsu a favorit. Több bank backoffice-ban használják és a drágább típusok gyakorlatilag a wc papírt is képesek beszkennelni sérülés és elakadás nélkül.

A kicsit nagyobb multifunkciósokban már van lehetőség hálózati disk-re scannelésre, ha bent vannak a képek onnantól már csak script kérdése a feldolgozás.

használunk 2 fajta dokumentum scannert. Az egyik kodak i40 a másik fujitsu ScanSnap S1500. Mind a 2 stabilan tudja a 25 lap vagy 50 kép/percet (kétoldalassan) 300dpi-ben a4-es méretben színesben, de linux drivert még egyikre sem találtam

Nalunk kodak i1420-as van tobb darab is, kb 2 millio odallal. ;) Vannak multi funkcios nyomtatok is olyanok amit itt tobben is emlitenek. Minolta bizhub 501-es max olyan 200 oldalt tud behuzni a felso lapadagalon. tud pdf scan email-ben, kozos megosztasra, azt hiszem meg valan valami mas funkcio de mi az e-mailbe scant hasznaljuk eleg surunk. ;)

Sziasztok!

Tudtok ajánlani olyan multifunkciós lézer nyomtató típust, ami _számítógép nélkül_ tud OCR-t? OCR-es pdf-et csinál és azt le tudja tenni helyi/távoli mappába (webdav, ftp), esetleg e-mail-ben küldeni vagy felhőbe menteni?

Nem nagyon találtam, merre induljak? Van esetleg konkrét jó/rossz tapasztalat?

köszi