Kisebb "iroda" digitalizálása hogyan?

 ( akkos | 2014. február 11., kedd - 13:11 )

Konkrétan: családi gazdaság, 2 szekrénnyi papírral, állandó probléma az elveszett számlák, papírok, stb.
Ugyan egy részük gépen is megvan, arra gondoltam gépre kellene vinni az összes iratot, rendszerezni, és valamiféle automatizálást létrehozni. Persze ettől még sok esetben szükség lesz az eredetire, de ha valami gyorsan kell, van hova nyúlni.

Soha nem csináltam ilyet, scanner se volt még a kezem ügyében.

A kérdéseim: milyen scannert? Fontos a linux kompatibilitás, csak szövegek beviteléhez kell. Használt is játszik.
Mennyire fejltett 2014-ben az OCR, magyar szövegekkel? Van több téma is itt a hupon, amiből azt vettem le, hogy közel sem tökéletes, de mind 4-5 éves topic.
Az ocr nem alapelvárás, alapvetően nincs szükség a szövegek szerkesztésére. Amiért örülnék neki, az az, hogy lehet a szövegben keresni.

Automatizálás alatt azt értem, hogy ha jön valami papír, csak be kelljen tolni a scannerbe, megnyomni egy gombot, és kész. A dokumentum meg kerüljön be egy ideiglenes mappába. Ne kelljen várni a számítógép bekapcsolásra. Szóval vagy tudjon külső eszközre közvetlenül menteni, vagy hálózatra. Onnan már kézzel lesz a megfelelő helyre pakolva.

Ugyan nem tűnik (számomra sem) nagy kalandnak, azért rákérdezek, mert mint írtam, soha nem foglalkoztam ilyesmivel. Biztosan van a dolognak valami buktatója, amitől megkímélhettek :)

Ja és az ár: nem akarok és nem is tudok 200-300ezres scannert venni, szóval a legolcsóbb kell, ami alkalmas a fentiekhez. Nem kell, hogy fél másodperc alatt olvasson be egy a4-es lapot, nem kell 10k dpi-s felbontás se. A hálózati támogatás vagy külső usb-s storage-re mentés viszont fontos. És az egyszerű működtetés. (Lap berak>gombnyomás>file a megfelelő helyre. kész.) Árban legyen max 40k. De ha fele ennyi, annak még jobban örülök.

Amúgy mennyire tartósak ezek? Könnyedén elmennek 3-4-5 évig heti átlag 10-20 oldal beolvasásával?

Előre is köszi a segítséget! :)

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

És ha be is lesz scannelve minden, hogy találod meg a dolgokat? Csinálsz egy excel táblát, amiben felsorolod a számlákat/szerződéseket/tárgyi eszközök papírjait/stb dátum szerint? Vagy valami komolyabb nyilvántartási rendszer lesz?

Hasonlón gondolkodom én is, annyival vagyok előrébb, hogy scannerünk van. :)

Vannak irodai MFP-k, amelyek tudnak FTP tárhelyre (vagy smb, e-mail, stb) szkennelni (az áruk sem vészes). Egy NAS-sal (én egy DLINK DNS320L-t heggesztek erre a célra) működhet. Az ftp célhelye lehet azonos egy hálózati megosztással a NAS-on, amit utána gépről hálózati megosztásként látsz.

---
#include "alairas.h"

Valamilyen módon persze iktatni kell a beérkezett dolgokat... :) A legegyszerűbb, hogy használsz valamilyen képkategorizáló progit, amivel a képeket cimkézni és indexelni lehet. Onnan pedig már egyszerű dolgod van. Nem business megoldás de előrébb vagy. :)

---
#include "alairas.h"

fogalmam sincs :)

Ezért lenne nagyon jó ha menne az ocr. Be lenne indexelve minden, a fájlok szövege is (már amennyit felismer belőlük), így bármit megtalálhatok, ha tudom mit keresek. Az eredeti kép fájl ocr feldolgozás előtt pedig szintén ott lenne mellette.

OCR-re én a tesseractot szoktam használni. Ha egyenesen van beszkennelve a szöveg, akkor teljesen jól működik magyarul is. Azt viszont nem tudom, hogy a számlákon előforduló mindenféle színezett szövegdobozok mennyire fogják összezavarni.

---
Science for fun...

a tessaractot nézegettem, de a google code odlalán a magyar motorhoz az utolsó frissítés 2012-es.
De ha jól működik, pont nem érdekel fejletik-e vagy sem.
Ha ömlesztve, kriksz-krakszokkal együtt, de bedobja a számla tartalmát egy fájlba, már ér valamit, tudok rá keresni.

Szerintem egy karakterfelismerőn egy határon túl nem nagyon van mit fejleszteni. Aztán hogy a tesseract elérte-e ezt a szintet, azt nem tudom, de nekem tényleg gyanúsan jól működik.

---
Science for fun...

Ocr-re én nem tartok igényt. Csak arra, hogy ha meg kell keresni Xyz Kft.-vel kötött szerződést, akkor gyorsan meglegyen. Számláknál meg jó lenne, ha lehetne kimutatásokat készíteni a különböző költségekről. Ehhez viszont már tényleg kézzel kell felvinni dolgokat...

A gyakorlatban ügyfeleinknél az úgy működik, hogy a scannelt file-t hozzárendelik a partnerhez is, besorolhatják különböző kategóriákba (pl. szerződés), hozzárendelhetik valamihez (pl. szállítói számla), stb. Utána ebből már könnyen ki lehet keresni bármit...
Régebben volt egy olyan fejlesztésünk is, hogy egy samba share-en levő fileokat nézegettük, sha1 alapján kerestük a változásokat és új fileokat, de az ügyfelek valamiért ragaszkodtak a feltöltögetős verzióhoz.

--
http://eVIR.hu
Elektronikus Vállalatirányítási Információs Rendszer

Szofvert nem szeretnel vasarolni hozza? Van itt a forumon egy ember akinke olyan komplex megoldas van.
Gepre van kotve a scanner es mar az iktato progiba kozvetlen be tudod digitalizalni aztan, ha kell keresni es jo metaadtozod a dolgokat akkor harmar megvan. Ha erdekel keress meg privatban es megadom az ember elerhetoseget.

köszi!

Először legyen meg a szkenner, megpróbálom házilag összebarkácsolni, aztán ha belebukok megkereslek :)

A multifunkciós eszközök általában tudnak ( ha lanosak) smbbe szkenelni. ( a kyocera biztos). Viszont a file nevet vagy automatikusan adja vagy te pötyögöd be. Ahhoz mint az előttem szóló írta kell egy nyilvántartó rendszer hogy tud mit hova tettél.
Én inkább egy ilyen arhiváló rendszert keresnék plusz egy skenner ( a canon liede támogatott linux alatt és még táp sem kel neki csak usb) amit tud a progi kezelni.

multifunkciós cuccokat nem szívesen nézek, mert már van egy jól bevált hp laserjet, amit nem szivesen dobnék a sarokba.

http://www.arukereso.hu/szkenner-c3110/dokumentumszkenner/?orderby=1

Jobb híján itt kezdtem nézegetni. Ugyan az olcsóbbak közül hálózatot egyik se tud, de usb-re, memóriakártyára tudnak menteni, ami ha nem is olyan kényelmes, de kielégítő számomra.

Mi a véleményetek ezekről az apró/olcsó cuccokról? Csak dokumentum szekkenélhez, elég nekem a 600dpi, meg a 16bites színmélység? Vagy az ocr-hez érdemesbb jobbat venni?

Milyen hátránya van még egy ilyen olcsó kütyünek, egy profibb 50-60ezres darabhoz képest? Sebesség, szolgáltatások, lapadagoló, az tiszta sor, de egyik sem igazán fontos. Van ezen kívül is valami hátrányuk, vagy megfelelne nekem a 10-20ezres kategória is?

Mennyire számít hogy CIS vagy CCD az érzékelő?

én inkább síkágyasat vennék abban a mechanika egy zárt dobozban van, és garantáltan csak akkor skenelsz ferdét ha úgy tetted bele, valamint a számla papírok elég silány minőségűek, és néha még össze is vannak tűzve mással (teljesítés igazolás....)

ok, ez jó indok, erre nem gondoltam. köszi.

szerintem 300 dpi is bőven elég ( a fax az 100dpi fineban 200) ennél nagyobb dpi már nagy file méreteket eredményez.

Erre milyen windowos és linuxos programot tudnál ajánlani? Nem igazán találtam megfelelőt, de néhány pdf rendszerezésére én is ezt találtam ki, csak még nem tudtam megcsinálni.

köszi

ui: erre
http://hup.hu/node/130484#comment-1701304
szerettem volna válaszolni, de hiába annak a bejegyzésnek a belépésén keresztül léptem be, nem ott jelent meg.

sub

.

Én úgy csinálom, hogy a scannelt kép nevében benne van minden fontos infó a tartalmáról.
Dropboxba mennek fel a fileok, spotlight-tal keresek, egy pillanat alatt kaidja a keresésnek megfelelő fileokat, aztán a preview megmutatja a file tartalmát, általában 10mp-n belül megvan bármi.
Oh wait, Linux ...

Linuxos progit nem tudok, de a "felhőbe" mentést ajánlom, backupnak sem rossz.

--
Gábriel Ákos
http://i-logic.hu

Köszönöm a segítséget, de a helyzet az, hogy még mindig az eszköz keresésnél tartok.

Egyszerűen nem találok semmilyen scannert 20-30k kategóriában, ami tud hálózatra vagy usb-re menteni közvetlenül, és legalább a4-es méretet kezeli. Vannak 10-20k között komolytalannak tűnő 2xaa akksiról működő gépek, amik nem is síkágyasak. ezek gondolom nem igazán alkalmasak arra amire használnám.

A vicc ugyanakkor az, hogy a canon például árul 20-30 közötti áron olyan tintasugaras multifunkciós gépet, ami akár dropbox-ba is fellövi wifin az anyagot.

Tud valaki konkrét tipust mondani, ami a fentebbi árkategóriába esik, és tudja amit kell? (Számítógép nélkül is tudjam használni valamilyen módon, lehetőleg egyszerűen. (Be lehessen állítani hogy 1 gombnyomásra előre beállított helyre mentsen.)

Ha nincs más, megveszem a tintasugaras multifunkciósat.

Melyik az amelyik gép nélkül wifin feltolja dropboxba? Mert az engem is érdekelne. Mert amúgy a legtöbb csak gépre tud scannelni, ahol persze rakhatod Dropboxba végül.
Amúgy szerintem ez lesz a megoldás, vedd meg a multifunkciósat.

--
Gábriel Ákos
http://i-logic.hu

Canon PIXMA MX455.

Bár jobban megnézve a leírást van egy ilyen is:

Beolvasás a felhőbe vagy USB-eszközre

Egyszerűen beolvashatja dokumentumait közvetlenül az Evernote vagy a Dropbox felhő alapú szolgáltatásba, így szinte bármilyen mobileszközről elérheti őket. A készülék elején elhelyezkedő USB-port azt is lehetővé teszi, hogy számítógép nélkül végezzen beolvasást USB-memóriaeszközre.

Akkor lehet a dropbox-ra feltöltést közvetlenül még sem tudja. De ír valami okostelefon integrációt is, van bluetooth, wifi, szóval elég elcseszett dolog lenne ha ez meg nem menne.

Az én (sokkal drágább) epsonom is ilyen. Tulképp a mobiltelefonos integráció nem sokat jelent, a telefon pont olyan erős mint a gép, az összes tudás abban van, nem az eszközben.

--
Gábriel Ákos
http://i-logic.hu

Eszkoz javaslat: Canon Lide110

akárhogyan nézem a terméklapot vagy brossúrát, nem írja sehol hogy tudna közvetlenül hálózatra vagy usb starage-re menteni.

Ugy nez ki a kovetelmeny reszet atugrottam. Igy tenyleg nem felel meg.

Ugyan tapasztalatom nincs vele, de én simán lehet, hogy megnézném nincs-e valami okostelefonos izé, ami szépen rácsücsül a fényképezőgépre...

szerintem berelni sokkal koltseghatekonyabb, aztan kesobb gondolkodhatsz, a tovabbi megoldasokon. Pl.: http://www.dokucentrum.hu/product.php?id=69

Üdv!

Lehet egy kicsit hosszú leszek ezért előre is bocs.

Nagyjából 8 évnyi tapasztalattal a következő észrevételeket tenném:
1. A feladat pontos meghatározása rengeteg pénz és ideg megtakarítását teszi lehetővé.
2. A digitalizálni valót nem csak a mennnyiség alapján kell behatárolni, hanem méretileg is. (A/4, A/3, A/5 stb.)
3. Ha az A/4-es formátum kerül többségbe, akkor mindenképpen célszerű az ADF használata.
4. Az éves szkennelt anyag mennyiségétől függ, hogy komolyabb dokumentum kezelő rendszerre van szükség, vagy néhány évig elég egy Excel tábla is. Nagyjából 4-5 ezer szkennelt anyag után már nem elég az Excel.
5. Családi gazdaságból kiindulva, gondolom mezőgazdaságról van szó. Hivatalonként, cégenként is érdemes átvizsgálni a keletkező papír anyagot. (pl.: az MVH mostanában teljesen ráállt az A/4 duplex anyagokra, tehát jó ha az ADF duplex egységgel is rendelkezik.)
6. Fontos szempont a kezelő személyzet felkészültsége, bár ez itt is meg volt említve.
7. Én jelenleg egy Epson WP-4525DNF-et használok erre a célra. Viszonylag sikeresen (még nem volt durva kudarc élményem). :)
8. Ököl szabály: ha az eszköz árán spórolsz, akkor nagy eséllyel a működéskor költöd el a spórolt pénz többszörösét.
9. Egy jól kitalált, kényelmes digitalizáló eljárás nagyon addiktív! Ergo jóval több oldal lesz szkennelve, mint azt a tervezésnél gondoltuk.

Konkrétan milyen komolyabb dokumentum kezelőket tudnál ajánlani?

Jelenleg mivel a szkennelt anyagaim nem érik el a 4-5 ezret, még nem használok ilyet. Így konkrétat nem tudok mondani. Viszont olyan 1000-1500 körül el kezdett lassulni a tábla, így rövidesen ezt is meg kell oldanom. :) (Kábé még két év.) Calc táblázatot vezetek, de lehet, hogy neki állok áttolni Base alá. Elvi szinten egy jól kialakított könyvtárstruktúra is nagy segítség tud lenni. Mappánként maximum 200 doksival. Valahogy így:
Évek--hivatal/cég--téma--dokumentum típus--doksik.

Ez a táblában vezetést pontosan hogyan oldod meg? Hova kerülnek a beszkennelt fájlok? Be vannak ágyazva a táblába, vagy egy hivatkozás van rájuk, vagy hogy?

Tényleg nem csináltam még ilyet, eddig szinte minden papíron volt vezetve, és az sem az én reszortom volt.

Pontosítanék:
Évek--hivatal/cég--téma--dokumentum típus--doksik helyett
Évek--hónapok--hivatal/cég--téma--dokumentum típus--doksi. a pontos struktúra.

A fájl nevek kialakításánál igyekszem olyan kódokat alkalmazni, ami alapján be lehet határolni a tartalmát. Például: egy számlát tartalmazó fájl neve szmbe201402001.pdf az szm=számla be=befogadott számla (értelemszerűen a kibocsátott ki jelzést kap) a dokumentum keletkezéséne ideje (év/hó) végül pedig a dokumentumon hónapon belüli sorszáma ebben az esetben 001 (a sorszám annyi számjegyből álljon ami nagyságrendileg az adott dokumentum típus havi mennyiségét lefedi a 3 számjeggyel kis mennyiségnél biztosan nem lősz mellé).

A táblában (sorszám;fájlnév;kibocsátó;téma(számla esetén termék/szolgáltatás);(számlaazonosító;mennyiség;egységár;összeg);kapcsolódó határidő;kapcsolódó fájl) adatokat igyekszem rögzíteni.

Egy munkakönyvtárat használok, amiről teljes tömörített mentést csinálok. Egy RAID 1 tömbre a tömörített mentést és a fájlokat egyformán áthúzom. Ha tud a szkenner hálózatra szkennelni, akkor evidens, hogy a hálózaton lesz a munkakönyvtár. A katalógus fájlt is folyamatosan mentem a tömbre.

Ja és az egész könyvtár struktúrát érdemes papíron végig vinni.

köszi a részletes választ.

A keret fix, sajnos az összeget nem én szabom meg, szóval bele kell férjen a 20-40k-s összegbe.
Ettől függetlenül valószínüleg a fentebb említett Canon Pixma MX455 nyomtató lesz belőle, ami sok helyen épp hogy csak 20k. Tudja amit kell, van lapadagolós behúzós olvasás, illetve síkágyas olvasás is. Dupla oldalast mondjuk nem tud, de elenyésző az ilyen. Amúgy is jól jön néha egy színes nyomtató, iratokra marad a lézer.

Nézegettem a drágább, lézeres multifunkciós gépeket, és mindegyik a nyomtató funkcióban jobb lényegesen, úgyhogy egyelőre beérem ezzel, meglátjuk mit tud.

nagyon nem tudok vele mit kezdeni. A többi gyártónál ebben az árkategóriában nincs olyan, ami tudja ami nekem kell. (síkágyas és adf scanner, usb-re, hálóra beolvasás)
Ezen kívül meg biztos vagyok benne hogy a többi márkához is találnék hasonló panaszt.

https://doo.net/en/
linuxra sajnos nincs meg, de win/osx/android/ios van.