Sziasztok!
Van egy kb. 1600 darabos dokumentum gyűjtemény SMB-n, ami napi szinten bővül.
Vegyes szoftverkörnyezetben van használva/bővítve:
-Windows + MS Office
-Linux + LibreOffice
Keresek egy minden környezetben használható, akár webes(Intranet), akár GUI-s programot, amivel gyors és részletes keresést tudok végrehajtani a dokumentumok tartalmában.
Az egyszerűség sem hátrány, mivel irodisták fogják használni! (Minden elakadás = "Nem tudom a munkám elvégezni" felszólítás...)
Köszönöm!
- 3070 megtekintés
Hozzászólások
Lucene vagy valami hasonló webes cuccal próbálkoznék...
- A hozzászóláshoz be kell jelentkezni
Lucene-t néztem, viszont számomra első blikkre csak Java library-nak tűnt, web interface nélkül.
Ezek szerint nem?
Közben saját FIXME:
solr -el párosítva már web interface is van.. Egy próbát megér...
- A hozzászóláshoz be kell jelentkezni
+1
Ha elég lenne a dokumentum parse, akkor Apache Tika (lib, cli, gui), ha több kell, akkor minimum Lucene/Solr, aztán lehet gondolkodni Hadoop tárolón alá és már elég bonyolult lett.
Esetleg egy pillantás az Apache Jackrabbit -re. (az is Tika)
- A hozzászóláshoz be kell jelentkezni
Hadoop tároló
1600 doksihoz?
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
- A hozzászóláshoz be kell jelentkezni
Most 1600, ami napi szinten bővül, ki tudja mennyivel...
A Lucene ökoszisztéma miatt említettem, előrevetítve. Tárolni valahol kell, ha már indexel.
- A hozzászóláshoz be kell jelentkezni
Helloooo!
Jövök itt a szerény kis ingyensharepointos zsebágyúmmal erre Te überelsz egy kontakt atomcsapással? Hadoop? :)
Üdv,
Marci
- A hozzászóláshoz be kell jelentkezni
ecosystem, lásd alábbi válaszom. de az ingyenszoftver az nálam is áll.
ugyanakkor nem az a lényege a válaszomnak, de mindenki ott akad fenn ;)
szerintem a lényeg a Tika, az parse-ol (,de a célhoz még kevés - ellenben), a többi csak adalék
- A hozzászóláshoz be kell jelentkezni
Érdemes megnézni, mit csinál vele egy ingyenes SharePoint Foundation.
Üdv,
Marci
- A hozzászóláshoz be kell jelentkezni
MS Sharepoint? Kizárólag DOC, és XLS? ODF is kellene...
- A hozzászóláshoz be kell jelentkezni
Miért ne lehetne ODF is? Csak egy IFILTER kell hozzá, pl: http://www.ifilter.org/links_office.htm
Üdv,
Marci
- A hozzászóláshoz be kell jelentkezni
Fapad++
Valami notify-al, audit logokat követve vagy időzítve nézed, hogy mi változott, azokat a doksikat átküldöd egy Tika-n és bevágod valami DB-be, amin van full text indexelés, utána egy egyszerű kereső webes akármi egy pillanat alatt megvan.
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
- A hozzászóláshoz be kell jelentkezni