Sziasztok,
Nem találok olyan programot, amellyel sima plain text fájlokat le tudnák index-elni kereséshez. Parancssori eszközt keresnék Linux-ra.
Jelenleg 10+ GB-os mbox fájlok-ban szeretnék keresni gyorsan grep-pel. mairix bug-os szar ahogy van, pedig pont erre találták ki. grepmail jó, csak az ugye lassú.
Hogyan tudnék létrehozni parancssorból egyszerűen egy index-elt állományt, amelyben grep-pel tudnék gyorsan keresni? Pl. form mezőre szeretnék keresni, de úgy hogy az előző és utáni pár sort is lássam.
'mutt -R -f mboxfile' is megfelelő egyelőre, de ennél jobbat keresnék.
Köszi minden ötletet!
- 1603 megtekintés
Hozzászólások
namazu-val van valakinek tapasztalata?
- A hozzászóláshoz be kell jelentkezni
Én használtam párszor, nagyon jól működk.
EDIT: grep-el nem fogsz tudni keresni az indexben. A namazu parancssori keresője azonban úgy emlékszem kiírja a találatokhoz közeli szövegrészt, max 1-2 sort.
- A hozzászóláshoz be kell jelentkezni
namazu-hoz írtam most egy frontend-et. nemsokára feltöltöm a script-et. nagyon jól működik és baromi gyors (mármint a namazu). köszi.
- A hozzászóláshoz be kell jelentkezni
sphinx?
t
- A hozzászóláshoz be kell jelentkezni
nézegettem már pár órája, de semmi használható doksit nem találok hozzá. csak néhány parancs minta kellene amin el tudok indulni.
ahogy látom, ez lenne nekem is jó, mert namazu fájlt ad vissza, amely a keresett kulcsszót tartalmazza, míg nekem az kellene, hogy a keresett kulcsszó "környezetét" kapjam vissza.
- A hozzászóláshoz be kell jelentkezni
ha rpm-bol rakod fol, van a csomagban egy example db + sample config is, azt csekkold.
t
- A hozzászóláshoz be kell jelentkezni
A Xapian-t tudom ajánlani, illetve az Omega-t ami egy frontend hozzá. Nagyon gyors, nem kell hozzá adatbázis kezelő, de a dokumentációja csapnivaló... :)
LouiSe
http://louise.hu
- A hozzászóláshoz be kell jelentkezni
köszi, sajna nem jutok előrébb, nem találok semmi használható doksit a parancssori használatról. most folytatom sphinx doksi kereséssel. :)
- A hozzászóláshoz be kell jelentkezni
sőt kísérleteztek is már az email-kliensekkel való pároztatásával:
- A hozzászóláshoz be kell jelentkezni
Ez jó:
"A Minimal Mail Reader"
"Xapian ... It has only one serious bug—it’s written in C++..." :)
Ez tetszik:
"Command line driven. Any UI would be constructed on top of the command line interface."
Amúgy sajnos nem tudk előre lépni xapian ügyben. Majd egyszer :)
- A hozzászóláshoz be kell jelentkezni
nem jutok előrébb se sphinx-szel, se xapian-nal. azt hiszem inkább szétdobatom a nagy mbox fájljaimat MH formátumra, majd namazu-val leindexeltetem, majd xargs grep.
mbox --> convert --> mh
mknmz -O indexdir mhdir
TEXT="text to search"
namazu -l "$TEXT" mhdir | xargs grep -i "$TEXT"
tud valaki jobbat? :)
- A hozzászóláshoz be kell jelentkezni
Szia,
az index témához nem tudok hozzászólni, de ha pl. - mint írod - a From: mezőre és az előtte ill. utána levő sorokra akarsz keresni, nem lenne jó valami ilyesmi:
grep -B 1 -A 2 '^From:' mybigmailbox
(Nem tudtam tesztelni, nincs ekkora mailbox-om...)
Ottó
- A hozzászóláshoz be kell jelentkezni
de, ezt használtam eddig, illetve ennél jobb a grepmail parancs. csak gyors megoldást akarok :)
sima grep-pel 10 GB feletti mailboxnál 15-20 percig is eltart egyetlen keresés.
mindegy, már írom a script-emet rá :)
- A hozzászóláshoz be kell jelentkezni
Megoldás itt.
- A hozzászóláshoz be kell jelentkezni
clucene is jó lehet.
http://sourceforge.net/projects/clucene/
- A hozzászóláshoz be kell jelentkezni
ahogy nézem a neten, csak api felülete van, én meg parancssoros megoldást keresnék.
köszi.
- A hozzászóláshoz be kell jelentkezni