Hozzászólások
A problémát úgy megoldottam, hogy a perl -MCPAN-nal telepítettem modulonként. Hát, ez a megoldás. De a lényeg, hogy jól működik. A tanítása pofon egyszerű.
- A hozzászóláshoz be kell jelentkezni
Kerdes:
a sa-learn-el azokat a maileket is meg kell tanitani, amiket O mar spamnek minositett? Vagy azokat nem kell?:)
Ezen filozom egy napja. Tehat ha mar valamit o megitelt spamnek,akkor erdemes meg 1x megtanitani neki h az tenyleg spam volt?:) Vagy nem kell?
- A hozzászóláshoz be kell jelentkezni
[quote:235dcb0d6f="WoOh"]Kerdes:
a sa-learn-el azokat a maileket is meg kell tanitani, amiket O mar spamnek minositett? Vagy azokat nem kell?:)
Ezen filozom egy napja. Tehat ha mar valamit o megitelt spamnek,akkor erdemes meg 1x megtanitani neki h az tenyleg spam volt?:) Vagy nem kell?
http://wiki.apache.org/spamassassin/FindPage?action=fullsearch&titlesearch=1&value=learn
- A hozzászóláshoz be kell jelentkezni
Engem az erdekelne, hogy ha forwardolok egy levelt a spamassasinnak azt nem fogja hibasan megtanulni? Mert akkor mar a fejlecbe mas is kerul az eredeti levelen kivul.
- A hozzászóláshoz be kell jelentkezni
WoOh:
"Kerdes:
a sa-learn-el azokat a maileket is meg kell tanitani, amiket O mar spamnek minositett? Vagy azokat nem kell?
Ezen filozom egy napja. Tehat ha mar valamit o megitelt spamnek,akkor erdemes meg 1x megtanitani neki h az tenyleg spam volt? Vagy nem kell?"
Az '/usr/share/spamassassin/10_misc.cf'ben benne a valasz: alapesetben a 0.1-et el nem ero emileket hamkent, a 12.0 felettieket spamkent megtanulja.
- A hozzászóláshoz be kell jelentkezni
[quote:58681359d4="dragi"]Engem az erdekelne, hogy ha forwardolok egy levelt a spamassasinnak azt nem fogja hibasan megtanulni? Mert akkor mar a fejlecbe mas is kerul az eredeti levelen kivul.
de igen.
Ne forwardold. A wikijukben szamos mas megoldas van erre.
Pl. imap mappa, vagy pl. a pine tud bounce-t, ami nem valtoztat semmin.
A legjobb ha kezzel valogatod. En 2*-3* megtanitottam egy nagyobb adagot, utana mar jol ment magatol.
- A hozzászóláshoz be kell jelentkezni
Okes, koszi.
- A hozzászóláshoz be kell jelentkezni
Kedves Spamassassin és Perl guruk!
Feltelepítettem a SpamAssassin-t hibaüzenet nélkül egy 5.8.4-es Perllel rendelkező Linuxra. Megy rendesen, de nem tudom tanítani. Amikor kiadom a "sa-learn" parancsot, kiír mindenféle hibaüzenetet. Az első hibaüzenet, ami miatt a többi hibaüzenet is megjelenik, a következő: "Bareworld "N16" not allowed while "strict subs" in use at /usr/local/lib/perl5/site-perl/5.8.4/Mail/Spamassassin/SHA1.pm line74". Az SHA1 Perl modul a helyén van, s a 74. sora a következőt tartalmazza: "@W = unpack N16, $_."\0"x7; unpack block into array of 16 into". Mit jelent ez a nemcsomagolt blokk tömb? Mi lehet a hiba oka?
- A hozzászóláshoz be kell jelentkezni
Kedves szemétgyilkolók!
Mi lehet a probléma oka? A SpamAssassinem a rövid tartalmú leveleket automatikusan szűri, miközben csak 2.9 pontot ad rájuk. Ráadásul nem csak szűri, hanem egy üres levelet küld feladó, címzett, dátum és tárgy nélkül, és csak a következőket tartalmazza:
X-Sieve: cmu-sieve 2.0
X-Spam-Checker-Version: SpamAssassin 2.63 (2004-01-11) on sun1.oiti.hu
X-Spam-Level: **
X-Spam-Status: No, hits=2.9 required=4.0 tests=DATE_MISSING,FROM_NO_LOWER
autolearn=no version=2.63
Mit tegyek, hogy ehelyett az eredeti leveleket kapjuk meg?
- A hozzászóláshoz be kell jelentkezni
Bocsánat, én voltam.
- A hozzászóláshoz be kell jelentkezni
Sziasztok
Épp egy postfix+dovecot+managesieve+spamassassin+roundcube csapatot építek egy ~1000 e-mail címes levelezőrendszerhez.
Már a végén tartok és felmerült egy kérdés:
Addig oké, hogy az userek .junk és .inbox mappájából tanítom, de 1 globális bayes db-ben legyen letárolva az egész vagy per-user szinten mindenkinek legyen egy bayesdb-je?
Fenntartásaim a közös adatbázissal kapcsolatban az, hogy ha egy levelet valaki spamnek jelöl, gyanítom másnál is az lesz. Lehet, hogy nem nyerő, ha valaki kínával üzletel és más miatt a spambe megy. Van egyéni szabály lehetőség, de lehet nem akarnak minden levélpartnerre egyéni szabályt létrehozni.
Továbbá mi történik, ha a közös adatbázis nagyra felhízik? Nem lassítja a kiértékelést? Nem lehet kiűríteni a régi mintákat? (pl. több hónapos spamek alapján eltároltat, amit már nem küldözgetnek).
A külön adatbázis mellett szerintem az szól, hogy az userek nem tudnak egymás levelezési és spam megjelölési szokásaiba belerondítani és talán az adatbázis is kisebb.
Mi a véleményetek?
- A hozzászóláshoz be kell jelentkezni
A külön adatbázis mellett szerintem az szól, hogy az userek nem tudnak egymás levelezési és spam megjelölési szokásaiba belerondítani és talán az adatbázis is kisebb.
hat kisebb nem tudom, hogyan lesz, ha egy kozos tokent 1000x tarolsz el :-)
A kozos / kulon tokendb dilemma kapcsan azt kell megnezni, mennyire hasonlo a userek izlese spam tekinteteben, azaz mennyire valoszinu, hogy ugyanazt a levelet mindenki hamnek vagy spamnek gondolja majd? Ha sanszos (pl. 1 cegrol van szo), akkor mehet a shared db, mert az gyorsabban konvergal (viszont valoban a kozepebe rondithat egy stupid vagy rosszindulatu user, ha elkezd pl. viagras leveleket ham-kent tanitani).
Ha fele usered kinai, fele kubai, fele magyar es fele norveg, akkor inkabb sajat db mindenkinek. Ill. a legszebb az lenne (ezt most nem tudom, hogy tamogatja-e az SA), ha csoportokat lehetne kepezni, azaz a kinaiak egy csoportba, stb. Es akkor egy gyakori tokent nem kene 1000x tarolnod, hanem csak 4x.
(Mondjuk egy jobbfele statisztikai szuro, amelyik foallasban dolgozik tokenekkel az olyat is tud, hogy csinalsz egy kozos token halmazt olyan levelekbol, amelyeket mindenki hamnek vagy spamnek tekint [uid=0], majd megengeded, hogy a userek tanitsak a token adatbazist ugy, hogy ezek az extra tokenek csak a sajat leveleinek kiertekelesekor kapnak szerepet)
De ha azt is beleszamolod, hogy a Bayes db mennyire hangsulyos egy alapvetoen szabalyalapu spamszuronel, akkor lehet eleg indulaskent egy shared token halmaz is...
Továbbá mi történik, ha a közös adatbázis nagyra felhízik? Nem lassítja a kiértékelést? Nem lehet kiűríteni a régi mintákat?
ha berkeley db-ben tarolod a tokeneket, akkor igen. Egy hataron (mereten) tul azt mondjak (akik mar lattak ilyet), hogy valoban lassabb egy nagy meretu db file-lal dolgozni. Bar az SA amugy is doglassu, szoval ki tudja, mennyit oszt vagy szoroz ez a plusz terheles... Ha tudod, tedd a token halmazt is mysql-be (ne myisam, hanem innodb vagy xtradb legyen inkabb), az jol szol, ha jol megtekered a mysql valtozokat...
- A hozzászóláshoz be kell jelentkezni
Köszönöm a részletes válaszodat. Végülis a per-user Bayes db (berkeley db) mellett döntöttem, mert néhányan nem tisztítják az inboxot, csak áttekerik a spamokat. -> szívjanak csak ők.
Mellette szólt még az is, ha valakinél nagyon belassulna a nagy méretű Bayes db miatt, akkor elég csak nála törölni és előről kezdeni, a többi érintetlen marad.
Egyelőre úgy tűnik jól végzi a dolgát. Annyit még érdekességként, hogy kihagytam az Amavist a buliból. Postfix közvetlenül az SA-nak adják át a levelet, így talán pergősebb, erőforrásban hatékonyabb lesz.
- A hozzászóláshoz be kell jelentkezni
Felmerült egy érdekes probléma.
/etc/defaul/spamassassinban:
SAHOME="/var/lib/spamassassin"
OPTIONS="--create-prefs -x --max-children 3 --username vmail --helper-home-dir ${SAHOME} -s ${SAHOME}/spamd.log --virtual-config-dir=/var/mail/virtual/%d/%l"
/etc/spamassassin/local.cf fájlban:
bayes_path ~/bayes
Ennek eredménye minden maildirben: bayes_seen, bayes_toks
Automatikusan használja, bővíti + én is tudom bővíteni a sa-learn segítségével.
Eddig remek.
Viszont jó volna, ha a felhasználó is tudná piszkálni a szabályokat, pl. a roundcube sauserprefs pluginon keresztül (http://notes.sagredo.eu/node/35#sauserprefs).
A fenti beállításban még nem foglalkozik a /etc/spamassassin/sql.cf fájllal, ahhoz a /etc/defaul/spamassassin: OPTIONS= -ba be kell tenni egy "-q" -t is.
Szuper, használja az sql-ből a finomított szabályokat peruser szinten, DE ilyennel boldogít:
Oct 5 21:08:09 2012 [24716] warn: plugin: eval failed: bayes: (in learn) locker: safe_lock: cannot create tmp lockfile /home/vmail/bayes.lock.24716 for /home/vmail/bayes.lock: Nincs ilyen fájl vagy könyvtár
Melynek eredménye a levél fejlécében: autolearn=unavailable
Ha tehát tanulásra érdemes a levél, a /home/vmail-ban keres bayes fájlt, pedig a "-q" kapcsoló nélkül az adott maildirben kereste.
Ha a bayes_autolern -t kikapcsolom, a hiba megszűnik.
Órák óta keresgélek és úgy tűnik, hogy ha az user_prefs-t sql-ből akarom venni, akkor a bayes is csak sql-ből képes működni. Valóban így van?
Azért érdekes, mert bayes sql-re külön táblát és configban sorokat kell felvenni, tehát nem tűnik úgy, hogy össze lennének nőve.
Ha kikapcsolom az autolearn-t, de minden este sa-learn-t futtatok a mappákon, akkor nagyon nem lövök mellé, ugye?
Ha tényleg össze vannak nőve, nincs jobb ötletem a probléma áthidalására.
Előre is köszönöm a tippeket.
- A hozzászóláshoz be kell jelentkezni
Ha kikapcsolom az autolearn-t, de minden este sa-learn-t futtatok a mappákon, akkor nagyon nem lövök mellé, ugye?
ez jonak tunik. Gondolom, eleg csak az elozo 24 ora leveleit tanitod
- A hozzászóláshoz be kell jelentkezni