Spamassassin Bayes közkincs

Évekkel ezelőtt létrehoztam egy kezdeményezést, most itt egy mellékága is. Minden éjfélkor lecsomagolom a bayes adatokat, amelyekkel fel lehet tölteni a frissen telepített spamassassint.


#!/bin/bash
wget http://artinvoice.hu/spams/bayesian.database.gz
gunzip bayesian.database.gz && sa-learn --restore bayesian.database
/etc/init.d/spamassassin condrestart
rm -rf bayesian.database
exit 0

Részletesebben angolul itt: http://artinvoice.hu/spams

Hozzászólások

Tulajdonképpen érdekelne, csak egyelőre a spamek mennyisége nem lépte át a lustaságom által magas szinten lévő ingerküszöbömet. :) Mindenesetre feliratkoztam, hogy kéznél legyen, ha mégis.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Ez csak "frissen telepített" esetén működik így, vagy ha rálógatok egy cront hogy hetente 1x megcsinálja, úgy is jó? Ennyire nem mélyedtem el a spamassassin-ban.

// Happy debugging, suckers
#define true (rand() > 10)

A restore kapcsoló üríti a meglévőt, és a megadottat importálja helyette. Szóval legfeljebb az enyémmel lesz szinkronban. Az előző blogbejegyzésemben viszont ott vannak a traineléshez szükséges elkapott spamek, amelyeket megtaníthatod a sajátodnak. Ezt csak azért tettem közzé, hogy ne kelljen nulláról kezdeni.
--
Coding for fun. ;)

Rejtett subscribe.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

SA-nak nincs valami olyan formátuma exportra, ami verziózható lenne?
Lehetne egy pl.: git, amibe a résztvevők kommitolhatnák a változásokat, illetve lehúzhatnák a tartalmat magukhoz.
Ergo sok-sok helyről érkező adatokból közös adatbázis építhető, aminek az előnyét nem kell ecsetelni szerintem.