Spamassassin szabályok

Sziasztok!

A következő a problémám:

A levelezőkliensem kmail, és a spamassassint használja a spam ok pontozására. Eddig szépen működött is, de az utóbbi néhány címemre űj típusú spam ok kezdtek el beömleni. Ezeknek az a tulajdonsága, hogy valami trükkös kis programmal értelmes mondatokat generálnak (vannak ötleteim, hogyan lehet ilyet írni), és a valódi hirdetést mint csatolt gif file tartalmazza. Sajnos ezzel az a baj, hogy a levél törzse illetve a subject teljesen úgy néz ki, mint egy igazi angol nyelvű email, így a spamassassin szinte egyáltalán nem ad rá pontot. A levelek subjectje, tartalma esetről esetre változik, a gif file neve is, csak a tartalma nem nagyon.

Az lenne a kérdésem, hogy hogyan lehetne rávenni a spamassassint, hogy ezeket kidobálja?

Átmeneti megoldásnak az is jó lenne, ha az angol nyelvű ÉS gif kiterjesztésű csatolmányt tartalmazó levelek jó nagy pontszámot kapnának. Egy ilyen szabályt hogyan kell megmondani neki? (A doksik alapján nem voltam képes kitalálni, pedig többet is olvastam.)

Köszönettel:
Csaba

Hozzászólások

én kmail alatt a spamassassin + bogofilter párost használom.

a spam leveleknek külön folder, ide rakja be amit automatán megtalál + amire utólag kézzel rányomok, hogy spam...

ha pár száz összegyűlik belőlük, akkor lefuttatom rajtuk manual a tanulás módot a következő script -el:


for i in ~/.kde/share/apps/kmail/mail/SPAM/cur/*; do
    echo "Learning:"
    echo $i
    echo "  - with bogofilter"
    cat $i | bogofilter -N -s;
    echo "  - with spamassassin"
    sa-learn -L --spam --no-sync $i
done
sa-learn --sync

majd törlöm a könyvtár tartalmát.

3-4 ilyen 100-200 körüli leveles taníttatás után a jelenleg ott tartok, hogy:

- jelenleg 20 nap alatt 279 spam
- mindet magától megtalálta
- 0 hiba, tehát semmi sem ment tévesen spam -ek közé...

ja és ezt már korábban kezdtem, hónapok óta stabilan kóser, ami esetleg néha valamiért kimaranda a felismerésből -nem is emlékszem mikor volt utoljára ilyen- azt a következő taníttatás után úgyis beseggeli...

Az igazság az, hogy itt a kamilen van egy olyen gomb, amire azt írja a doksi, hogy ha egy levelet kijelölök, és a gombot megnyomom, akkor beeteti a spamassassinnak, ami ezt megtanulja. Más típusú spam ok esetében ezzel nem volt probléma, eddig már jó sok félét megtanult ezzel a metódussal.

Ez alapján, és hogy csak ezzel az egy típusú spammal van bajom (értsd, a többit szűri), azt gondolom, hogy a spamassassin trainelése nem megoldás. (Már több száz ilyen típusú spammal próbáltam trainelni, de nem akarja megtanulni.)

Csaba

- az ismétlés egyébként is az egyik legfontosabb dolog a spam tanulásban, baj nem lehet :)
- én is a avval a gombbal csináltam, de valahogy nem hozta az eredményt
- véleményem szerint a kmail által alapban beállított sa-learn --no-sync paramétere a hibás, mivel ha így tanul akkor végül ki kellene adni egy sa-learn --sync parancsot
- bogofiltert is állítsd sorba
- gomb nélküli script -es újrataníttatások után jött nekem is az érezhető változás, de ez szerintem orvosolható az említett --no-sync paraméter kiszedésével a classify as spam filternél...