( arpi_esp | 2022. 10. 11., k – 14:05 )

en sem tudok ilyenrol, pedig 20 eve ezzel (spamszuressel) foglalkozom...

spam corpus-ok (minta gyujtemenyek) leteznek, de a publikusak nagyon regiek es elavultak, a frissebbeket nem szivesen teszik kozze. nekem is van sajat 100k emailes gyujtemenyem, gondoltam mar ra hogy publikalni kene, de ahhoz elso korben anonimizalni kene, ami nagyon nem trivialis feladat.

de szures tesztelesre ez is keves lenne, mert a spamszures kb 90%-ban nem a level tartalmaval foglalkozik, hanem az erkezes korulmenyeivel (kuldo ip cime, helo, (rev)dns, rbl listak/blacklistek, smtp protocol betartasa, greylisting stb). en legalabbis a spam levelek kb 90%-at mar ezekkel megfogom meg mielott a level tartalmat latta volna. a maradek 10% megy csak at alapos elemzesen, ez igy eroforras kimelobb is...

szoval en is azt tudom mondani, elesiteni kell a szervert, raengedni az eles mx forgalmat, lehetoleg olyankor amikor sok spam de minimalis ham level varhato (mondjuk vasarnap hajnalban) es figyelni nagyon a logokat...