( arpi_esp | 2022. 10. 11., k – 22:31 )

> a személytelenítést nem érzem problémának

ha publikalni szeretnem az ugyfeleim szervereirol sok ev alatt osszegyujtott spam leveleket, akkor az... mivel benne vannak az o ip cimeik, email cimeik, neha nevek is, raadasul sok spam hasznal tracking linkeket, amivel visszajeleznek hogy melyik email cimrol nyitottak meg (pl. egy kulso szerverrol behivott kep url-jeben benne van az email cim is mint parameter, akar encodeolva pl. base64el)

bar mar nem valoszinu, de nehany nem spam level is keveredhetett koze. legutobb februarban toltottem ugy 3 hetet az egesz gyujtemeny ujra ellenorzesevel, de az is nagyreszt automatizaltan ment, kulonbozo szurokon, neuralis halos modelleken stb atkuldtem es ami picit is gyanus volt (tehat nem 100.000% spam minden modszer szerint) azokat "kezzel" megneztem, tobb 1000 levelet, es igy talaltam is vagy 10 levelet ami megse volt spam, csak nehany szuro benezte.  mondjuk aki mar valogatott kezzel spam mintat, az tudja hogy nem annyira binaris, nagyon sokszor nem egyertelmu meg sokadik olvasatra se egy levelrol, hogy az spam-e, vagy csak egy hirlevel amire valaki feliratkozott, vagy egy eltevedt level stb... vagy ott vannak a kamu konferencia meghivok, amik 1:1-be lemasolt valodi meghivo levelek csak 1-2 url van modositva benne az adathalasz oldalra...

ezeket mind el kene tavolitani/kicserelni. es a level tartalma is lehet kulonbozo modon enkodolva, tehat ehhez minden emailt be kell parsolni, kiszedni belole a szemelyes adatokat, majd lehetoleg ugyanugy vissza encodeolni. ezt meg le kene programozni... megrengeteget tesztelni, ellenorizni. annyit meg nekem nem er az egesz jotekonykodas, hogy ezzel foglalkozzak. szerintem ezert nincs tul sok spam gyujtemeny a neten, mert ezzel mas is igy lehet :)

csapda cimekrol lehetne siman publikalni a beesett leveleket, de nekem eddig nem igazan jott ez ossze, a csapda cimekre alig alig esik be valami, akarhogy "reklamozom" a cimet... valahogy megerzik a csapda-szagot a spammerek :(

A'rpi