Wordpress fórum spam

Hálózatok általános

Van egy Wordpress oldal, amin van a regisztrációnál CAPTHA (látszik, hogy szűr), illetve van Akismet is (elkapott napi 20-30 spam-et), ennek ellenére bejönnek humánnak tűnő spammer-ek, és elbuknak azon, hogy a felhasználók első 10 elfogadott fórum hozzászólásáig moderálásra kerülnek a hozzászólások.

Ezt észre is veszik ránézésre, mert elenyésző számban küldenek be több spam hozzászólást, az első után abbahagyják a próbálkozást, mert látják, hogy moderálásra került a spam (aztán törlöm a felhasználóval együtt).

Ez napi 10-30 moderálás és törlés, ami nem nagy dolog, de azért eltekintenék tőle. Mit lehet még tenni szerintetek? Írjam ki, hogy nem fog megjelenni a spam, tehát az ő idejét és az én időmet is feleslegesen raboljuk? :D

Egyéb ötlet? :)

2762 megtekintés

WordPress-be nincs beépítve fórum, szóval melyik bővítményt használod erre a célra?

A hozzászóláshoz be kell jelentkezni

A wpForo-t, de szerintem ebből a szempontból mindegy... nem az a baj, hogy megjelenik, hanem az, hogy próbálkoznak. Szóval a kérdés az, hogy mit lehet még tenni anélkül, hogy jelentősen szopatnám a legális felhasználókat? :)

A hozzászóláshoz be kell jelentkezni

Teljesen minden modulja update annak a WP-nek? Captchaból melyik fajtát használod? Nem lehet már a regisztrációt is email visszaigazolás + adminjóváhagyáshoz kötni?

A hozzászóláshoz be kell jelentkezni

Up-to-date, nem törésről van szó. reCaptcha, invisible módban teljesen jól működik, látom a statisztikát.

"Nem lehet már a regisztrációt is email visszaigazolás + adminjóváhagyáshoz kötni?"

Honnan tudjam látatlanban, hogy spammer vagy sem? Angol nyelvű, de nemzetközi felhasználókkal, jöhet bárki bárhonnan.

A hozzászóláshoz be kell jelentkezni

Látod az azonos IP-ről regisztrálókat, látod ha very fura emailcím van... Ha ennyire nincs azonosítási pont, akkor hamat eljutsz az "ez ilyen" kategóriába és marad a kézihajtány.

A hozzászóláshoz be kell jelentkezni

"Látod az azonos IP-ről regisztrálókat, látod ha very fura emailcím van..."

Nem azonos az IP, a fura email cím se jellemző.

"Ha ennyire nincs azonosítási pont, akkor hamat eljutsz az "ez ilyen" kategóriába és marad a kézihajtány."

Ahja... :/

A hozzászóláshoz be kell jelentkezni

a spamek automatikus torlese x nap mulva...

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

Mi alapján? :D

A hozzászóláshoz be kell jelentkezni

egyreszt van akismet-ed, ami elkap (ill. megjelol) valahany spamet. Masreszt minden nem "OK" statuszu (tehat moderalasra/engedelyezesre varo vagy spam) komment mehet automatikus torlesre X nap mulva...

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

Amit az Akismet elkap, az meg se jelenik moderálásra, ezek átcsúsztak rajta.

"Masreszt minden nem "OK" statuszu (tehat moderalasra/engedelyezesre varo vagy spam) komment mehet automatikus torlesre X nap mulva..."

Értem, a kérdés az, hogy hogyan válogatom ki ezek közül az OK státuszúakat, anélkül, hogy egyenként megnézném? :D

A hozzászóláshoz be kell jelentkezni

És ha a regisztrációnál is kézi erőt vetnél be? Azaz aki átjutott a gépi szűrésen, még szűrheted kézzel (pl. gyanús email-cím). Nem tudom, mennyi valódi regisztráció van naponta, így lehet, hogy a kézi aktiválás több meló, mint a napi 10-30 fórum törlése.

A hozzászóláshoz be kell jelentkezni

"És ha a regisztrációnál is kézi erőt vetnél be?"

Az ugyanaz munkában, mintha a moderálandó listában megnyomnám a törlést, csak annyi információm sincs, hogy spammer lesz-e a felhasználóból vagy sem.

"Azaz aki átjutott a gépi szűrésen, még szűrheted kézzel (pl. gyanús email-cím)."

Nincs gyanús email cím, az még több idő, amíg elgondolkodom azon, hogy vajon gyanús-e.

"Nem tudom, mennyi valódi regisztráció van naponta, így lehet, hogy a kézi aktiválás több meló, mint a napi 10-30 fórum törlése."

Naponta 1-2 legális user jön. De továbbra is az a kérdés, hogy honnan tudom, hogy a regisztráció legális-e? :)

A hozzászóláshoz be kell jelentkezni

De továbbra is az a kérdés, hogy honnan tudom, hogy a regisztráció legális-e? :)

A gyanús email-címre gondolnék első esetben (ami most kiesett). Nem tudom, regisztrációnál milyen adatokat és hogyan kell megadni.
Ha tényleg semmi gyanús nem látszik a regisztrációnál (az email-cím is normálisnak tűnik, IP-cím se ismétlődik, az email-ben megküldött regisztrációs linkre is kattint, stb.), akkor szerintem nincs jobb megoldás (ha jól értem, nincs információ, ami alapján automatizálható lenne).

A hozzászóláshoz be kell jelentkezni

"szerintem nincs jobb megoldás (ha jól értem, nincs információ, ami alapján automatizálható lenne)"

Eddig jutottam én is... :)

A hozzászóláshoz be kell jelentkezni

A spameket nem hagyod jóvá, tehát be kell lőni a rendszert, hogy a jóvá nem hagyott üzeneteket N idő után törölje automatikusan és kész.

A hozzászóláshoz be kell jelentkezni

Meg kell néznem az üzenetet, hogy tudjam, jóváhagyjam-e. Akkor már teljesen mindegy, hogy nem nyomok rá semmire, vagy a törlésre kattintok. :/

A hozzászóláshoz be kell jelentkezni

akkor hozza kene reszelned egy statisztikai kommentspam szuro modult, ami helyetted engedelyez...

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

Nyilván... erre a napi 10-30 üzenetre... azt hiszem marad a kézi szűrés. :)

A hozzászóláshoz be kell jelentkezni

Akkor kéne neked egy felület, ahol az összes jóváhagyásra váró üzenet megjelenik és checkboxokkal kijelölve csoportosan lehet jóváhagyni, vagy törölni. Ez is kézimunka, de sokkal gyorsabban tudod csinálni, mintha egyesével kell őket nézegetni és törölgetni.

A hozzászóláshoz be kell jelentkezni

Oké, de én azt szeretném, hogy ezek meg se jelenjenek. Valahogy tudatni szeretném a spammer-rel, hogy feleslegesen rabolja az idejét és az enyémet is.

A hozzászóláshoz be kell jelentkezni

Hát akkor csak az automata tartalomszűrő fejlesztése marad; a poszt tartalmának az elemzése kell, hogy megmondja, hogy spam vagy nem. A rekapca nem jó semmire, a robotot egy egyszerűbb védelem is megfogja, az ember úgyis átmegy rajta, a júzereket viszont rommá szopatja.

A hozzászóláshoz be kell jelentkezni

"A rekapca nem jó semmire, a robotot egy egyszerűbb védelem is megfogja, az ember úgyis átmegy rajta, a júzereket viszont rommá szopatja."

Eddig nem volt panasz a reCAPTCHA miatt, nem is látszik egyébként. A humán spammer megy át rajta jelenleg.

"Hát akkor csak az automata tartalomszűrő fejlesztése marad; a poszt tartalmának az elemzése kell, hogy megmondja, hogy spam vagy nem."

Ezt nevezik death star design pattern-nek, amikor egy jelentéktelen problémára egy hatalmas rendszert fejleszt az ember... :)

A hozzászóláshoz be kell jelentkezni

> Ezt nevezik death star design pattern-nek, amikor egy jelentéktelen problémára egy hatalmas rendszert fejleszt az ember... :)

Nem tudom mi a halálcsillag azon, hogy az ember javít a spamszűrő algoritmusán...de akkor igazán elárulhatná Vader nagyúr, hogy mégis mit óhajt, mert ha a jelenlegi spamszűrőn átmegy a spam és azt akarod, hogy ne menjen át rajta (mert nem akarsz kézzel törölgetni), akkor nem nagyon tudok elképzelni mást, mint a spamszűrő fejlesztését.

A hozzászóláshoz be kell jelentkezni

Ok, leírnád, hogy miképp javítsak a spamszűrő algoritmusán néhány egyszerű lépésben? :)

A hozzászóláshoz be kell jelentkezni

#1: adatbazis epitese

- legyen 2 halmazod: spam komment, jo komment
- az egyes szavak* gyakorisagat szamold meg mind a ket mintaban (tarold is el valahogy)

#2: uj komment kategorizalasa:
- bontsd szavakra a beerkezo kommentet
- nezd meg, hany jo ill. spam kommentben szerepeltek
- alkalmazd ra kedvenc Bayes, Chi-negyzet, Markov-lanc, whatever algoritmusod, ami kidob egy valoszinuseget
- az eredmeny alapjan dontsd el a komment sorsat

Nem is volt nehez, igaz? :-)

*: a szavak helyett / mellett kifejezeseket is vizsgalhatsz

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

Aha... és ez saccra hány emberhónapnyi munka? És mivel legyek biztos abban, hogy amit az Akismet nem tud jól szűrni, azt én majd fogom tudni?

A hozzászóláshoz be kell jelentkezni

Az Akismet nem a te típikus tartalmad alapján dönti el, hogy az adott bejegyzes kontextusba illik-e, vagy sem (spam).

A hozzászóláshoz be kell jelentkezni

"Az Akismet nem a te típikus tartalmad alapján dönti el, hogy az adott bejegyzes kontextusba illik-e, vagy sem (spam)."

De ezek teljesen egzaktul spamek... ha az ezzel nagyban foglalkozó szolgáltatónak nem sikerül megfognia, akkor én nem sok esélyt látok arra, hogy meg tudom fogni automatikusan. Ha ez egy pár napos feladat lenne, már lenne rá kész plugin, de nem hinném, hogy pár napos feladat, sőt... :)

A hozzászóláshoz be kell jelentkezni

Hát, ha mindenképpen faéket akarsz, akkor a legegyszerűbb mód a szótáralapú szűrés. Ha van egy listád, hogy mik azok a szavak, amiket a spammerek használnak, akkor amennyiben a szótár valamelyik szava szerepel az üzenetben, akkor eldobod. Ha átmegy egy spam, akkor azt persze kézzel kell törölni és megnézni, hogy milyen kulcsszavak voltak benne és azokat is felvenni. Egy ilyen függvényt lefejleszteni kb. 10 perc.

De egyébként még ennél is egyszerűbb dolgod van, ha nem nemzetközi az oldal, mert ha csak idehazulra szól, akkor ki lehet tiltani a külföldi IP címeket és ezzel megszabadulsz a spammerek döntő többségétől. De ha vársz külföldi vendégeket, akkor is érdemes lehet szelektálni, mert egy jól összeállított IP filterlista csodákat tehet, pl. Nigériát vagy az Antarktiszot (nem ez nem vicc) tuti érdemes blokkolni.

A hozzászóláshoz be kell jelentkezni

"Hát, ha mindenképpen faéket akarsz, akkor a legegyszerűbb mód a szótáralapú szűrés. Ha van egy listád, hogy mik azok a szavak, amiket a spammerek használnak, akkor amennyiben a szótár valamelyik szava szerepel az üzenetben, akkor eldobod."

Szerinted: ha a fő tevékenységként ezzel foglalkozó Akismet (https://en.wikipedia.org/wiki/Akismet) szűrőjén átmegy, akkor én fogok tudni fél nap alatt jobbat alkotni?

"De egyébként még ennél is egyszerűbb dolgod van, ha nem nemzetközi az oldal, mert ha csak idehazulra szól, akkor ki lehet tiltani a külföldi IP címeket és ezzel megszabadulsz a spammerek döntő többségétől."

Angol nyelvű nemzetközi, ahogy a spamek többsége is.

A hozzászóláshoz be kell jelentkezni

> Szerinted: ha a fő tevékenységként ezzel foglalkozó Akismet (https://en.wikipedia.org/wiki/Akismet) szűrőjén átmegy, akkor én fogok tudni fél nap alatt jobbat alkotni?

És ebben az Akismetben nincs szótáralapú szűrő? Mert akkor csak el kéne kezdeni felveszegetni a szavakat és nem is kéne írnod semmit.

> Angol nyelvű nemzetközi, ahogy a spamek többsége is.

Volt egy második fele is a mondandómnak: az IP filterlistát akkor is összerakhatod, csak körültekintőbbnek kell lenned.

Sz*rk: Az is lehet opció, hogy ha link van a kommentben, akkor dobja. De csak akkor, ha az userek nem szoktak linkeket postolni.

A hozzászóláshoz be kell jelentkezni

Milyen captcha? Állítólag a Google-féle recaptcha jól szűri a botokat, már ha ezek tényleg botok, akik átjutnak a jelenlegi captchán.

A hozzászóláshoz be kell jelentkezni

Így van, a reCAPTCHA elég jól szűr. Ezek szerintem nem botok... :)

A hozzászóláshoz be kell jelentkezni

Ban Hammer bővítmény alaposan szűri az email címeket.
Illetve hasznos a iThemes Security /Banned Users/Enable HackRepair.com's blacklist feature.
Esetleg w3dev Ban Users bővítmény.

A hozzászóláshoz be kell jelentkezni

"Ban Hammer bővítmény alaposan szűri az email címeket."

Mi alapján? asdf@mail.ru teljesen legális email cím, míg egy fdsa@mail.ru spammer... :)

Megnéztem majd ezeket, csak attól tartok, nem fog beválni... :/

A hozzászóláshoz be kell jelentkezni

Nem értelek, hány regisztrált valós felhasználód van a mail.ru email címmel?
Aztán nem csak a gyakori spam szolgáltatókat zárja ki hanem az 5-10-15 perces email szolgáltatókat is.

A hozzászóláshoz be kell jelentkezni

Vannak bőven... ország szerint USA, Russia, Brazil a top 3 legális user... :)

"Aztán nem csak a gyakori spam szolgáltatókat zárja ki hanem az 5-10-15 perces email szolgáltatókat is."

Nem nagyon figyeltem meg, de szerintem ilyenekről automatizáltan szoktak jönni, ezek már mindenen átjöttek és tudnak olvasni. Valószínűleg kiírom, hogy feleslegesen dolgozik, mert úgyis moderálásra, aztán törlésre kerül.

A hozzászóláshoz be kell jelentkezni

Megnéztem utolsó 1/2 év alatt 3 db kamu felhasználó regisztrált az oldalamra.
2 év alatt összesen 15 próbálkozás volt.
(azt inkább nem írom le melyikre, szeretném ha így is maradna:)

Cloudflare (https + HSTS No-sniff + TLS 1.3 összes titkosítás, tűzfal high)
Az elvadul háborús országok, övezetek, javacript ellenőrzése.
email címek titkosítása
sse (bár ezt nem tudom mit rejthet el automatikusan)

Wordpress
Ban Hammer
iThemes Security
google új Captcha
w3dev Ban Users

Nekem ezek bejöttek.
De lehet a szolgáltatóm a profi!

Te milyen security bővítményt használsz?
Lehet egyszerűbb lenne ebből kiindulni.

A hozzászóláshoz be kell jelentkezni

A klasszikus krix-krax betű számos CAPTHA nálam elbukott. Ha magyar a célközönség, nagyon bevált a "milyen nap jön kedd után" típusú gondolkodós kérdések regisztrációnál, esetleg hozzászólásonként.

A hozzászóláshoz be kell jelentkezni

Akurvaéletbemár... ma ez jött be.

This message is posted here using XRumer + XEvil 4.0
XEvil 4.0 is a revolutionary application that can bypass almost any anti-botnet protection.
Captcha Recognition Google (ReCaptcha-1, ReCaptcha-2), Facebook, Yandex, VKontakte, Captcha Com and over 8.4 million other types!
You read this - it means it works!

A hozzászóláshoz be kell jelentkezni

Hát ez nem öröm...de nézd a naposabbik felét: így lehet, hogy indokolatlanná válik és kiveszik a rekapca nevű emberiség elleni bűncselekmény. :P

A hozzászóláshoz be kell jelentkezni

like :-)

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

Na, de mivel védjem ki? :D

A hozzászóláshoz be kell jelentkezni

Ezt próbáltad már? https://wordpress.org/plugins/invisible-recaptcha/

A fenti cucc ezt elméletileg nem ismeri, csak az v1 és v2 Recaptcha-t.

--
Mobilbarát és reszponzív weboldal készítés

A hozzászóláshoz be kell jelentkezni

Próbáltam, azon át is jöttek... :/

A hozzászóláshoz be kell jelentkezni

Akkor viszont lehet, hogy nem a szűréssel van gond, hanem máshol mennek be - ezt nem nézted még? Van több, forgalmas WP-alapú oldal a látókörömben, és ezek elég jól szoktak működni.

--
Mobilbarát és reszponzív weboldal készítés

A hozzászóláshoz be kell jelentkezni

Átmenetileg bevezetni a moderációt? Bár a jóég tudja mennyire fullosan automatikusak és kivesznek-e site-okat, amiket nem jelent meg a spamjük.

A hozzászóláshoz be kell jelentkezni

Baszki, olvasd el az első bekezdést a témaindító hozzászólásomban és utána a többi bekezdést is.

Azt a munkát szeretném megspórolni, hogy törölgetem az moderálásra váró napi 10-30 fórumbejegyzést, eddig azt hittem, hogy humán erőforrással jönnek be, de úgy néz ki, hogy nagyrészt automatizált a dolog és valahogy megkerülik a védelmeket.

A hozzászóláshoz be kell jelentkezni

Tetsziktudni, hogy ha nem fogja meg automatizmus a spamet, akkor vészmegoldásokból egészen véges számú van.

Az automatikusan megoldásokat itt már elébb kivezésték és nem jutotatok előbbre...

A hozzászóláshoz be kell jelentkezni

Én ezt pontosan tudom, de olyat javasoltál, amit nem javasoltál volna, ha egy bekezdést elolvastál volna... :/

A hozzászóláshoz be kell jelentkezni

szerintem szintet kell lepni a captcha-val: atvaltani heber karakterekre, esetleg rovasirasra. Vagy ott van meg a blackpanther modszer is: 40 ezer forintert adsz egy account-ot, amivel kommentelni lehet. De lehet egy olyan fejtoro is, hogy +/-10%-os marginnal meg kell saccolni, az adott nap hanyadik leggazdagabb ember a Meszaros Cukkerberg a vilagon?

OK, komolyra forditva, en ertem, hogy nem vagy boldog, de ha ez a cucc atmegy a captcha-don, akkor marad vagy a kezzel torteno moderalas (ha nem akarod a rizszabalokhoz outsource-olni a melot), vagy esetleg az a projekt, amit felvetettem, hogy statisztikai alapon, tanulas utan donti el, hogy az adott komment spam vagy sem.

Ehh, addig mergelsz, amig megcsinalom :-) [saas alapon, mint az akismet]

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

"esetleg az a projekt, amit felvetettem, hogy statisztikai alapon, tanulas utan donti el, hogy az adott komment spam vagy sem"

Nézd, ha az Akismet nem tudja kiszűrni a nemzetközi spam-et, akkor én se fogom tudni és nem akarok ilyenekkel tökölni, mert az egy külön szakma.

A hozzászóláshoz be kell jelentkezni

ehh, mi lenne, ha megcsinalnam a prototipus-t, ami - wordpress oldalrol nezve - kb. ugyanugy mukodne, mint az akismet? Gondolom, az adatbazisodban levo kommentek (including usernev) nem szenzitivek, max. a megadott email cim + IP-cim, ahonnan elkuldtek a kommentet. Bar azt meg at kell gondolni, hogy mukodhet-e egyaltalan az akismet mellett egy masik, hasonlo celu plugin...

--
t-systems-es it architect allast keres. Jelige: csak webshopot ne kelljen...

A hozzászóláshoz be kell jelentkezni

CAPTHA, de kicsit másképp:
- A számokat vagy betűket visszafelé kelljen begépelni.
- Minden második karaktert kelljen begépelni.
- Kitenni kb 10 CAPTHA-t, de csak az egyikről kelljen begépelni, de minden alkalommal másikról.
- Mind a 3 módszer egyszerre :)

-------------------
https://onlinestream.hu/ - A legtöbb magyar rádió és TV egy helyen!