( arpi_esp | 2010. 05. 10., h – 21:17 )

Ha abbol indulok ki, hogy a statisztikai is mennyire el tud kanaszodni, akkor nagyon nem szeretnek AI alapu spamszurest.
Ugye tanitgatni kell ezeket, viszont a felhasznalo altali tanitgatas csak hobbi siznten mukodik, vallalati szinten nem igazan: nem varhatod el az userektol hogy tanitgassak, masreszt van olyan user aki szerint a fonokeitol kapott levelek is spammek... a visszacsatolt automatikus tanitas meg eleg erdekes eredmenyeket tud produkalni.
Pl. egyik cegnel az idegen nyelvu levelek 99%-a spam, amit az egyeb modszerek spamnak minositettek es ezert automatikusan megtanulta a statisztikai szuro spamkent. Igenam de egyszercsak jott azon a nyelven egy nem spam, de a nyelv osszes kotoszavat addigra megtanulta a szuro spamra jellemzonek igy azt is spamnek vette, es igy tovabb. Egy ido utan mar nem lehetett nemet nyelven levelezni. Megoldas: spam stat db torlese, kertem az egyetlen nemetul levelezo usertol egy marek minta levelet, es megtanitottam ham-kent a szuronek. Ezutan az az user megkapott szinte minden spammet, mert a nevet, mailcimet megtanulta ham-ra jellemzonek a rendszer...

Es ez meg csak egy egyszeru statisztikai keplet, el tudom kepzelni egy AI-val milyen mellekhatasok lennenek.

A'rpi