En is voltam Ubuntu konferencian

es nekem is van egy szubjektiv beszamolom.

Hozzászólások

tetszett az előadás, köszönöm.

Amit kritikaként fel szeretnék hozni, hogy a különböző spammer technikák mellett beszélhettél volna a mögöttes szándékokról is.

Nekem is tetszett az előadás. Csak ezért mentem el és megérte. :)
--
\\-- blog --//

Szia!
Az előadás telljesen korrekt volt, mondjuk néhány diakép-poén kicsit erőltetett volt, de ezt ellensúlyozta az előadásmód :)
Stone mellettem hiányolt még némi technikai/üzemeltetési infot, mi a helyzet a szűrő túltanításával, memóriahasználat/teljesítmény párhuzam, stb, de szerintem a rendelkezésre álló időbe bele lett préselve minden ami lehet. Grat.

Szerintem is jó volt, csak ha a spam-ekről egy-egy példát hoztál volna csak, akkor még némi beállítási segédlet is belefért volna az előadásba(Kicsit sok volt nekem ez a levél-minta.). Vagy egy tanítási folyamat lépéseit is belerakhattál volna. Grat hozzá, nem beleszólni akarok, csak egy hozzánemértő véleményét írom le :)

Mas valaki pedig tul technikainak talalta, es meg latvanyosabbat akart :-) Azert nem mentem bele konfig reszletekbe, mert nem egy konkret termeket akartam nyomni, hanem altalaban a statisztikai spamszuresrol szerettem volna ismereteket atadni.

Maga a tanitasi folyamat megvolt az elso vazlatban (felsorolasszeruen), aztan megvettem egy konyvet, amiben azt irtak, hogy ne vetits vazlatot :-), ugyhogy maradt Einstein. Maga a tanitas pusztan annyi, hogy a felhasznalo elkuldi a problemas levelet mellekletkent egy spec. email cimre. Reszerol ennyi a tortenet. Vagy arra gondolsz, hogy a hatterben mi tortenik, hogy a program mit csinal ilyenkor?

csak egy hozzánemértő véleményét írom le :)

Nekem minden velemeny fontos, a profike is, meg a (meg) nem annyira profike is. :-)

ASK Me No Questions, I'll Tell You No Lies

Melyik volt eroltetett? Ha megmondod, akkor igyekszem jobbat keriteni, mert kovetkezo szombaton is akcio lesz :-)

Szivesen mondtam volna tobbet, valaszoltam volna tobb kerdesre is, de 45 perc az tenyleg csak ennyi. Nagyon specifikus dolgokba azert sem akartam belemenni, mert ez egy altalanos ismerteto volt, nem akartam egy termeket nyomni, noha a tesztekhez nyilvan hasznalnom kellett egy konkret termeket.

A tesztben hasznalt konfig eseten ~2MB/level volt a memoriahasznalat. A teljesitmenyt elsosorban az io sebesseg hatarozza meg. A program indulaskor memoriaba olvasott egy ~1-1,3 MB meretu binaris fajlt, ami - relative - gyors muvelet, de massziv paralel olvasasnal ez nyilvan lassulhat.

Egy masfajta osszeallitassal, postfix-szel egyutt hasznalva es demonkent futtatva kommersz vasakon kb. 20 level/sec-ig is fel tudtam tornazni a teljesitmenyt. De itt mar ugyesen kellett a postfix valtozokat is hangolni, es nyilvan volt egy max. pont.

Orulok, hogy osszessegeben tetszett, es ha meg azt is megmondod, hogy pontosan mit ertesz tultanitason, akkor arra is igyekszem valaszt adni.

ASK Me No Questions, I'll Tell You No Lies

Így hirtelen pl a vége ugrik, be ha már magyarázni kell egy poént, az gond:) De ennek a tartalmi részéhez semmi köze, az jó volt. Amit haver szóvátett nekem, az a memóriahasználat volt tulajdonképp, vállalati levelezőszerver, spamassasinn megzabál 2-3-400Mb ramot simán. Külön gépnél nem gond, de mondjuk virtualizálva már ciki lehet. Mennyire lehet kompromisszumot kötni az adatbázis méretével kapcsolatban, hogy a memóriával is gazdaságosabban bánjon?
Túltanítás: előbbi eset, meddig engedjük új tokenet felvenni a szűrőt, és ha korlátozzuk, akkor honnan kezd el törölni? 0,5 től 0 és 1es szintűek felé, h a kevésbé érdekes tokenek tűnjek el?
Illetve mi a helyzet akkor, ha túlságosan specifikussá válik a szűrő, mondjuk mindig ugyanazokkal a partnerekkel levelezik a cég, és egyszer érkezik egy levél, hogy példánál maradjunk, egy vipmailről forwardolt yahoos címről, windows-8859-2 kódolással, html tagekel telezsúfolt borzalom, amit pl informatikai analfabéta nagyi küldött, és csak a nyaralási fotókat szerette volna megmutatni, de a szűrő 100% biztonsággal spamnak sorolja be, és az ember már reflexből meg se nézi.
Mennyire valószínű a fenti scenario? :)

Ja, hogy a Muhammad Ali vs. Sony Liston kep? Hmm, inkabb az lehetett zavaro, hogy kommentaltam a kepet, pedig az onmagaert beszelt. Na sebaj.

N*100 MB memoriat tuti nem eszik meg, bar jo lenne tudni, hogy a haver hany levelet dolgoz fel parhuzamosan? A tesztben hasznalt megoldasnal az adatbazist egy hash-be olvasom be, igy jellemzoen ennek meretevel aranyos a felhasznalt memoria merete. En eloszor mysql-lel kezdtem, es amikor letisztult, hogy mely tokenek hasznosak, akkor maradt ~80k token / 1,3 MB meretben. Ha ez tul sok, akkor lehet agresszivebben torolni, ha nemileg sovanyabb pontossag is megfelel.

A program azokat a tokeneket torli, amelyek csak 1x fordultak elo, de 15 napnal regebben hasznaltuk, max. 5x fordulnak elo, es mar 60 napja nem hasznaltuk, ill. barmit, amit 90 napnal regebben hasznaltunk. Emellett meg torolni lehetne a 0.3-0.7 kozotti valoszinuseggel rendelkezo tokeneket is.

A token felvetelt nem kell korlatozni, ha xy felhasznalo tanitja a szurot, akkor az ujabb tokeneket jelent, majd a sallang idovel kihullik. Fals pozitiv hibak elofordulhatnak, foleg az emlitett lehetetlen levelnel. Problema eseten azonban elo lehet venni vagy a karantenbol, vagy a junk mappabol. Mondom, ez a scenario elkepzelheto, akkora eselye van, amekkora annak, hogy ilyen level erkezzen, de csak addig, amig valaki nem tanitja a levellel a szurot, mert utana mar ilyen level is johet.

ASK Me No Questions, I'll Tell You No Lies

Aham, csak a legtobben az ilyen fals pozitivokra idegesek. Es amugy meg lehetseges, mert nekunk is van egy - mar kilepett - kollega, aki kinn van Spanyolba, es havonta egyszer elkuldi a fotoit a ceges mindenki listara.
--


()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.

Video lesz valahol? Mert sajnos a 2kor kezdodo eloadasok utan el kellett jonnom... pedig a tiedre kivancsi lettem volna.

---
Apple iMac 20"
áéíóöőúüű