Tegnap még sikerült megcsinálni egyik kötprogot, ami hétvégén nagy valószínűséggel átírásra kerül, mivel projektben kellett dolgozni, és a többiek a tömbbel oldották meg a problémát, ami enyhén szólva lassúvá tette a programot, mert ugye nem olyan vidám dolog egy 1000000 elemű tömben keresgélni...
- Tyson925 blogja
- A hozzászóláshoz be kell jelentkezni
- 1105 megtekintés
Hozzászólások
de rendezheted :)
(persze még más bölcsességeket is beböföghetek, és szerintem más is fog, úgy hogy nem is tujuk mi a probléma :) )
---
Reactor error - core dumped!
- A hozzászóláshoz be kell jelentkezni
Rendezhetem a string tömböt.
Amúgy spam szűrés a feladat.
----
Bárcsak...
- A hozzászóláshoz be kell jelentkezni
Mit tarolsz te 1M rekordban? Nalam 117k rekordba boven belefer a dolog. Es akkor en is ugy szoltam bele, hogy mit sem tudok a reszletekrol :-D Meselj errol a spam szuresrol, hogyan es mikent.
ASK Me No Questions, I'll Tell You No Lies
- A hozzászóláshoz be kell jelentkezni
Nem írtam le, mert szégyenlem az algoritmus egyszerűségét.
Szóval spam szűrésről van szó. Van egy corpus, közel 80.000 mail-l, megnézzük minden e-mailt hogy spam-e vagy ham. Ha spam eltároljuk egy kétdimenziós tömben, magát a szót, és h hányszor fordult elő tömben. Ua ez ham-re. Majd ha beolvasunk egy mailt, a benne szerpelő szavak alapján eldöntjük, hogy az ham-e vagy spam. Mindezt úgy, hogy elötte kiszámoljuk egy adott szó milyen eséllyel szerpel spam-be vagy ham-be. Jelenleg ezzel a pofon egyszerű algoritmussal 92% hatékonyságot értünk el. Nos, nagyjából ennyi.
----
Bárcsak...
- A hozzászóláshoz be kell jelentkezni
Ahhh, valami Bayesian szuro? Nalam cca. 2.500 ham ill. kb ugyananyi spam alapjan keszult el a szotar, es a rekord 99.9% volt, de a rosszabb napokon sem esik 99% ala.
ASK Me No Questions, I'll Tell You No Lies
- A hozzászóláshoz be kell jelentkezni
Az jó. És mindezt hogy csináltad? :-)
----
Bárcsak...
- A hozzászóláshoz be kell jelentkezni
inverz chi square, esetleg Bayesian algoritmus segitsegevel.
ASK Me No Questions, I'll Tell You No Lies
- A hozzászóláshoz be kell jelentkezni
hash treeben? sztringekre az jó gyors...
---
Reactor error - core dumped!
- A hozzászóláshoz be kell jelentkezni
Akkor jobb ötlet?
----
Bárcsak...
- A hozzászóláshoz be kell jelentkezni
azóta már rájöttem, hogy kéne...
----
Bárcsak...
- A hozzászóláshoz be kell jelentkezni
Es el is mondod?
ASK Me No Questions, I'll Tell You No Lies
- A hozzászóláshoz be kell jelentkezni