[data mining] classification kerdes

 ( NagyZ | 2011. február 13., vasárnap - 12:27 )

a kerdes machine learning, de nincs ilyen temank, igy ide rakom :)

van sok adatom. oke, hogy epitek egy dontesi fat valahogy (J48 [weka] vagy randomForest [R-ben]), azonban merre erdemes tovabb haladni akkor, ha van egy masik adathalmazom, ahol olyan ertekek vannak, amik tobb kategoriaban vannak benne (es tudom elore ezeket)?
gagyi modon gondoltam arra is, hogy akkor az egy sorbol ahol x1,...,xN,katN,...,katJ a sor csinalok J darabot, ahol mindig csak egy kategoriat sorolok fel, es ugy trainingelem a classifiert.

vagy gondoltam arra is, hogy valami multilayer perceptronos mokat csinalok, de biztos van ra jobb modszer is.

mire keressek a szakirodalomban?
Ti hogy csinalnatok?

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Ha J darab sort adsz a classifiernek, azt szerintem zajként fogja érzékelni a döntési fa (de javítsatok ki, ha nem). Neurális hálóban talán jó lehet ha annyi outputot csinálsz, ahány kategóriád van (így szokás ugye). Két ötletem van: csinálj minden kategóriára külön döntési fát (igen/nem outputtal) vagy pedig csinálj a metszetekre is külön kategóriákat. Nem tudom mennyire működnének ezek, csak találgatok én is.

mlp helyett azért inkább support vector machine (abból is a tudás alapú), de van még több másik lehetőség a feladattól függően
a "gagyi" módot nem sikerült dekódolnom, de ha a feladat úgy hozza lehet egy lehetőség nem n kategória hanem 2^n

Töröltem a korábban ideír brainstormomat, mert felesleges... Mert:
multi-label classification - téged érintő probléma becsületes angol neve, beírod a google-ba és kitárul a világ ;)

Hierarchikus klasszifikaciora en ezekbol a publikaciokbol indultam el: http://www.kamalnigam.com/

Mi lett vegul a megoldas? Erdekel a problema.