( sinexton | 2022. 09. 30., p – 22:46 )

Kösz. Jó a kérdésed. A paraméter miatt valóban marad egyetlen szabad gyök.

Ezzel kapcsolatban írtam feljebb. Hangolni kell. A hibajelzés ellenőrzése alapján feljebb kellhet állítani, valóban. De ez hamar kiderül és gyakorlati tapasztalatom, hogy könnyen és gyorsan hangolható. A 0.6-os érték nagyon jó kiinduló, ettől 0.7 még lehet jó beállítás.

Sőt, mivel az algo minden egyes elemhez vissza adja az értéket, így a fenti stat függvényemmel is lehet extrém limitet vizsgálni és az alapján beállítani. Például 2 sigma megbízhatósággal. Tehát több lehetőség van. Ez így valóban nem 100% adaptivitás, de itt nem is kell.

A tanuló adatok minősége pedig itt nem kérdés, ugyanis valós adatokról van szó, melyekben anomáliát keresünk. Ezek a valós adatok. Semmi teendő nincs. Az AD detektáló mechanizmusnak kell jónak lenni, nem az adatoknak.

Részemről sokat használom a gyakorlatban valós adatokon és az isoforest algot eleve elég adaptívnak és nagyon erősnek találom. Jó összefüggéseket talál és nem kell játszanom a paraméterekkel.