( sinexton | 2023. 02. 14., k – 10:53 )

A percentilis nagyon jó statisztikai mutató, csak más matematikai tulajdonságai vannak. Előnye, hogy nem érzékeny az anomáliákra (outlier) és nem kell hozzá semmilyen feltételezés az adatok eloszlásáról. Viszont olyan eredményt ad, mely nem tekinti a tőle magasabb értékek mértékét és eloszlását. Ez nem gond, ha az a cél, hogy az adott ponton lévő nagyságrendet lássuk.

Viszont parametrikus, mert eldöntendő a százalék értéke. Ehhez speciel javaslom százaléknak a felső értékhez  1- EXP(-2) vagy 1 - EXP(-3) értékeket (kb 86.47% és 95.02%), mert az exponenciális eloszlásnál jól illeszkedik matematikailag a szigmákhoz. És majdnem mindig exp az eloszlás sok dolognál (vagy log-normál aminél szintén jó). Ha normál az eloszlás, akkor nagyobb erőt adnak a nem robusztus stat eljárások.

A jelenlegi blog posztban viszont teljesen non-parametrikus megoldást kerestem. És abból kiindulva, ha tudjuk, hogy jó a mérés és nincs benne hiba. Ráadásul úgy, hogy kevésbé hozzáértőknek is könnyen értelmezhető legyen (felső szelet átlaga).

Ezért ez a metódus is nagyon vonzó szerintem, mert még általánosabb. Nem igényel eldöntendő paramétert és szintén nem igényli az ismeretét az adatok eloszlásának vagy az információt generáló gyakorlati mechanizmus bármilyen részét.

Ebből kiindulva, többször szeretném, ha a felső jelelemző érték magába foglalná a legextrémebb kiugrásokat is. És mivel a felső szelet átlaga ezt megteszi, így "felelni" fog az értékben ezért is. Több terület van, ahol ez kell nekem.

Mindkettőt használom.