Error function:
https://en.wikipedia.org/wiki/Error_function
Ez a normál eloszlás kumulatív függvénye. A 3 szigma valószínűségének megállapításához használom, eredménye kerekítve 0.027%. Azon értékeket veszem extrémnek, melyek előfordulási esélye ennél kisebb. Ezzel a képlettel könnyű megadni a szigmát, zárt képletet tudok így adni, nem kell tizedeseket kiírni és kerekíteni.
Egyébként meg kumulatív exponenciális valószínűségi eloszlás függvényt alkalmazok, ehhez kell az átlaggal való szorzás és ez miatt van ott a log. Ezzel nem kapunk rossz eredményt a normál eloszláshoz sem (mert a normál eloszlás két szára felfogható negatív exponenciális lecsengésnek), az exponenciálishoz meg értelemszerűen jó, a hiperbolikushoz (legextrémebb) pedig szintén jó lesz (amiatt mert szorzás domainben mozog az exp).
Kiegészítés: Miért ezzel szorozzunk és nem egy tetszőleges értékkel:
Az említett valószínűségi függvény:
e^( -x * lambda )
lambda = 1 / átlag
x-et keresem, p a valószínűség (prob.)
p = e^( -x * lambda )
p = e^( -x / átlag )
ln(p) = -x / átlag
ln(p) * átlag = -x
x = -ln(p) * átlag
Mivel a p valószínűséget én választom meg 3 szigmának, így ezzel kell szorozni. Ha nem ezzel teszed, akkor sérülne a kumulatív exponenciális valószínűség számítás és az integrálja nem 1 lenne (100%), vagy nem ez lenne akkor az átlag.
Egyébként a lambda kiszámítása (1 / átlag) a maximális esélyű paraméter meghatározásból jön (MLF, maximum likelihood function). Tehát keressük azt a függvényt, ami leírja a számsort. Ehhez kell a lamdba paraméter minél jobb közelítése (ez egy 1 paraméteres modell), azt pedig az átlag reciproka adja. Hogy ez utóbbi miért, az további hosszabb infó.
Így nyilván nem lesz nagyon érthető, ha viszont valaki kicsit foglalkozik vele, utána kezd el tisztulni. Tehát az átlag számítás a valósz. függvény paraméterének meghatározásához kell, és nem fordítva. Nem az van hogy van az átlagunk és ahhoz keresünk egy szorzót.
Ezek komplex területek. A miérteket nem tudod így madár távlatból megérteni, főleg nem intuitív módon, ezzel nem is érdemes próbálkoznod. Azért blogolom le, mert használni és alkalmazni egyszerű (az autódat sem te tervezted), és ebben látom a gyakorlati segítséget és hasznot. A cégedben is könnyen tudod használni.