Statisztika: Jellemző felső érték

https://i.imgur.com/J8rLg5h.png

Egy szoftver felületén több időbeli számsor (például percenkénti pulzus, edzésenkénti kalória fogyás, futási sebesség) jellemzését 2 értékkel jelölik: átlag és maximum érték. Ide nagyon hiányzik egy harmadik. A jellemző felső érték.

Mit értek a kifejezés alatt? Nézzük meg egy példával. Az alábbi számsor a naponta futott kilométereket jelölik egy személynek az utolsó 3 hétben:

1 1 1 2 3 1 1 1 7 3 1 2 2 2 1 1 1 3 1 1 2

 

Ennek maximum értéke 7, átlaga pedig (aritmetikai középértéke) 1.8. Mit jelent az átlag? Azt, hogy naponta 1.8 km-t futott átlagosan. Matematikailag kifejezve, a napi várható érték 1.8 km. Vagyis mi az a jövőbeli érték, mely várhatóan a legkisebb hibával tér el az összes értéktől. Súlyban mérve ettől ugyanannyi kisebb és ugyanannyi nagyobb érték jelenik meg.

Viszont ebből csak 2 dolgot tudunk. Hogy mi volt a maximum és mi volt a jellemző közép érték. De mivel a maximum a legmagasabb kiugró értéket mutatja, ami bármilyen extrém lehet a többihez képest, ezért egy nagy lyuk tátong a statisztikai leírásban. Mégpedig az átlag és a max érték közötti információ hiánya.

Ugyanis nagyon hasznos lenne még legalább azt az egyetlen értéket látni, mely azt mutatja, hogy az esetek nagy részében mi volt a jellemző felső érték. Azon eseteket tekintve, amikor az átlagnál nagyobb érték jelenik meg, azok közül mi a várható érték? Vagyis jellemzően milyen magas érték fordul elő?

 

Itt egy egészen egyszerű statisztikai számítást mutatok be, melyet könnyű értelmezni. És mely nem bonyolult valószínűségi eloszlás függvények paramétere. Ráadásul legyen független az adatok sűrűségi eloszlásától és ne kelljen feltételezni semmit az adatról statisztikailag. Például hogy normál eloszlású-e vagy exponenciális stb. Ezt megteszik a robusztus statisztikai leírók (például medián és Q3), de azok meg nem reagálnak az adatok eloszlására. Ha a számsorban nincsen hiba (anomália vagy mérés hiba), akkor figyelembe kell venni mindent.

Beláthatjuk szerintem, hogy mind a fenti esetben, vagy mind például a szívverési értékek esetén hasznos információ lenne látni az egyetlen maximum kiugró helyett vagy mellett azt, hogy a nagy értékek általában milyen érték körül szórnak. Az esetek nagy részében milyen magas a pulzus? Vagy a vérnyomás? Nem csak azt az 1 esetet nézve, amikor a legmagasabbra szaladt. Hanem állandóan.

 

A jellemző magas értéket a következő módon számolom ki:

Az átlagánál magasabb értékeknek az átlagát veszem.

 

A fenti számsorhoz 2.8889 jön ki, ami kerekítve 2.9 km per nap. Tehát a fenti adatot úgy értelmezhetjük ezzel, hogy átlagosan napi 1.8 km-t fut, de jellemző a 2.9-es magas érték.

 

Könnyű kiszámolni és egy hasznos mutatót ad véleményem szerint. A fenti ábrán kékkel a várható közép, vörössel pedig a várható felső érték látható. (Klikk a képre a nagyításhoz)

Ugyanez bármilyen más területen is alkalmazható. Például pénzügyi összesítésekhez vagy informatikai területen szerverek CPU és hálózati terhelésének leírásához.

 

Kiegészítés: Excel képlet angolul a felső érték meghatározásra, ha az adatok az "A" oszlopban vannak:

= AVERAGEIF( A:A, ">" & AVERAGE(A:A))

Hozzászólások

Szerkesztve: 2023. 02. 12., v – 08:54

A feladat más volt, de az írásodról ez jutott eszembe:

Kb. 1981-82-ben írtam EMG-666 számítógépre egy programot a munkahelyemen, ami (hőtechnikai kísérletekhez) mérésadatgyűjtőt vezérelt és az egyik kísérletnél kb. 20 helyről, kb. 10-20 percenként, sok napon keresztül olvasott és értékelt ki hőmérsékletadatokat.

A hőmérők csupán néhány mikrovoltnyi feszültséget szolgáltattak, ezért egy aranyérintkezős read relés krosszbár telefonközpontot kapcsolgatott, ami egy csöves (tehát nagy belső ellenállású) mikrovoltmérő felé kapcsolta az éppen mérendő pont felől érkező feszültséget.

Mivel sok hőmérő több tíz méter távolságban volt és sok más elektromos berendezés volt a környéken, a vezetékek (bár árnyékoltak voltak) zavart is szedtek össze. Így aztán érkeztek irreálisan magas és alacsony értékek is.

Ezek közül kellett kiválogatni a "valósnak feltételezhető" értékeket.  

A következő módszert találtam ki a válogatásra:

Minden mérési pontot többször mérettem. Ez egy állítható paraméter volt, a konkrét feladatnál a 11 (páratlan számú) mérés vált be. A 11 mérés kb. 3 mp-ig tartott. Ez után lépett a következő mérési pontra.

Egy mérési ponttól gyűjtött adatsor átlagolása:

  • A 11 db. mért értéket nagyság szerint sorba rendeztem.
  • Ha a min. és max. érték közti különbség nagyobb volt, mit a "megengedett" paraméter, akkor a max. és min. értékeket (tehát mindkettőt) eldobtam. (Ezek beszámítása hamis eredményhez vezettek volna.) Ekkor maradt 9 db. érték.
  • Ezt a lépést ciklusban ismételtem mindaddig, amíg a min. és max. közti különbség belülre nem esett a megengedetten.
  • A maradék értékeket kiátlagoltam, és ezt tekintettük az adott mérési pontra vonatkozóan "használható" értéknek.

A program naplózta azt is, hogy az adott átlag értéket hány mérési adatból átlagolta. Ha visszatérően kevésből, akkor az a mérési pont javításra szorult.

--------------

Ha a Te méréseid átlagát így számolnánk, akkor:

1 1 1 2 3 1 1 1 7 3 1 2 2 2 1 1 1 3 1 1 2
1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 7 (sorbarendezve)
   1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3   (két szélső értéket elhagyva)

 

szigorúbban:

1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 7
  1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3
     1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3
        1 1 1 1 1 1 1 1 1 2 2 2 2 2 3
           1 1 1 1 1 1 1 1 2 2 2 2 2

Pont ugyanezt csinálom amikor a vásárlási szokásokat elemzem.  Lényegében levágom az adatsor két végét, így szűrve ki az extrémitást. 

A módszer nem új. Nem állami pályázatoknál is szokták használni, hogy ne szopják be a legolcsóbbat és ne kelljen foglalkozni az eltévedettekkel.

Stabil középértékhez lehetőségnek ajánlom a 63.21%-os percentilist (1-e^-1). Az 50%-os (medián) túlságosan alul értékel, az átlag pedig outlier-ek miatt felül lőhet. Az említett előnye, hogy ugyanakkora az értéke, mint az átlagnak, exponenciális eloszlás mellett (mely a normál mellett sokszor fordul elő). Egyébként pedig érzéketlen az outlier-ekre.

Excel képlet, ha az "A" oszlopban vannak az adatok:

=PERCENTILE( A:A, 1 - EXP(-1) )

Itt írtam róla:

https://www.facebook.com/andras.horvath.940098/posts/pfbid02sahbvbCyDiW…

nagy ritkán (értsd: évente max egyszer, de inkább ritkábban) el szoktam szívességmelót vállalni. Azért nem ingyen, mert ha valamit ingyen csinálsz meg, akkor semmire se értékelik. Azt szoktam mondani, hogy hozzon 3 árajánlatot, és az 50%-ért megcsinálom.

Az nagyjából az anyagköltség, a többi ingyenes. Van amikor drágálják, van amikor nem kérnek 3 árajánlatot (ekkor automatikusan kuka), van aki megsértődik, merthogy miért nem szivességből csinálom meg.

De akkor ez a módszer se jó. El kell felejteni a szivességet.

Neked nincsenek haveri körben cégek, akiknek nyomott áron bevállalsz ezt-azt? Vagy a barátság eddig ne terjedjen?

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

Nincs.

Amikor fiatal voltam sok "barátom" volt. Észrevettem, hogy a  többség valamit akar és igazából nem én érdeklem, mint személy őket, hanem használnak, mint erőforrást. Ekkor megfogadtam, hogy bármikor, ha a hívnak ezzel kezdem:
- De jó, hogy hívsz! Kellene nekem segíteni a  héten. Pár óra lenne. 

A vége az lett, hogy el sem mondták mit akarnak és kihátráltak a beszélgetésből. Sokan már rá sem kérdeztek, hogy mit kellene segíteni. Ekkor olyan 26 éves lehettem.

Azóta már új barátaim vannak. Minden barátommal egy közös van bennünk, nem kérünk segítséget  a másiktól csak véleményt, ami vagy szakmai vagy személyes.  

Erdekes.

Nekem volt par bebukott 5letem, hogy gondoltam, ha egyszer ujra belefogok a kovetkezo vilagmegvalto 5letembe,

akkor elotte kikerem valakinek a segitseget/velemenyet. Mert nyilvanvaloan velem van a baj,

mert a mukodo 5letem penzugyi kudarcba vegzodott (azert mukodo, mert mas megcsinalta aztan vilagszinten:)

De akkor kar ezen rugozni. Aki tudna segiteni (mert olyan szinten van), az valoszinu nem fog, pont amiatt amit irtal.

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

Nem-nem. Van egy termekotlet (en mar csak ilyen kezzelfoghato dolgoknal lyukadok ki), ami vagy nem letezik, vagy letezik de meg lehet csinalni tizedeert (nem ugyanazt, gagyibban). Altalaban ezeket megcsinalom magamnak (tehat hasznalom).

Es akkor innen szokott jonni a bukta. Valoszinu a cegvezetes/marketing/konyvelesnel/koritesnel bukok be.

 

Otletelni sorozes kozben, amikor valamibe bele akarok vagni, azt meg mar altalaban megcsinaltam magamnak, vagy megvettem hozza az alapanyagokat, es felkesz.

 

Mondok egy baromi egyszeru 5letet, hogy ne logjon a levegobe:

Gyarban szerszamnyilvantartas. Fogsz egy DB25-os csatlakozot teszel ra solder blobokat meg dip kapcsolot, minden szerszamra felcsavarozod.

Anyagarban kb. 1500Ft darabja, eladod 5-10eFt-ert.

Van millio masik megoldas (rfid, vonalkod, stb, stb). De van olyan usecase, amikor a fenti pont eleg (van eleg bemenet a plc-n, ritkan cserelnek szerszamot, tehat belefer, hogy dugdossanak csatlakozot).

Ez csak egy otlet volt. Mondjuk legyen egy prototipus is keszen. Es akkor innen hogyan tovabb? A csatlakozot kinabol veszem, a nyakot kinaban gyartatom, a vedoburkolatot itthon hozza. Es eladom mondjuk kulfoldre.

Valahol elbukok, a konyveles baromi nehez falat (kulfoldi import, kulfoldi export, anyagkoltsegek elszamolasa), sose lehetsz biztos, hogy minden jo.

 

Van millio ilyen otletem, de tenyleg. (lehet hogy ezt szarnak talalod, lehet lenne masik otletem, amit egy fokkal jobbnak). De a ceges megvalositasban mindig elbukok (mar van par mogottem, a vegkovetkeztetesem, hogy kell egy wingman mogem, hogy amikor hivatalba jarkalsz, mert feljelentettek, akkor az ne legyen problema). De igazabol ehhez kapcsolati halot kellett volna epitenem kiskoromban. Nem pedig kockulni.

 

Most azt csinalom, hogy kb. visszavonultam, egyedi projekteteket neha bevallalok, akar fizikai dolog (valami gyarba), vagy szoftver. Es kivontam magam a forgalombol. Ilyen nagy ceges dolgokba, meg nem vagok bele. (nagy relativ. Nekem nagy minden ilyen ceges dolog:)

 

Egy normalis orszagban, aki ilyeneket csinal (azaz itthon nem vetelytars, kulfoldre ad el szoftvert vagy hardvert), annak az allamnak melle kene allnia, adotanacsadot biztositani, hogy haladjon a cucc. Itthon meg rengetegen (ez tipp, en biztosan) azert nem vagnak bele semmibe, mert nem akarnak hivatalbol hivatalba jarkalni.

Szoval itthon multinak kell lenni, hogy az egesz burokraciat telibeszard. Ez a megkeseredett velemenyem.:))

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

Az első hiba az, hogy ötletalapú vállalkozást keresel. Nem számít az ötlet, a kivitelezés számít. Használhatod más ötletét is, ha a  jelszó: jobbat, olcsóbban.

Elektronikai cuccoknál 15% alatt kell lennie az előállítási költségnek. Minden más, fejlesztés, marketing, logisztika, ellátási lánc árrése, akciókra tartalék.

"Gyarban szerszamnyilvantartas. Fogsz egy DB25-os csatlakozot teszel ra solder blobokat meg dip kapcsolot, minden szerszamra felcsavarozod.
Anyagarban kb. 1500Ft darabja, eladod 5-10eFt-ert.
Van millio masik megoldas (rfid, vonalkod, stb, stb). De van olyan usecase, amikor a fenti pont eleg (van eleg bemenet a plc-n, ritkan cserelnek szerszamot, tehat belefer, hogy dugdossanak csatlakozot)."

Ezt úgy kell elképzelni, mint egy prés vagy fröccs szerszámot ami felszereléskor csatlakoztatja a DB25-öt? Hány ilyen szerszám van egy cégnél? Mennyiért szereled fel? Eladod egy gyárnak az ötletet akik gépeket és szerszámokat is csinálnak? Ki a  vevő? Mekkora a kosara? Miért tőled vegye és miért ne csinálja meg saját magának?

Eloszor is koszonom, hogy valaszoltal. Tenyleg.

 

> Az első hiba az, hogy ötletalapú vállalkozást keresel. Nem számít az ötlet, a kivitelezés számít.

> Használhatod más ötletét is, ha a  jelszó: jobbat, olcsóbban.

 

Aki valamit kitalal (legyen az elektromos talpbetet, akksis levegoszuro maszk, akarmi), az mind igy gondolkodik, mint en. Valami ami eddig nem volt, de szuksege van ra, vagy latja, hogy ez lehuzas es tizedannyiert (mashogy) meg lehet oldani ugyanazt a problemat.

Mind igy gondolkodik, hogy elobb van meg a termek(otlet), es utana pedig piacra dobja.

Namost aki sikeres, az altalaban osszeboltol egy haverjaval, aki a penzugyi reszet viszi. Ezert vegzi a legtobb "feltalalo" az ehhalal kuszoben.

Ezert adja el egy konyviro az egesz franchise jogot 10kUSD-ert, mert a penzugyi reszet kb. "leszarja".

 

> Elektronikai cuccoknál 15% alatt kell lennie az előállítási költségnek. Minden más, fejlesztés, marketing, logisztika, ellátási lánc árrése, akciókra tartalék.

 

Lehet. Sajnos.

 

> Ezt úgy kell elképzelni, mint egy prés vagy fröccs szerszámot ami felszereléskor csatlakoztatja a DB25-öt?

 

Pontosan ugy kell elkepzelni.

 

> Hány ilyen szerszám van egy cégnél?

 

Ahany termeke volt az elmult 5 evben szorozva 2-vel minimum. Egy nagyobb gyarban mondjuk 80-150 db.

> Mennyiért szereled fel? Eladod egy gyárnak az ötletet akik gépeket és szerszámokat is csinálnak?

 

Eloszor is ez egyike a szar otleteimnek (a tobbit en magam jobbnak gondolom).

Azert irtam, mert meg lehetne csinalni, nem teljesen marhasag, es konkret dologrol beszeljunk, es ne logjon a levegoben.

 

Ez a csatlakozos 5let egy gyarnak azert jelentene jobb alternativat, mert egyszeru, mint a faek. Anelkul integralhato a jelenlegi gepekbe, hogy annak a hardverehez hozza kellene nyulni (csak kell 2^x szabad bemenet. Ha <31 szerszama van akkor 4 db szabad bemenet kell egy plc-n).

Minden mas megoldasnal kellene olvasot is venni hozza (pl. vezeteknelkuli vonalkodolvaso), dragabbra jon ki, mint megvenni  30db ilyen csatlakozot.

Raadasul minden mas megoldasnal egy uj szoftverelemet is behoztal, mert a vonalkodolvaso mondjuk csak X adatbazisba tud dolgozni, akkor kell neki egy ipari pc, vagy valahogy integralni kell.

Mindegyik ilyen megoldas hozna magaval egy szoftveres terhet (software baggage).

 

> Ki a  vevő? Mekkora a kosara?

 

Ez jo kerdes, mert altalaban egy gyarnak kellene lennie a vevonek. Namost itthon a gyarak 90%-a kulfoldi kezben van, altalaban ausztriabol vagy nemetorszagbol kiutalt gyarakrol van szo, mert ott nem felelnek meg a kornyezetvedelemnek mar, vagy a lakossag utalja a kornyeken (valami kemikaliaval pancsolnak:).

Namost ha egy gyarat attelepitesz egy gyarmati peremteruletre, akkor arra nem akarsz mar kolteni.

De ha koltesz, akkor azt te (mint tulajdonos) dontod el.

Azaz, minden fejlesztest (ez pedig az, mert karbantartasba nehez beszuszakolni, arra meg amugy is alig adnak penzt),

szoval ezt a fejlesztest is ausztriaban vagy nemetorszagban kellene jovahagyni.

 

Es akkor eljutottunk oda, hogy kell egy ismerettseg, vagy egy meret, ami folott szoba johess.

 

> Miért tőled vegye és miért ne csinálja meg saját magának?

 

Ez arazas kerdese. Tegyuk fel, hogy 10khuf/db-ert adnam.

Ahhoz tenyleg el kell menni otthonrol, hogy valaki ehelyett sajat maga kezdje el gyartani.

 

> Mennyiért szereled fel?

Idealis esetben, ezt a gyar intezi a karbantartoin keresztul. Kulonben mindig egy random PLC-hez kell hozzanyulni. Legyen az Siemens (leggyakoribb), schneider, omron, valamelyik kinai, akarmi.

 

 > Eladod egy gyárnak az ötletet akik gépeket és szerszámokat is csinálnak?

 

Ez alapvetoen egy retrofit otlet. Azaz uj gepnel is szoba kerulhet, de lehet, hogy ott mar masik megoldas jobban adja magat.

Ugye nekik van egy budgetuk, amiert a gepet keszitik, es lehet ez olyan nagy, hogy mindegyikre egy forgo aranybabat csavaroznak, amelyiknek a belsejeben egy rfid kapszula van.

 

> Ki a  vevő?

 

Ez az, hogy lehet, aki dontesi pozicioban van (mondjuk egy gyar itthoni muszaki igazgatoja), az nem is ert hozza, hanem minden evben a fejlesztesi keretet egy kulsos cegre bizza, es azok allnak elo, hogy mit mennyiert oldanak meg, es azokbol az ajanlasokbol valaszt.

 

> Mekkora a kosara? Miért tőled vegye és miért ne csinálja meg saját magának?

 

Ez arazas kerdese, hogy maganak megcsinalja-e vagy sem.

Minel egyszerubb az 5let, annal inkabb arazas erzekeny, mert valaki felfujja magat, es inkabb megcsinalja sajat maga.

 

De igen, valoszinu, hogy ez az 5letem is bukasra lenne itelve, mivel a penzugyi reszet teljesen elhanyagolom.

 

Van meg masik par otletem, de igazabol akkor mindegyiknek ugyanaz a baja. nem eleg az otlet, nem eleg a termek, ide kell egy komplett penzugyi vena, hogy ezekbol lehessen valami.

A multbeli dolgaim is kb. ezert buktak meg. Meg annyit hozzatennek, hogy akozott, hogy betalaljanak, es ne lass ki a megrendeles kozul, es akozott, hogy eppen alig van par megrendelesed, az a befektetett munkaban kb. 10-20% kulonbseget jelent.

Es azt lehet, hogy epp a marketingbe kell fektetni (manapsag youtube csatornat inditanek ra).

 

Igazabol lebeszeltel, es megnyugtattal is. Van annyi munkam, amivel egy szemelyben megbirkozok evente.

Ennel tobbet akarnek, akkor kellene valakivel vagy valakikkel tarsulni. Lehet ez mar nem hianyzik nekem. Van eleg mindenem. Es legfokeppen van szabadidom.

Plusz a feljelentesek se hianyoznak. (eddig kb. meg nem volt olyan ev, hogy valaki valamiert ne jelentett volna fel.)

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

Nálam ez ott bukik, hogy minden utasítás , kép az ERP-ben van. A termelésirányítás is és az operatív utasítások is. Mindennek van helye, egyedi azonosítója, a rendszerben van róla kép, utasítás. kb esélytelen arra, hogy rosszat tegyen fel. 

A megoldásod nem old meg így nekem semmit.

> Nálam ez ott bukik, hogy minden utasítás , kép az ERP-ben van.

...

> A megoldásod nem old meg így nekem semmit.

 

Tekintsd ugy, mint egy egyszeru soros kommunikacioban a CRC-t. Altalaban nem kell, de amikor kell, akkor nagyon kell.

Egyebkent, meg valahol mar 2 hete masik termeket gyartanak az SAP szerint, holott mar volt kozben 2 szerszamcsere is.

 

Nezd ez egyebkent egy eleg valos problema, ahova mindenki valamilyen workaroundot eszkabal, *te* is.

A problema konkretan az (es most probalok egy olyan peldat hozni, ami nalad is elofordul, de ha nem szolj!), hogy veszel egy gepet, mondjuk egy palackozo gepet.

Ezt legyartja valamelyik nemet ceg (mi mas, ugye?:), es ott be lehet programozni, hogy egy palackba hany ml cuccot nyomjon (nyomas, ido, barmi alapjan).

Es addig el lehet jutni, hogy ezt a muszakvezeto kapcsoloval at tudja allitani.

Es innen jon a workaround mindenkinel, azaz, hogy ezt a kulonbozo palackokba torteno gyartast nyomonkovesd. Valaki plusz PLC-t epit a gyari gepbe, valaki meg korbejar egy muszak elejen es vegen, es felirja, hogy mibol mennyit gyartottak.

Te azt irod, hogy minden gyartasi fazist, mielott vegrehajtananak a munkasaid, elotte felviszik az a vallalatiranyitasi rendszeredbe, akar fotoval dokumentalva.

De ha ranezel ez is egy workaround. Mert a problema gyokere az, hogy a gep nem tud rola, hogy epp milyen flakonba gyart.

 

Egyebkent van olyan otletem, amit maganembereknek szannek, de az meg durvabb. Mert az tenyleg egy hit and miss.

(Azaz, ha bejon, akkor nagyon bejon, ha meg nem, akkor meg mondjuk a garancialis nyugjeiddel csodbe is visznek).

 

De nem farasztalak ilyenekkel, mert a problema nem ott van, hogy van egy 5let, ezt le is gyartottam, es mukodik (nalam), es ezt ertelmesen is tudnam gyartatni (azaz elfogadhato aron).

Hanem, hogy ezt hogyan konyveljem, hogy maradjon belole valami (itt nem adot csalnek, csak altalaban kinabol veszek alkatreszt, itthon gyartatok hozza ezt-azt, es kulfoldre adnam el). Es akkor ott van a marketing resze. Es ez meg nem is igazan az amit mondasz, ami az egesz penzugyi vonal. Azt teljesen elhanyagoltam.

De hogy ne ugy nezzen ki, mintha a vilagmegvalto 5letemet irtam volna le, itt van par meg:

- csinaltam egy HMI-t raspberry alapon full html+css, es erintokepernyo. Egy feludules volt a PLC-k win95-ot meghazudtolo HMI-k utan. (Marmint nem egyet, hanem 50-et). Nem hiszem, hogy lenne ra igeny egyebkent. Az egesz PLC ipart kellene gyokerestol felforgatni...

- csinaltam egy pozitiv nyomasu maszkot. Ezt frankon hasznalom, rettento mod bevalt. Van a piacon? Hell yeah, 300kHUF-tol indul de van 600kHUF-ert is.

Mennyiert tudnam gyartatni? 30kHUF alatt. Barmelyik maszkhoz illesztheto (bar adapter kell hozza), en a szokasos 3M 6000 sorozatu maszkhoz csinaltam meg.

Lidlis akksival megy, egy akksi olyan 2 orat tud. A Düne film adta az 5letet egyebkent.

- napelemteto szokasos hejazat nelkul. Komplett garazsbeallot lehetne gyartani kulcsrakeszen szigetuzemben, autot tudna tolteni 6A-en (megcsinaltam magamnak ezt is:).

 

Ahh, reggelig folytathatnam. Minden hetre jut 5let, igazabol haverokkal talalkozok, inkabb szolnak,bhogy ne farasszam oket. A penzugyi resz ami hianyzik.

De ha arra ragyurok, akkor meg az 5letek kifejlesztesere nem jut ido. Meg szerintem a penzugyi reszehez komolyan kellene tanulnom legalabb 2 evet, egy olyantol aki erti is.

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

"De ha ranezel ez is egy workaround. Mert a problema gyokere az, hogy a gep nem tud rola, hogy epp milyen flakonba gyart."

Tudom milyen gépem vannak & Tudom ki dolgozik rajta & Tudom mit vett fel a raktárból a dolgozó & Tudom mit vételeztek be a dolgozótól

=> Tudom mi készül a soron.
 

Gépek már nagyon nem nyugatról jönnek. Nekem a legeurópaibb megoldásbeszállítóm cseh, alkatrészek származása meg vegyes. 

 

Hagyjuk abba az offot.

nyaron lakasfelujitottam, a legolcsobbak annyira kirivoan olcsoak voltak, hogy kukaztuk oket. kaptam festesre olyan ajanlatot, ahol az anyagkoltseg korul volt az ajanlat. itt vagy rejtett koltsegen akartak behuzni a tobbit, vagy valami mas atveres volt, mashogy egyszeruen nem eri meg.

(ertsd: az ajanlatok valahol az 5-7k savban jottek, ez meg volt 2k; a tetejet is kukaztuk, azok 10-12k korul voltak.)

Szerintem jó és egyszerű megoldást adtál rá. Izgalmas kihívás lehetett.

Mivel stabilitást kerestél egyetlen hőforrás tekintetében, így a medián esetleg jobb lehetett volna ilyen esetben, mivel a sorba rendezett értékek helyét binomiális eloszlás stabilizálja. Emiatt nem tudnak sokat előre vagy hátra ugrani. Ezért a medián egy erősen hibatűrő számítást ad, mely érzéketlen az extrémekre.

Bejegyzésem témája jelenleg nem az extrémek kiszűrése, hanem csupán a magasabb értékek összegzése. Amit említesz is jó megoldás, főleg kevés információ esetén. Vannak viszont "okosabb" megoldások, mint például az eloszlás elemzése után a megfelelő eloszlási függvény felhasználásával meghatározni az extrémitás hátárértékét. Erről írtam pár szösszenetet.

Ennek az az előnye, hogy nem csökkenti az adatot amíg el nem fogy, ha újra és újra ráeresztjük a számítást. Hanem matematikai referencia pontokat használ. Tehát önmagához az adathoz képest lesz adaptív.

Az én esetemben minden érték valós, tehát mindegyik számít. Abból indultam ki, hogy ismert hogy nincs mérési hiba.

Köszi.

Mgen, pont ez a jo kerdes... ha egy ilyen sorozatod van hogy 1 1 1 2 3 1 1 1 7 3 1 2 2 2 1 1 1 3 1 1 2, akkor a jellemzo felso ertek az valoban a 3. De ha ez van, hogy:

3 2 1 2 1 1 1 1 1 1 3 1 2 1 1 1 2 1 2 1 3 1 1 1 7 1 1 1 2 3 2 1 2 7 1 2 1 3 2 1 1 3 1 1 1 1 2 2 1 3 1 1 7 3 1 2 1 2 1 3 1 1 2

akkor mi a jellemzo felso erteked? Mert ugye a bemeneti eloszlas a peldadban is meg ennel is egzaktul ugyanaz... csak itt hosszabb a minta :)

2.8503401360544216 jön ki. Ha az eloszlás ugyanolyan, akkor hasonló érték fog kijönni.

Kieg.: az eredeti adatot 100 ezerszer vettem (2.1 millió érték) és erre az eredmény 2.888887689595689. Azért változik picit, mert hozzáveszem a számításban a felső szelethez az eredeti átlagot, hogy kijelölje az alsó szintjét a felső szeletnek. Ez azért kell, hogy kevés adatnál se legyen torz a felső átlag, vagy pedig akkor, ha nagy az ugrás a felső szeletben. Például:

1 2 1000 2000

Itt ugye nagy az ugrás a felső felében, és így a felső szelet átlaga 1500 lenne. A számításommal ez 1250.25.

A percentilis nagyon jó statisztikai mutató, csak más matematikai tulajdonságai vannak. Előnye, hogy nem érzékeny az anomáliákra (outlier) és nem kell hozzá semmilyen feltételezés az adatok eloszlásáról. Viszont olyan eredményt ad, mely nem tekinti a tőle magasabb értékek mértékét és eloszlását. Ez nem gond, ha az a cél, hogy az adott ponton lévő nagyságrendet lássuk.

Viszont parametrikus, mert eldöntendő a százalék értéke. Ehhez speciel javaslom százaléknak a felső értékhez  1- EXP(-2) vagy 1 - EXP(-3) értékeket (kb 86.47% és 95.02%), mert az exponenciális eloszlásnál jól illeszkedik matematikailag a szigmákhoz. És majdnem mindig exp az eloszlás sok dolognál (vagy log-normál aminél szintén jó). Ha normál az eloszlás, akkor nagyobb erőt adnak a nem robusztus stat eljárások.

A jelenlegi blog posztban viszont teljesen non-parametrikus megoldást kerestem. És abból kiindulva, ha tudjuk, hogy jó a mérés és nincs benne hiba. Ráadásul úgy, hogy kevésbé hozzáértőknek is könnyen értelmezhető legyen (felső szelet átlaga).

Ezért ez a metódus is nagyon vonzó szerintem, mert még általánosabb. Nem igényel eldöntendő paramétert és szintén nem igényli az ismeretét az adatok eloszlásának vagy az információt generáló gyakorlati mechanizmus bármilyen részét.

Ebből kiindulva, többször szeretném, ha a felső jelelemző érték magába foglalná a legextrémebb kiugrásokat is. És mivel a felső szelet átlaga ezt megteszi, így "felelni" fog az értékben ezért is. Több terület van, ahol ez kell nekem.

Mindkettőt használom.

Nagyon keves modszer nem parametrikus. Az outlierek miatt meg az atlag is tekintheto parametrikusnak, egy cauchy/lorentz/breit-wigner eloszlas eleg sok helyen elofordulhat, igy csonkolt atlag vagy hasonlo kell.

Amikor olvastam a fenti modszert, egybol az jutott eszembe, hogy miert nem veszed az atlag felettiek atlaga feletti atlagot? :D Ezt is lehetne N-szer, es akkor lenne N-ed foku tipikus szelsoertek.

Amugy engem is zavar, hogy ha 2 percet allok az autoval, akkor kiirja, hogy 30l/100km a fogyasztas, vagy ha 1000km-re elegendo az uzemanyag. Az meg jobban, hogy az emberek meg mindig beszivjak az allami statisztikakat (emelkedett az atlagber Budapesten!). Amikor dolgozom valamin a cegnel, akkor eloszor mindig az eloszlast nezem meg, az atlagot/szelsoerteket majd akkor mutogatom, ha tudjak mirol van szo. Ebben persze segitenek a kulonbozo meroszamok (mint pl. amit felvazoltal), de ezeket mind meg kell tanitani a kozonsegnek.

Nagyon keves modszer nem parametrikus. Az outlierek miatt meg az atlag is tekintheto parametrikusnak, egy cauchy/lorentz/breit-wigner eloszlas eleg sok helyen elofordulhat, igy csonkolt atlag vagy hasonlo kell.

Egyetértek. A szabadság fokát nem tudjuk nullára vinni. Viszont azt kerestem kiindulásnak, amit a bevezetőben írtam. Hogy a pulzus stb adatokhoz az átlag és max értéken kívül (vagy helyett) milyen stat mutatót tennék.

Amikor olvastam a fenti modszert, egybol az jutott eszembe, hogy miert nem veszed az atlag felettiek atlaga feletti atlagot? :D Ezt is lehetne N-szer, es akkor lenne N-ed foku tipikus szelsoertek.

Teszteltem :) Tehát a felső 2^-n szeletet több eloszláson vizsgáltam egyéb statisztikai szempontokból (hogyan viszonyul a normál szóráshoz stb), és azt találtam, hogy "normál" használathoz elég a felső 1/2 szelet. Normál alatt azt értem, hogy nem szakmabelinek is könnyebben értelmezhető, nem nagyon absztrakt leíró érték. Ha tudja mi az az átlag, akkor úgy is meg lehet fogalmazni, hogy a felső fél szelet átlaga. Tehát a felső értékek jellemző szintje. Szerintem ez nem nehéz intuíció.

Amugy engem is zavar, hogy ha 2 percet allok az autoval, akkor kiirja, hogy 30l/100km a fogyasztas, vagy ha 1000km-re elegendo az uzemanyag. Az meg jobban, hogy az emberek meg mindig beszivjak az allami statisztikakat (emelkedett az atlagber Budapesten!). Amikor dolgozom valamin a cegnel, akkor eloszor mindig az eloszlast nezem meg, az atlagot/szelsoerteket majd akkor mutogatom, ha tudjak mirol van szo. Ebben persze segitenek a kulonbozo meroszamok (mint pl. amit felvazoltal), de ezeket mind meg kell tanitani a kozonsegnek.

Egyetértek. Az eloszlás ismerete a legfontosabb. Az adja a végső karakterisztikát. Minden más csak annak durvított közelítése egyetlen dimenzión vagy szemüvegen keresztül.

Mégis érdekelnek az egyszerűsítések. És ezt elég egyszerűnek találtam ahhoz, hogy túl sokat ne kelljen tanítani hozzá, de több haszna lehessen, mint csak a max érték mutatásának.

Egy módosítás: kivettem közben a teljes adat átlagának hozzáadását a felső szelethez. Felül bíráltam magam a vizsgálat közben. Tehát a fenti 3 lépést módosítottam a következőre. Hogyan számítom ki:

A teljes adat átlagánál nagyobb vagy egyenlő értékek átlagát veszem.

Egy érdekesség:

100 véletlen számsort generálva véletlen eloszlással, véletlen hosszal, mixed modellekkel, néha exp, néha power, néha normál, néha uniform stb, a kitevőket is különböző eloszlásból mintavételezve, majd vizsgálva a korrelációt a szórásuk, illetve a felső átlag mínusz átlag értékeknek, majd ezt szintén 100-szor futtatva 95.4%-os átlagos Pearson korrelációt kapok.

Tehát a normál átlag és "felső" átlag pluszban a szórást is mutatja. Egész jó minimál stat summary.

Hívjuk a normál átlagot m_0-nak (2^-0 = 1 vagyis 100%) és a felső átlagot m_1-nek (2^-1 = 0.5 vagyis 50%). Az alsó átlagot m_-1-nek jelölöm.

Ha relatív szórást akarunk nézni, akkor (hasonlóan coefficient of variation-höz):

( m1 - m0 ) / m0