Valószínűségi változó eloszlásának ferdesége és ferdesége. Tapasztalati eloszlás ferdeségének és ferdeségének kiszámítása Excelben Normál eloszlás kurtózis együtthatója

Aszimmetria együttható az eloszlási sorozat középponthoz viszonyított „ferdségét” mutatja:

hol van a harmadrendű központi momentum;

– szórás kocka.

Ennél a számítási módszernél: ha , az eloszlás jobboldali (pozitív aszimmetria), ha , az eloszlás baloldali (negatív aszimmetria)

A központi nyomaték mellett az aszimmetria kiszámítható a módus vagy medián segítségével:

vagy , (6,69)

Ennél a számítási módnál: ha , az eloszlás jobboldali (pozitív aszimmetria), ha , akkor baloldali (negatív aszimmetria) (4. ábra).


Rizs. 4. Aszimmetrikus eloszlások

Az eloszlás „meredekségét” mutató értéket ún kurtózis együttható:

Ha , az eloszlásban van hegyesség – a kurtosis pozitív, ha , megfigyelhető az eloszlásban laposság – a kurtosis negatív (5. ábra).

Rizs. 5. Elosztási túlkapások

5. példa. Vannak adatok a régió gazdaságaiban lévő juhok számáról (9. táblázat).

1. Juhok átlagos száma gazdaságonként.

3. Medián.

4. Változási mutatók

· diszperzió;

· szórás;

· a variációs együttható.

5. Az aszimmetria és a gördülés mutatói.

Megoldás.

1. Mivel az opciók értéke az aggregátumban többször megismétlődik, bizonyos gyakorisággal az átlagérték kiszámításához a súlyozott számtani átlag képletet használjuk:

2. Ez a sorozat diszkrét, így a mód a legmagasabb frekvenciájú opció lesz - .

3. Ez a sorozat páros, ebben az esetben egy diszkrét sorozat mediánját a következő képlettel találjuk meg:

Vagyis a vizsgált populációba tartozó gazdaságok felében legfeljebb 4,75 ezer darab juh van. fele pedig e szám felett van.

4. Az eltérési mutatók kiszámításához elkészítjük a 10. táblázatot, amelyben kiszámítjuk az eltéréseket, ezen eltérések négyzeteit, a számítás elvégezhető egyszerű és súlyozott számítási képletekkel is (a példában egyszerű egy):

10. táblázat

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Teljes 53,00 0,00 34,42
Átlagos 4,4167

Számítsuk ki a szórást:

Számítsuk ki a szórást:

Számítsuk ki a variációs együtthatót:

5. Az aszimmetria és a gördülés mutatóinak kiszámításához elkészítjük a 11. táblázatot, amelyben kiszámítjuk a , ,

11. táblázat

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Teljes 53,00 0,00 0,11 142,98
Átlagos 4,4167

Az eloszlás ferdesége a következő:

Azaz bal oldali aszimmetria figyelhető meg, mivel , ami a következő képlettel számolva igazolódik:

Ebben az esetben, ami ennél a képletnél a bal oldali aszimmetriát is jelzi

Az eloszlás körtózisa egyenlő:

Esetünkben a kurtosis negatív, azaz laposság figyelhető meg.

6. példa. A dolgozók bérére vonatkozó adatok a háztartásra vonatkoznak (12. táblázat)

Megoldás.

Intervallumváltozat-sorozat esetén a módot a következő képlet segítségével számítjuk ki:

Ahol modális intervallum – intervallum a legmagasabb frekvenciával, esetünkben 3600-3800, frekvenciával

Minimális modális intervallum határ (3600);

Modális intervallum értéke (200);

A modális intervallumot megelőző intervallum gyakoriság (25);

Frekvenciakövető modális intervallum (29);

A modális intervallum gyakorisága (68).

12. táblázat

Intervallumvariáció-sorozat esetén a medián kiszámítása a következő képlettel történik:

Ahol medián intervallum ez egy olyan intervallum, amelynek kumulatív (halmozott) frekvenciája egyenlő vagy nagyobb, mint a frekvenciák összegének fele, példánkban ez 3600-3800.

A medián intervallum minimális határa (3600);

Medián intervallum érték (200);

A sorozat frekvenciáinak összege (154);

A felhalmozott gyakoriságok összege, a mediánt megelőző összes intervallum (57);

– a medián intervallum gyakorisága (68).

7. példa. Egy kerületben három gazdaság esetében van információ a termelés tőkeintenzitásáról (az előállított termékek 1 rubelére vetített állótőke-költségek összege): I – 1,29 rubel, II – 1,32 rubel, III – 1,27 rubel. Ki kell számítani az átlagos tőkeintenzitást.

Megoldás. Mivel a tőkeintenzitás a tőkeforgalom inverz mutatója, a harmonikus átlag egyszerű képletet használjuk.

8. példa. Egy körzetben három gazdaságra vonatkozóan vannak adatok a bruttó gabonatermésről és a termésátlagról (13. táblázat).

Megoldás. A termésátlag számtani átlaggal történő kiszámítása lehetetlen, mivel a vetésterületek számáról nincs információ, ezért a súlyozott harmonikus átlag képletet használjuk:

9. példa. Adatok állnak rendelkezésre az egyes területek átlagos burgonyaterméséről és a dombok számáról (14. táblázat)

14. táblázat

Csoportosítsuk az adatokat (15. táblázat):

15. táblázat

Területek csoportosítása a gyomosodások száma alapján

1. Számítsa ki a minta teljes szórását (16. táblázat).

A variációs sorozatok elemzésekor a középponttól való elmozdulást és az eloszlás meredekségét speciális mutatók jellemzik. Az empirikus eloszlások általában az eloszlás középpontjából jobbra vagy balra tolódnak el, és aszimmetrikusak. A normális eloszlás szigorúan szimmetrikus a számtani átlagra, ami a függvény paritásából adódik.

Az eloszlás ferdesége abból adódik, hogy egyes tényezők egyik irányban erősebben hatnak, mint a másikban, vagy a jelenség fejlődési folyamata olyan, hogy valamilyen ok dominál. Ezenkívül egyes jelenségek természete olyan, hogy aszimmetrikus eloszlást mutat.

Az aszimmetria legegyszerűbb mértéke a számtani átlag, a módusz és a medián közötti különbség:

Az eloszlás eltolódásának (aszimmetriájának) irányának és nagyságának meghatározásához kiszámítják aszimmetria együttható , ami egy harmadrendű normalizált momentum:

As= 3 / 3, ahol  3 a harmadrendű központi momentum;  3 – szórás kocka. 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

A bal oldali aszimmetriához aszimmetria együttható (Mint<0), при правосторонней (As>0) .

Ha az eloszlás teteje balra tolódik, és az ág jobb oldala hosszabbnak bizonyul, mint a bal, akkor ez az aszimmetria jobb oldali, másképp balkezes .

A módus, a medián és a számtani átlag közötti kapcsolat szimmetrikus és aszimmetrikus sorozatokban lehetővé teszi, hogy egyszerűbb mutatót használjunk az aszimmetria mértékeként aszimmetria együttható Pearson :

K a = ( –Mo)/. Ha K a >0, akkor az aszimmetria jobboldali, ha K a<0, то асимметрия левосторонняя, при К a =0 ряд считается симметричным.

Az aszimmetria pontosabban meghatározható a harmadrendű központi nyomatékkal:

, ahol 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

Ha > 0, akkor az aszimmetria akkor tekinthető szignifikánsnak, ha < 0,25 асимметрию можно считать не значительной.

Egy szimmetrikus eloszlás ordináta menti normális eloszlástól való eltérésének mértékének jellemzésére a csúcsosság mutatója, az eloszlás meredeksége, ún. többlet :

Pl. = ( 4 / 4) – 3, ahol:  4 – negyedrendű központi momentum.

Normál eloszlás esetén Ex = 0, azaz.  4 / 4 = 3.  4 = (m 4 – 4m 3 m 1 + 6m 2 m 2 1 – 3 m 4 1)* k 4 .

A magas csúcsú görbéknek pozitív, míg az alacsony csúcsú görbéknek negatív a görbületük (D.2. ábra).

A kanyarodás és a ferdeség mutatói szükségesek a statisztikai elemzésben a sokaság heterogenitásának, az eloszlás aszimmetriájának és az empirikus eloszlás normáltörvényhez való közelségének meghatározásához. Az aszimmetria és a kurtózis mutatók nullától való jelentős eltérése esetén a populáció nem tekinthető homogénnek és az eloszlás közeli a normálishoz. A tényleges görbék elméleti görbékkel való összehasonlítása lehetővé teszi a kapott statisztikai eredmények matematikai alátámasztását, a társadalmi-gazdasági jelenségek eloszlásának típusának és jellegének megállapítását, valamint a vizsgált események bekövetkezésének valószínűségének előrejelzését.

4.7. Az empirikus (tényleges) eloszlás elméleti normális eloszláshoz való közelségének indoklása. Normál eloszlás (Gauss-Laplace törvény) és jellemzői. "A három szigma szabálya." Alkalmassági kritériumok (a Pearson vagy Kolgomogorov kritérium példájával).

Egy bizonyos összefüggést észlelhet a változó jellemző frekvenciáinak és értékeinek változásában. Az attribútum értékének növekedésével a gyakoriságok először nőnek, majd egy bizonyos maximális érték elérése után csökkennek. A frekvenciák ilyen szabályos változásait a variációs sorozatokban ún elosztási minták.

Az eloszlási mintázat azonosításához szükséges, hogy a variációs sorozatok kellően nagy számú egységet tartalmazzanak, és maguk a sorozatok minőségileg homogén populációkat képviseljenek.

A tényleges adatok alapján felépített eloszlási sokszög az empirikus (tényleges) eloszlási görbe, amely nemcsak objektív (általános), hanem szubjektív (véletlenszerű) eloszlási feltételeket is tükröz, amelyek nem jellemzőek a vizsgált jelenségre.

A gyakorlati munkában az eloszlási törvényt úgy találjuk meg, hogy az empirikus eloszlást összehasonlítjuk valamelyik elméletivel, és felmérjük a köztük lévő eltérés vagy megfelelés mértékét. Elméleti eloszlási görbe tiszta formájában, a véletlenszerű tényezők hatásának figyelembevétele nélkül tükrözi a frekvenciaeloszlás (eloszlási sűrűség) általános mintáját a változó jellemzők értékétől függően.

Az elméleti eloszlások különféle típusai gyakoriak a statisztikában: normál, binomiális, Poisson stb. Mindegyik elméleti eloszlásnak megvan a maga sajátossága és hatóköre.

Normál elosztási törvény a sok véletlenszerű tényező kölcsönhatása során bekövetkező egyformán valószínű események eloszlására jellemző. A normális eloszlás törvénye az eloszlási paraméterek becslésének, a minta megfigyelések reprezentativitásának és a tömegjelenségek kapcsolatának mérésének statisztikai módszereinek hátterében. Annak ellenőrzéséhez, hogy a tényleges eloszlás mennyire felel meg a normálisnak, össze kell hasonlítani a tényleges eloszlás gyakoriságait a normális eloszlási törvényre jellemző elméleti gyakoriságokkal. Ezek a frekvenciák a normalizált eltérések függvényei. Ezért az empirikus eloszlássorozat adatai alapján t normalizált eltéréseket számítunk ki. Ezután meghatározzuk a megfelelő elméleti frekvenciákat. Ez ellaposítja az empirikus eloszlást.

Normális eloszlás vagy a Gauss-Laplace törvényt az egyenlet írja le
, ahol y t a normális eloszlási görbe ordinátája, vagy a normális eloszlás x értékének gyakorisága (valószínűsége); – az egyes x értékek matematikai elvárása (átlagértéke). Ha az értékek (x – ) mérje (kifejezze) a szórással , azaz. standardizált (normalizált) eltérésekben t = (x – )/, akkor a képlet a következőképpen alakul:
. A társadalmi-gazdasági jelenségek tiszta formában való normális eloszlása ​​ritka, azonban a populáció homogenitásának megőrzése mellett a tényleges eloszlások gyakran a normálishoz közeliek. A vizsgált mennyiségek eloszlásának mintázatát az empirikus eloszlás elméleti normális eloszlási törvénynek való megfelelésének ellenőrzésével tárjuk fel. Ehhez a tényleges eloszlást a normálgörbéhez igazítjuk és kiszámítjuk beleegyezési kritériumok .

A normál eloszlást két jelentős paraméter jellemzi, amelyek meghatározzák az egyes értékek csoportosításának középpontját és a görbe alakját: a számtani átlag és szórása . A normál eloszlási görbék az eloszlási középpont x tengelyen elfoglalt helyzetében különböznek és az e középpont körüli szórási opció  (4.1. és 4.2. ábra). A normális eloszlási görbe sajátossága az eloszlás középpontjához viszonyított szimmetriája - középső részének két oldalán két egyenletesen csökkenő ág alakul ki, amelyek aszimptotikusan közelítenek az abszcissza tengelyéhez. Ezért normál eloszlásban az átlag, a módusz és a medián megegyezik: = Mo = Én.

  x

A normál eloszlási görbének két inflexiós pontja van (átmenet a konvexitásból a konkávságba) t = 1-nél, azaz. amikor az opciók eltérnek az átlagtól (x – ), egyenlő a szórással . Belül  normál eloszlású 68,3%, belül 2 – 95,4%, belül 3 – az eloszlási sorozat megfigyelések számának vagy gyakoriságának 99,7%-a. A gyakorlatban szinte nincs 3-t meghaladó eltérés, ezért az adott összefüggést „ három szigma szabály ».

Az elméleti frekvenciák kiszámításához a következő képletet használjuk:

.

Nagyságrend
a t függvénye vagy a normál eloszlás sűrűsége, amelyet egy speciális táblázatból határozunk meg, amelynek kivonatait táblázatban adjuk meg. 4.2.

Normál eloszlási sűrűség értékek 4.2. táblázat

Grafikon az ábrán. A 4.3 jól szemlélteti az empirikus (2) és normál (1) eloszlás közelségét.

Rizs. 4.3. A postai szolgáltató fiókok szám szerinti megoszlása

dolgozók: 1 – normál; 2 – empirikus

Az empirikus eloszlás normális eloszlás törvényéhez való közelségének matematikai alátámasztásához számoljon beleegyezési kritériumok .

Kolmogorov-kritérium - egy illeszkedési kritérium, amely lehetővé teszi az empirikus eloszlás normálishoz való közelségének mértékét. A. N. Kolmogorov azt javasolta, hogy az empirikus és az elméleti normális eloszlások közötti megfelelés meghatározásához használják fel e sorozatok felhalmozott frekvenciái vagy frekvenciái közötti maximális különbséget. Annak a hipotézisnek a tesztelésére, hogy az empirikus eloszlás megfelel a normális eloszlás törvényének, kiszámítjuk az illeszkedési jósági kritériumot = D/
, ahol D a kumulatív (halmozott) empirikus és elméleti gyakoriságok közötti maximális különbség, n a sokaságban lévő egységek száma Egy speciális táblázat segítségével meghatározzuk P() -  elérésének valószínűségét, ami azt jelenti, hogy ha egy variációs karakterisztikát egy normál törvény szerint osztunk el, akkor Véletlenszerű okokból az empirikus és az elméleti halmozott frekvenciák közötti maximális eltérés nem lesz kisebb, mint a ténylegesen megfigyelt. A P() értéke alapján bizonyos következtetéseket vonunk le: ha a P() valószínűség kellően nagy, akkor megerősítettnek tekinthető az a hipotézis, hogy a tényleges eloszlás megfelel a normáltörvénynek; Ha a P() valószínűség kicsi, akkor a nullhipotézist elvetjük, és a tényleges és az elméleti eloszlás közötti eltéréseket szignifikánsnak tekintjük.

Az illeszkedési feltétel valószínűségi értékei  4.3. táblázat

Pearson kritériumok 2 („khi-négyzet”) - illeszkedési kritérium, amely lehetővé teszi az empirikus eloszlás normálishoz való közelségének mértékét:
,ahol f i, f" i az empirikus és elméleti eloszlások gyakoriságai egy bizonyos intervallumban. Minél nagyobb a különbség a megfigyelt és az elméleti gyakoriságok között, annál nagyobb a  2. kritérium.  2 kritérium szerinti tapasztalati és elméleti eloszlások véletlen mintákból adódó eltérésekből, a  2 calc kritérium számított értékét összehasonlítjuk a táblázatos  2 táblázattal a megfelelő számú szabadságfokkal és adott szignifikancia szinttel A szignifikancia szint úgy van kiválasztva, hogy P( 2 calc > 2 tab) = . A szabadsági fokok száma hl, Ahol h– csoportok száma; l– az elméleti frekvenciák számításánál teljesítendő feltételek száma. A normál eloszlási görbe elméleti gyakoriságainak kiszámítása a képlet segítségével
három paramétert kell tudnia , , f, ezért a szabadsági fokok száma h–3. Ha  2 calc > 2 tab, azaz.  2 a kritikus tartományba esik, akkor az empirikus és az elméleti gyakoriságok közötti eltérés szignifikáns és nem magyarázható a mintaadatok véletlenszerű ingadozásával. Ebben az esetben a nullhipotézist elvetjük. Ha  2 számítás  2 táblázat, i.e. a számított ismérv nem haladja meg a gyakoriságok véletlenből adódó lehetséges legnagyobb eltérését, akkor ebben az esetben elfogadjuk az eloszlások megfelelőségére vonatkozó hipotézist. A Pearson-kritérium jelentős számú megfigyelés (n50) esetén hatásos, és minden intervallum gyakoriságának legalább öt egységnek kell lennie (kisebb számmal az intervallumokat kombináljuk), az intervallumok (csoportok) számának pedig meg kell felelnie. legyen nagy (h>5), mivel a  2 becslés a szabadsági fokok számától függ.

Romanovszkij kritérium - egy illeszkedési kritérium, amely lehetővé teszi az empirikus eloszlás normálishoz való közelségének mértékét. Romanovsky azt javasolta, hogy értékeljék az empirikus eloszlás közelségét a normál eloszlási görbéhez a következőképpen:

, ahol h a csoportok száma.

Ha az arány nagyobb, mint 3, akkor az empirikus és a normál eloszlás gyakorisága közötti eltérés nem tekinthető véletlenszerűnek, és a normális eloszlási törvény hipotézisét el kell vetni. Ha az arány kisebb vagy egyenlő, mint 3, akkor elfogadhatjuk azt a hipotézist, hogy az adateloszlás normális.

Ahhoz, hogy hozzávetőleges képet kapjunk egy valószínűségi változó eloszlásának alakjáról, ábrázoljuk annak eloszlási sorozatát (sokszög és hisztogram), a függvényt vagy az eloszlássűrűséget. A statisztikai kutatás gyakorlatában nagyon eltérő eloszlásokkal találkozhatunk. A homogén populációkat rendszerint egycsúcsos eloszlások jellemzik. A multivertex a vizsgált populáció heterogenitását jelzi. Ebben az esetben szükséges az adatok átcsoportosítása a homogénebb csoportok azonosítása érdekében.

Egy valószínűségi változó eloszlásának általános természetének meghatározása magában foglalja a homogenitás mértékének felmérését, valamint az aszimmetria és a gördülési mutatók kiszámítását. Szimmetrikus eloszlásban, amelyben a matematikai elvárás egyenlő a mediánnal, azaz. , úgy tekinthető, hogy nincs aszimmetria. De minél észrevehetőbb az aszimmetria, annál nagyobb az eltérés az eloszlási központ jellemzői - a matematikai elvárás és a medián - között.

Egy valószínűségi változó eloszlásának legegyszerűbb aszimmetria együtthatója tekinthető, ahol a matematikai elvárás, a medián és a valószínűségi változó szórása.

Jobb oldali aszimmetria esetén bal oldali aszimmetria. Ha , az aszimmetriát alacsonynak, ha - közepesnek és -nél - magasnak tekintjük. A jobb és bal oldali aszimmetria geometriai illusztrációja az alábbi ábrán látható. Grafikonokat mutat a megfelelő típusú folytonos valószínűségi változók eloszlási sűrűségéről.

Rajz. A jobb és bal oldali aszimmetria szemléltetése folytonos valószínűségi változók eloszlásának sűrűségábráiban.

Van egy másik aszimmetria együtthatója egy valószínűségi változó eloszlásának. Bizonyítható, hogy a páratlan sorrendű nem nulla központi momentum aszimmetriát jelez a valószínűségi változó eloszlásában. Az előző mutatóban az elsőrendű momentumhoz hasonló kifejezést használtunk. De általában ebben a másik aszimmetria-együtthatóban a harmadrendű központi momentumot használják , és ahhoz, hogy ez az együttható dimenzió nélkülivé váljon, el kell osztani a szórás kockájával. Az így kapott aszimmetria együttható: . Ehhez az aszimmetria együtthatóhoz, mint az elsőhöz a jobb oldali aszimmetria esetén, bal oldali - .

Valószínűségi változó kurtózisa

Egy valószínűségi változó eloszlásának kurtózisa jellemzi értékeinek koncentrációjának mértékét az eloszlás középpontja közelében: minél magasabb a koncentráció, annál nagyobb és szűkebb lesz az eloszlás sűrűségi grafikonja. A kurtosis (élesség) mutató kiszámítása a következő képlettel történik: , ahol a 4. rend központi momentuma, és a 4. hatványra emelt szórás. Mivel a számláló és a nevező hatványai azonosak, a kurtosis dimenzió nélküli mennyiség. Ebben az esetben a kurtosis hiányának, a nulla kurtózisnak a standardjaként a normál eloszlást vesszük. De bebizonyítható, hogy normál eloszlás esetén . Ezért a kurtózis kiszámításának képletében a 3-as számot levonják ebből a törtből.

Így normál eloszlás esetén a kurtózis nulla: . Ha a kurtosis nagyobb, mint nulla, pl. , akkor az eloszlás csúcsosabb a normálnál. Ha a kurtosis kisebb, mint nulla, pl. , akkor az eloszlás kevésbé csúcsos a normálnál. A negatív kurtosis határértéke a ; a pozitív kurtosis mértéke végtelenül nagy lehet. Az ábrán látható, hogy a valószínűségi változók csúcsos és lapos tetejű eloszlássűrűségének grafikonja hogyan néz ki a normál eloszláshoz képest.

Rajz. A valószínűségi változók csúcsos és lapos csúcsú sűrűségeloszlásának szemléltetése a normál eloszláshoz képest.

Egy valószínűségi változó eloszlásának aszimmetriája és görtózisa megmutatja, hogy mennyire tér el a normál törvénytől. Nagy aszimmetriák és gördülés esetén a normál eloszlás számítási képlete nem használható. Azt, hogy egy adott valószínűségi változó adatainak elemzése során mekkora az aszimmetria és a kurtózis megengedhetősége a normális eloszlási képletek használatánál, a kutatónak kell meghatároznia tudása és tapasztalata alapján.

Meghatározás. Divat Egy diszkrét valószínűségi változó M 0 értékét a legvalószínűbb értékének nevezzük. Folyamatos valószínűségi változó esetén a módus annak a valószínűségi változónak az értéke, amelynél az eloszlássűrűség maximuma.

Ha egy diszkrét valószínűségi változó eloszlási sokszögének vagy egy folytonos valószínűségi változó eloszlási görbéjének két vagy több maximuma van, akkor egy ilyen eloszlást ún. bimodális vagy kombinált.

Ha egy disztribúciónak van minimuma, de nincs maximuma, akkor azt hívják antimodális.

Meghatározás. Középső Egy X valószínűségi változó M D értéke annak az értéke, amelyhez képest egyformán valószínű, hogy a valószínűségi változó nagyobb vagy kisebb értékét kapjuk.

Geometriailag a medián annak a pontnak az abszcisszája, ahol az eloszlási görbe által határolt területet felezik.

Vegye figyelembe, hogy ha az eloszlás unimodális, akkor a módus és a medián egybeesik a matematikai elvárással.

Meghatározás. A kezdő pillanat rendelés k Az X valószínűségi változó az X érték matematikai elvárása k .

Egy diszkrét valószínűségi változó esetén: .

.

Az első sorrend kezdeti momentuma megegyezik a matematikai elvárással.

Meghatározás. Központi pillanat rendelés k Az X valószínűségi változó az érték matematikai elvárása

Egy diszkrét valószínűségi változóhoz: .

Folyamatos valószínűségi változó esetén: .

Az elsőrendű központi momentum mindig nulla, a másodrendű központi momentum pedig egyenlő a diszperzióval. A harmadrendű központi momentum jellemzi az eloszlás aszimmetriáját.

Meghatározás. A harmadik rend centrális momentumának a szóráshoz viszonyított arányát a harmadik hatványhoz nevezzük aszimmetria együttható.

Meghatározás. Az eloszlás csúcsosságának és laposságának jellemzésére ún többlet.

A figyelembe vett mennyiségek mellett az úgynevezett abszolút momentumokat is használják:

Abszolút kezdő pillanat: .

Abszolút központi pont: .

Kvantilis , amely adott valószínűségi szintnek felel meg R, az az érték, amelynél az eloszlásfüggvény egyenlő értéket vesz fel R, azaz Ahol R- meghatározott valószínűségi szint.

Más szavakkal kvantilis van egy valószínűségi változó értéke, amelynél

Valószínűség R százalékban megadva a megfelelő kvantilis nevét adja, például 40%-os kvantisnek hívják.

20. Egy esemény előfordulási számának matematikai elvárása és szórása független kísérletekben.

Meghatározás. Matematikai elvárás egy X folytonos valószínűségi változót, amelynek lehetséges értékei a szegmenshez tartoznak, határozott integrálnak nevezzük

Ha egy valószínűségi változó lehetséges értékeit a teljes numerikus tengelyen figyelembe vesszük, akkor a matematikai elvárást a következő képlettel találjuk meg:

Ebben az esetben természetesen feltételezzük, hogy a nem megfelelő integrál konvergál.

Matematikai elvárás A diszkrét valószínűségi változó a lehetséges értékei és a hozzájuk tartozó valószínűségek szorzatának összege:

M(x) =x 1 R 1 +x 2 R 2 + … +x P R P . (7.1)

Ha egy valószínűségi változó lehetséges értékeinek száma végtelen, akkor
, ha a kapott sorozat abszolút konvergál.

1. megjegyzés. A matematikai elvárást néha ún súlyozott átlag, mivel ez megközelítőleg egyenlő a valószínűségi változó megfigyelt értékeinek számtani átlagával nagyszámú kísérlet során.

Jegyzet 2. A matematikai elvárás definíciójából következik, hogy értéke nem kisebb, mint egy valószínűségi változó lehető legkisebb értéke, és nem több, mint a legnagyobb.

3. megjegyzés. Egy diszkrét valószínűségi változó matematikai elvárása az nem véletlenszerű(állandó. Később látni fogjuk, hogy ugyanez igaz a folytonos valószínűségi változókra is.

A matematikai várakozás tulajdonságai.

    Egy állandó matematikai elvárása megegyezik magával az állandóval:

M(VAL VEL) =VAL VEL.(7.2)

Bizonyíték. Ha figyelembe vesszük VAL VEL diszkrét valószínűségi változóként, amely csak egy értéket vesz fel VAL VEL valószínűséggel R= 1, akkor M(VAL VEL) =VAL VEL·1 = VAL VEL.

    A konstans tényező kivehető a matematikai elvárásjelből:

M(CX) =CM(x). (7.3)

Bizonyíték. Ha a valószínűségi változó x eloszlási sorozatok szerint

x én

x n

p én

p n

majd a terjesztési sorozatot CX a következő formában van:

VAL VELx én

VAL VELx 1

VAL VELx 2

VAL VELx n

p én

p n

Akkor M(CX) =Cx 1 R 1 +Cx 2 R 2 + … +Cx P R P =VAL VEL(x 1 R 1 +x 2 R 2 + … +x P R P) =CM(x).

Matematikai elvárás folytonos valószínűségi változót nevezünk

(7.13)

1. megjegyzés. A variancia általános definíciója ugyanaz marad a folytonos valószínűségi változónál, mint a diszkrétnél (def. 7.5), és a számítási képlet a következő:

(7.14)

A szórást a (7.12) képlet segítségével számítjuk ki.

Jegyzet 2. Ha egy folytonos valószínűségi változó összes lehetséges értéke nem esik kívül az intervallumon [ a, b], akkor a (7.13) és (7.14) képletekben szereplő integrálokat ezeken a határokon belül számítjuk ki.

Tétel. Egy esemény előfordulási számának szórása független kísérletekben megegyezik a kísérletek számának és az esemény bekövetkezésének és be nem következésének valószínűségének szorzatával egy kísérletben: .

Bizonyíték. Legyen az esemény előfordulásának száma független kísérletekben. Ez egyenlő az esemény előfordulásának összegével az egyes próbákban: . Mivel a tesztek függetlenek, a valószínűségi változók – függetlenek, ezért .

Ahogy fent látható, , és .

Aztán ah .

Ebben az esetben, mint korábban említettük, a szórása .

A sokaságeloszlás elemzése során jelentős érdeklődésre tart számot egy adott eloszlás szimmetrikustól való eltérésének, más szóval ferdeségének felmérése. A ferdeség (aszimmetria) mértéke a népességeloszlás egyik legfontosabb tulajdonsága. Számos statisztika létezik az aszimmetria kiszámítására. Mindegyik megfelel legalább két követelménynek bármely ferdeségi mutatóval szemben: dimenzió nélkülinek és nullával egyenlőnek kell lennie, ha az eloszlás szimmetrikus.

ábrán. A 2 a, b ábrán két aszimmetrikus populációeloszlás görbéje látható, amelyek közül az egyik balra, a másik jobbra ferde. A módusz, a medián és az átlag egymáshoz viszonyított helyzete minőségileg látható. Látható, hogy az egyik lehetséges ferdeségi mutató megszerkeszthető annak figyelembevételével, hogy az átlag és a módus milyen távolságra helyezkedik el egymástól. De figyelembe véve a módusz empirikus adatokból történő meghatározásának bonyolultságát, másrészt a módusz, a medián és az átlag közti jól ismert (3) összefüggést, a következő képletet javasoltam az aszimmetriaindex kiszámításához:

Ebből a képletből az következik, hogy a balra ferde eloszlások pozitív, a jobbra ferde eloszlások negatív ferdeségűek. Természetesen azoknál a szimmetrikus eloszlásoknál, amelyeknél az átlag és a medián egybeesik, az aszimmetria nulla.

Számítsuk ki az aszimmetria mutatókat a táblázatban megadott adatokra! 1. és 2. A szívciklus időtartamának eloszlására a következőket használjuk:

Így ez az eloszlás kissé balra ferde. Az aszimmetria kapott értéke hozzávetőleges és nem pontos, mivel az egyszerűsített módon számított értékeket használták a kiszámításához.

A szulfhidril-csoportok eloszlásához a vérszérumban a következőket kínáljuk:

Így ennek az eloszlásnak negatív ferdesége van, pl. jobbra ferde.

Elméletileg kimutatható, hogy a 13-as képlet által meghatározott érték 3-on belül van. A gyakorlatban azonban ez az érték nagyon ritkán éri el határértékeit, és mérsékelten aszimmetrikus egycsúcsos eloszlások esetén az abszolút értéke általában kisebb egynél.

Az aszimmetriamutató nemcsak a népességeloszlás formális leírására használható, hanem a kapott adatok értelmes értelmezésére is.

Valójában, ha az általunk megfigyelt jellemző nagyszámú, egymástól független ok hatására alakul ki, amelyek mindegyike viszonylag kis mértékben járul hozzá ennek a jellemzőnek az értékéhez, akkor néhány elméleti premisszáknak megfelelően, amelyeket a cikkben tárgyaltunk. A valószínűségszámításról szóló fejezetben joggal számíthatunk arra, hogy a kísérlet eredményeként kapott sokaságeloszlás szimmetrikus lesz. Ha azonban a kísérleti adatokra jelentős aszimmetriaértéket kapunk (az As modulo számértéke néhány tizeden belül van), akkor feltételezhető, hogy a fent meghatározott feltételek nem teljesülnek.

Ebben az esetben van értelme feltételezni vagy egy vagy két olyan tényező meglétét, amelyek hozzájárulása a kísérletben megfigyelt érték kialakulásához lényegesen nagyobb, mint a többi, vagy pedig egy speciális mechanizmus jelenlétét feltételezni, különbözik a megfigyelt jellemző értékére sok ok független befolyásának mechanizmusától.

Tehát például, ha egy számunkra érdekes mennyiség változása, amely egy bizonyos tényező hatásának felel meg, magával az értékkel és az ok hatásának intenzitásával arányos, akkor a kapott eloszlás mindig a balra, i.e. pozitív ferdeségük van. A biológusok például a növények és állatok növekedésével kapcsolatos mennyiségek becslésekor találkoznak ilyen mechanizmussal.

A ferdeség értékelésének másik módja a nyomatékok módszere, amelyet a 44. fejezetben tárgyalunk. Ezzel a módszerrel a ferdeség kiszámítása egy adatsor összes értékének az átlaghoz viszonyított eltéréseinek összegéből történik. , harmadik hatványra emelve, azaz:

A harmadik hatvány biztosítja, hogy ennek a kifejezésnek a számlálója nullával egyenlő szimmetrikus eloszlások esetén, mivel ebben az esetben az átlagtól a harmadik hatványig felfelé és lefelé történő eltérések összege egyenlő lesz, és ellentétes előjelű lesz. Az aszimmetria mértékének dimenzió nélküliségét a -val való osztás biztosítja.

A (14) képlet a következőképpen alakítható át. Az előző bekezdésben szabványosított értékeket vezettünk be:

Így a ferdeség mértéke a szabványosított adatok kocka átlaga.

Ugyanazokhoz az adatokhoz, amelyeknél az aszimmetriát a (13) képlet alapján számítottuk ki, a mutatót a (15) képlet alapján találjuk meg. Nekünk van:

A különböző képletekkel számított aszimmetria mutatók természetesen nagyságrendileg eltérnek egymástól, de egyformán jelzik a ferdeség jellegét. A statisztikai elemzéshez használt alkalmazáscsomagokban az aszimmetria kiszámításakor a (15) képletet használják, mivel ez pontosabb értékeket ad. Az egyszerű számológépekkel végzett előzetes számításokhoz használhatja a (13) képletet.

Felesleg. Tehát a négy mutatócsoport közül hármat megvizsgáltunk, amelyek segítségével a népességeloszlásokat írjuk le. Az utolsó közülük a csúcsosság vagy kurtosis mutatóinak csoportja (a görögből - púpos). A kurtosis egyik lehetséges mutatójának kiszámításához a következő képletet használjuk:

Ugyanazt a megközelítést alkalmazva, amelyet az aszimmetriaképlet (14) átalakításakor alkalmaztunk, könnyen kimutatható, hogy:

Elméletileg kimutatták, hogy a statisztikában, valamint a valószínűségszámításban nagy szerepet játszó normál (Gauss-) eloszlási görbe kurtózisának értéke numerikusan 3. Számos megfontolás alapján a görbe élessége ezt a görbét szabványnak tekintjük, ezért a kurtózis indikátoraként használja a következő értéket:

Keressük meg a táblázatban megadott adatok csúcsértékét. 1. Nálunk:

Így a szívciklusok időtartamának eloszlási görbéje ellaposodik a normálgörbéhez képest, amelyre.

táblázatban A 3. ábra a szélső virágok számának megoszlását mutatja az egyik krizantém fajban. Ehhez az elosztáshoz

A kurtózis nagyon nagy értékeket vehet fel, amint az a megadott példából is látható, de alsó határa nem lehet kisebb egynél. Kiderült, hogy ha az eloszlás bimodális, akkor a kurtózis értéke megközelíti az alsó határt, tehát -2-re hajlamos. Így, ha a számítások eredményeként kiderül, hogy az érték kisebb, mint -1-1,4, akkor biztosak lehetünk abban, hogy a rendelkezésünkre álló populáció eloszlása ​​legalább bimodális. Ezt különösen fontos figyelembe venni, ha a kísérleti adatokat az előfeldolgozási szakaszt megkerülve digitális számítógéppel elemezzük, és a kutatónak nem áll a szeme előtt közvetlen grafikus ábrázolása a populáció eloszlásáról.

A kísérleti adatok kétcsúcsos eloszlási görbéje több okból is felmerülhet. Egy ilyen eloszlás különösen akkor jelenhet meg, ha két heterogén adathalmazt egyetlen halmazba egyesítenek. Ennek szemléltetésére mesterségesen egyesítettük egy halmazba kétféle fosszilis puhatestű héjának szélességére vonatkozó adatokat (4. táblázat, 3. ábra).

Az ábrán jól látható két módozat jelenléte, mivel két különböző populációból származó adathalmaz keveredik. A számítás a kurtózis értékére 1,74, ezért = -1,26. Így a csúcsindex számított értéke az előbbi pozíciónak megfelelően azt jelzi, hogy az eloszlásnak két csúcsa van.

Itt van egy figyelmeztetés. Valójában minden olyan esetben, amikor a népességeloszlásnak két maximuma van, a kurtózis értéke közel lesz az egységhez. Ez a tény azonban nem vezethet automatikusan arra a következtetésre, hogy az elemzett adatsor két heterogén minta keveréke. Először is, egy ilyen keveréknek, az alkotó aggregátumok számától függően, nem lehet két csúcsa, és a kurtózis indexe jelentősen nagyobb lesz, mint egy. Másodszor, egy homogén mintának két módozata lehet, ha például megsértik a kísérleti adatok kiválasztására vonatkozó követelményeket. Így ebben, mint más esetekben is, a különböző statisztikák formai számítása után alapos szakmai elemzést kell végezni, amely lehetővé teszi a kapott adatok érdemi értelmezését.

A rovat legfrissebb anyagai:

A baktériumok elemei.  A bakteriális sejtek szerkezete
A baktériumok elemei. A bakteriális sejtek szerkezete

A baktériumsejt szerkezeti komponensei 2 típusra oszthatók: - alapstruktúrák (sejtfal, citoplazmatikus membrán származékaival,...

A test forgó mozgása
A test forgó mozgása

1.8. A test impulzusa egy tengely körül. A szilárd test tengelyhez viszonyított szögimpulzusa az egyes részecskék szögimpulzusának összege, a...

A második világháború csatái
A második világháború csatái

Sztálingrádban éles fordulatot vett a világ menete Az orosz hadtörténelemben mindig is a sztálingrádi csatát tartották a legkiemelkedőbb és...