Gadījuma lieluma sadalījuma šķībums un kurtoze. Empīriskā sadalījuma šķībuma un kurtozes aprēķins programmā Excel Normālā sadalījuma kurtozes koeficients

Asimetrijas koeficients parāda sadalījuma sērijas “šķībumu” attiecībā pret centru:

kur ir trešās kārtas centrālais moments;

– standartnovirzes kubs.

Šai aprēķina metodei: ja , sadalījums ir labās puses (pozitīva asimetrija), ja , sadalījums ir kreisais (negatīva asimetrija)

Papildus centrālajam momentam asimetriju var aprēķināt, izmantojot režīmu vai mediānu:

vai , (6,69)

Šai aprēķina metodei: ja , sadalījums ir labās puses (pozitīvā asimetrija), ja , sadalījums ir kreisais (negatīvā asimetrija) (4. att.).


Rīsi. 4. Asimetriskie sadalījumi

Tiek izsaukta vērtība, kas parāda sadalījuma “stāvumu”. kurtozes koeficients:

Ja , sadalījumā ir smailums – kurtoze ir pozitīva, ja sadalījumā ir novērots , plakanums – kurtoze ir negatīva (5. att.).

Rīsi. 5. Izplatīšanas pārmērības

5. piemērs. Ir dati par aitu skaitu saimniecībās reģionā (9. tabula).

1. Vidējais aitu skaits vienā saimniecībā.

3. Mediāna.

4. Variācijas rādītāji

· dispersija;

· standarta novirze;

· variācijas koeficients.

5. Asimetrijas un kurtozes rādītāji.

Risinājums.

1. Tā kā opciju vērtība apkopojumā tiek atkārtota vairākas reizes, ar noteiktu biežumu, lai aprēķinātu vidējo vērtību, mēs izmantojam vidējo svērto aritmētisko formulu:

2. Šī sērija ir diskrēta, tāpēc režīms būs opcija ar augstāko frekvenci - .

3. Šī sērija ir pāra, šajā gadījumā diskrētas sērijas mediāna tiek atrasta, izmantojot formulu:

Tas ir, puse no pētāmās populācijas saimniecībām ir līdz 4,75 tūkstošiem aitu galvu. un puse ir virs šī skaitļa.

4. Variācijas rādītāju aprēķināšanai sastādīsim 10.tabulu, kurā aprēķināsim novirzes, šo noviržu kvadrātus, aprēķinu var veikt gan izmantojot vienkāršas, gan svērtās aprēķina formulas (piemērā izmantojam vienkāršu viens):

10. tabula

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Kopā 53,00 0,00 34,42
Vidēji 4,4167

Aprēķināsim dispersiju:

Aprēķināsim standarta novirzi:

Aprēķināsim variācijas koeficientu:

5. Lai aprēķinātu asimetrijas un kurtozes rādītājus, izveidosim 11. tabulu, kurā aprēķināsim , ,

11. tabula

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Kopā 53,00 0,00 0,11 142,98
Vidēji 4,4167

Sadalījuma šķībums ir:

Tas ir, tiek novērota kreisās puses asimetrija, jo , kas tiek apstiprināta, aprēķinot, izmantojot formulu:

Šajā gadījumā, kas šai formulai arī norāda uz kreisās puses asimetriju

Sadalījuma kurtoze ir vienāda ar:

Mūsu gadījumā kurtoze ir negatīva, tas ir, tiek novērots plakanums.

6. piemērs. Dati par strādnieku algām uzrādīti par mājsaimniecību (12.tabula)

Risinājums.

Intervālu variāciju sērijai režīms tiek aprēķināts, izmantojot formulu:

Kur modālais intervāls – intervāls ar augstāko frekvenci, mūsu gadījumā 3600-3800, ar frekvenci

Minimālais modālā intervāla ierobežojums (3600);

Modālā intervāla vērtība (200);

Intervāla biežums pirms modālā intervāla (25);

Biežums pēc modālā intervāla (29);

Modālo intervālu biežums (68).

12. tabula

Intervālu variāciju sērijai mediānu aprēķina, izmantojot formulu:

Kur vidējais intervāls šis ir intervāls, kura kumulatīvā (uzkrātā) frekvence ir vienāda ar vai lielāka par pusi no frekvenču summas, mūsu piemērā tā ir 3600-3800.

Vidējā intervāla minimālā robeža (3600);

Vidējā intervāla vērtība (200);

Sērijas frekvenču summa (154);

Uzkrāto frekvenču summa, visi intervāli pirms mediānas (57);

– vidējā intervāla biežums (68).

7. piemērs. Trīs zemnieku saimniecībām vienā rajonā ir informācija par ražošanas kapitālintensitāti (pamatkapitāla izmaksu apjoms uz 1 saražotās produkcijas rubli): I – 1,29 rubļi, II – 1,32 rubļi, III – 1,27 rubļi. Nepieciešams aprēķināt vidējo kapitāla intensitāti.

Risinājums. Tā kā kapitāla intensitāte ir kapitāla apgrozījuma apgrieztais rādītājs, mēs izmantojam harmonisko vidējo vienkāršo formulu.

8. piemērs. Par trim viena rajona saimniecībām ir dati par graudu bruto ražu un vidējo ražu (13.tabula).

Risinājums. Vidējās ražas aprēķināšana ar vidējo aritmētisko nav iespējama, jo nav informācijas par sējumu platību skaitu, tāpēc izmantojam svērto harmonisko vidējo formulu:

9. piemērs. Ir dati par kartupeļu vidējo ražu atsevišķos apgabalos un pauguru skaitu (14.tabula)

14. tabula

Sagrupēsim datus (15. tabula):

15. tabula

Platību grupēšana, pamatojoties uz nezāļu skaitu

1. Aprēķiniet izlases kopējo dispersiju (16. tabula).

Analizējot variāciju rindas, nobīdi no centra un sadalījuma slīpumu raksturo īpaši rādītāji. Empīriskie sadalījumi, kā likums, tiek pārvietoti no sadalījuma centra uz labo vai kreiso pusi, un tie ir asimetriski. Normālais sadalījums ir stingri simetrisks attiecībā pret vidējo aritmētisko, kas ir saistīts ar funkcijas paritāti.

Izplatījuma šķībums rodas tāpēc, ka daži faktori vienā virzienā darbojas spēcīgāk nekā citā, vai arī parādības attīstības process ir tāds, ka dominē kāds cēlonis. Turklāt dažu parādību būtība ir tāda, ka pastāv asimetrisks sadalījums.

Vienkāršākais asimetrijas mērs ir atšķirība starp vidējo aritmētisko, režīmu un mediānu:

Lai noteiktu sadalījuma nobīdes (asimetrijas) virzienu un lielumu, to aprēķina asimetrijas koeficients , kas ir normalizēts trešās kārtas moments:

As= 3 / 3, kur  3 ir trešās kārtas centrālais moments;  3 – standartnovirze kubā. 3 = (m 3 – 3 m 1 m 2 + 2 m 1 3) k 3 .

Kreisās puses asimetrijai asimetrijas koeficients (Kā<0), при правосторонней (As>0) .

Ja sadalījuma augšdaļa ir nobīdīta pa kreisi un labā zara daļa izrādās garāka par kreiso, tad šāda asimetrija ir labās puses, citādi kreilis .

Attiecība starp režīmu, vidējo un aritmētisko vidējo simetriskās un asimetriskās rindās ļauj mums izmantot vienkāršāku rādītāju kā asimetrijas mēru. asimetrijas koeficients Pīrsons :

K a = ( –Mo)/. Ja K a >0, tad asimetrija ir labās puses, ja K a<0, то асимметрия левосторонняя, при К a =0 ряд считается симметричным.

Asimetriju var precīzāk noteikt, izmantojot trešās kārtas centrālo momentu:

, kur 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

Ja > 0, tad asimetriju var uzskatīt par nozīmīgu, ja < 0,25 асимметрию можно считать не значительной.

Lai raksturotu simetriskā sadalījuma novirzes pakāpi no normālā sadalījuma pa ordinātām, pīķa indikators, sadalījuma stāvums, t.s. lieko :

Ex = ( 4 / 4) – 3, kur:  4 – ceturtās kārtas centrālais moments.

Normālam sadalījumam Ex = 0, t.i.  4 / 4 = 3.  4 = (m 4 – 4m 3 m 1 + 6m 2 m 2 1 – 3 m 4 1)* k 4 .

Augstas pīķa līknēm ir pozitīvs kurtoze, savukārt zemu pīķu līknēm ir negatīva izliekums (D.2. att.).

Kurtozes un šķībuma rādītāji ir nepieciešami statistiskajā analīzē, lai noteiktu populācijas neviendabīgumu, sadalījuma asimetriju un empīriskā sadalījuma tuvumu parastajam likumam. Ar būtiskām asimetrijas un kurtozes rādītāju novirzēm no nulles populāciju nevar uzskatīt par viendabīgu un sadalījumu tuvu normālam. Faktisko līkņu salīdzināšana ar teorētiskajām ļauj matemātiski pamatot iegūtos statistiskos rezultātus, noteikt sociāli ekonomisko parādību sadalījuma veidu un raksturu, kā arī prognozēt pētāmo notikumu rašanās iespējamību.

4.7. Empīriskā (faktiskā) sadalījuma tuvības pamatojums teorētiskajam normālajam sadalījumam. Normālais sadalījums (Gausa-Laplasa likums) un tā raksturojums. "Trīs sigmu likums". Piemērotības kritēriji (izmantojot Pīrsona vai Kolgomogorova kritērija piemēru).

Var pamanīt noteiktu saikni mainīgo raksturlielumu frekvenču un vērtību izmaiņās. Palielinoties atribūta vērtībai, frekvences vispirms palielinās un pēc tam, sasniedzot noteiktu maksimālo vērtību, samazinās. Šādas regulāras frekvenču izmaiņas variāciju rindās sauc izplatīšanas modeļi.

Lai noteiktu sadalījuma modeli, ir nepieciešams, lai variāciju rindās būtu pietiekami liels vienību skaits un pašas rindas atspoguļotu kvalitatīvi viendabīgas populācijas.

Sadales daudzstūris, kas izveidots, pamatojoties uz faktiskajiem datiem, ir empīriskā (faktiskā) sadalījuma līkne, atspoguļojot ne tikai objektīvos (vispārējos), bet arī subjektīvos (gadījuma rakstura) sadalījuma nosacījumus, kas nav raksturīgi pētāmajai parādībai.

Praktiskajā darbā sadales likums tiek atrasts, salīdzinot empīrisko sadalījumu ar kādu no teorētiskajiem un novērtējot atšķirības vai atbilstības pakāpi starp tiem. Teorētiskā sadalījuma līkne tīrā veidā, neņemot vērā nejaušu faktoru ietekmi, atspoguļo vispārējo frekvenču sadalījuma modeli (izplatījuma blīvumu) atkarībā no dažādu raksturlielumu vērtībām.

Statistikā ir izplatīti dažādi teorētisko sadalījumu veidi: normālie, binomiālie, Puasona uc Katram no teorētiskajiem sadalījumiem ir sava specifika un apjoms.

Normālās sadales likums raksturīgs vienlīdz iespējamu notikumu sadalījumam, kas notiek daudzu nejaušības faktoru mijiedarbības laikā. Normālā sadalījuma likums ir pamatā statistiskām metodēm sadalījuma parametru novērtēšanai, izlases novērojumu reprezentativitātei un masas parādību sakarības mērīšanai. Lai pārbaudītu, cik labi faktiskais sadalījums atbilst normālajam, jāsalīdzina faktiskā sadalījuma frekvences ar normālā sadalījuma likumam raksturīgajām teorētiskajām frekvencēm. Šīs frekvences ir normalizēto noviržu funkcija. Tāpēc, pamatojoties uz empīriskā sadalījuma rindas datiem, tiek aprēķinātas normalizētās novirzes t. Pēc tam tiek noteiktas atbilstošās teorētiskās frekvences. Tas izlīdzina empīrisko sadalījumu.

Normāls sadalījums vai Gausa-Laplasa likumu apraksta ar vienādojumu
, kur y t ir normālā sadalījuma līknes ordināta vai normālā sadalījuma x vērtības biežums (varbūtība); – atsevišķu x vērtību matemātiskā cerība (vidējā vērtība). Ja vērtības (x – ) mēra (izteikt) standartnovirzes izteiksmē , t.i. standartizētās (normalizētās) novirzēs t = (x – )/, tad formulai būs šāda forma:
. Sociāli ekonomisko parādību normālais sadalījums tīrā veidā ir reti sastopams, tomēr, saglabājot populācijas viendabīgumu, faktiskie sadalījumi bieži vien ir tuvi normai. Pētīto lielumu sadalījuma modelis tiek atklāts, pārbaudot empīriskā sadalījuma atbilstību teorētiskajam normālā sadalījuma likumam. Lai to izdarītu, faktiskais sadalījums tiek saskaņots ar parasto līkni un tiek aprēķināts piekrišanas kritēriji .

Normālo sadalījumu raksturo divi nozīmīgi parametri, kas nosaka individuālo vērtību grupēšanas centru un līknes formu: vidējais aritmētiskais un standartnovirze . Normālās sadalījuma līknes atšķiras pēc sadalījuma centra novietojuma uz x ass un izkliedes iespēja ap šo centru  (4.1. un 4.2. att.). Normālā sadalījuma līknes iezīme ir tās simetrija attiecībā pret sadalījuma centru - abās tās vidus pusēs veidojas divi vienmērīgi dilstoši zari, kas asimptotiski tuvojas abscisu asij. Tāpēc normālā sadalījumā vidējais, režīms un mediāna ir vienādi: = Mo = es.

  x

Normālā sadalījuma līknei ir divi lēciena punkti (pāreja no izliekuma uz ieliekumu) pie t = 1, t.i. kad opcijas atšķiras no vidējā (x – ), vienāda ar standartnovirzi . Iekšā  ar normālu sadalījumu ir 68,3%, robežās 2 – 95,4%, robežās 3 – 99,7% no sadalījuma rindas novērojumu skaita vai biežuma. Praksē gandrīz nav noviržu, kas pārsniedz 3, tāpēc dotā sakarība tiek saukta par “ trīs sigmu noteikums ».

Lai aprēķinātu teorētiskās frekvences, tiek izmantota formula:

.

Lielums
ir funkcija no t jeb normālā sadalījuma blīvuma, ko nosaka no speciālas tabulas, no kuras izvilkumi doti tabulā. 4.2.

Normālā sadalījuma blīvuma vērtības 4.2. tabula

Grafiks attēlā. 4.3 skaidri parāda empīriskā (2) un normālā (1) sadalījuma tuvumu.

Rīsi. 4.3. Pasta pakalpojumu filiāļu sadalījums pēc skaita

strādnieki: 1 – normāli; 2 – empīrisks

Lai matemātiski pamatotu empīriskā sadalījuma tuvumu normālā sadalījuma likumam, aprēķini piekrišanas kritēriji .

Kolmogorova kritērijs - atbilstības kritērijs, kas ļauj novērtēt empīriskā sadalījuma tuvuma pakāpi normālam. A. N. Kolmogorovs ierosināja izmantot šo rindu uzkrāto frekvenču vai frekvences maksimālo starpību, lai noteiktu atbilstību starp empīrisko un teorētisko normālo sadalījumu. Lai pārbaudītu hipotēzi, ka empīriskais sadalījums atbilst normālā sadalījuma likumam, tiek aprēķināts atbilstības kritērijs = D/
, kur D ir maksimālā starpība starp kumulatīvo (uzkrāto) empīrisko un teorētisko frekvenci, n ir vienību skaits populācijā Izmantojot īpašu tabulu, tiek noteikts P() - varbūtība sasniegt , kas nozīmē, ka, ja variācijas raksturlielums tiek sadalīts saskaņā ar normālu likumu, tad nejaušu iemeslu dēļ maksimālā neatbilstība starp empīrisko un teorētisko uzkrāto frekvenci būs ne mazāka par faktiski novēroto. Pamatojoties uz P() vērtību, tiek izdarīti noteikti secinājumi: ja varbūtība P() ir pietiekami liela, tad hipotēzi, ka faktiskais sadalījums atbilst normālajam likumam, var uzskatīt par apstiprinātu; ja varbūtība P() ir maza, tad nulles hipotēze tiek noraidīta, un neatbilstības starp faktisko un teorētisko sadalījumu tiek uzskatītas par būtiskām.

Atbilstības kritērija varbūtības vērtības  4.3. tabula

Pīrsona kritēriji 2 ("hī kvadrāts") - atbilstības kritērijs, kas ļauj novērtēt empīriskā sadalījuma tuvuma pakāpi normālam:
,kur f i, f" i ir empīriskā un teorētiskā sadalījuma frekvences noteiktā intervālā. Jo lielāka atšķirība starp novērotajām un teorētiskajām frekvencēm, jo ​​lielāks ir kritērijs  2. Nošķirt atšķirību nozīmību frekvenču diapazonā. empīriskie un teorētiskie sadalījumi pēc kritērija  2 no atšķirībām nejaušu paraugu dēļ, kritērija aprēķinātā vērtība  2 aprēķins tiek salīdzināta ar tabulēto  2 tabulu ar atbilstošu brīvības pakāpju skaitu un dotu nozīmīguma līmeni. līmenis ir izvēlēts tā, lai P( 2 calc > 2 tab) = . Brīvības pakāpju skaits ir hl, Kur h– grupu skaits; l– nosacījumu skaits, kas jāievēro, aprēķinot teorētiskās frekvences. Aprēķināt normālā sadalījuma līknes teorētiskās frekvences, izmantojot formulu
jums jāzina trīs parametri , , f, tāpēc brīvības pakāpju skaits ir h–3. Ja  2 aprēķins > 2 tab, t.i.  2 iekrīt kritiskajā apgabalā, tad neatbilstība starp empīrisko un teorētisko frekvenci ir būtiska un nav izskaidrojama ar izlases datu nejaušām svārstībām. Šajā gadījumā nulles hipotēze tiek noraidīta. Ja  2 aprēķins  2 tabulas, t.i. aprēķinātais kritērijs nepārsniedz maksimālo iespējamo frekvenču diverģenci, kas var rasties nejaušības dēļ, tad šajā gadījumā tiek pieņemta hipotēze par sadalījumu atbilstību. Pīrsona kritērijs ir efektīvs ar ievērojamu novērojumu skaitu (n50), un visu intervālu frekvencēm jābūt vismaz piecām vienībām (ar mazāku skaitu intervāli tiek apvienoti), un intervālu (grupu) skaitam ir jābūt jābūt lielam (h>5), jo aprēķins  2 ir atkarīgs no brīvības pakāpju skaita.

Romanovska kritērijs - atbilstības kritērijs, kas ļauj novērtēt empīriskā sadalījuma tuvuma pakāpi normālam. V.I. Romanovskis ierosināja novērtēt empīriskā sadalījuma tuvumu normālā sadalījuma līknei saistībā ar:

, kur h ir grupu skaits.

Ja attiecība ir lielāka par 3, tad neatbilstību starp empīriskā un normālā sadalījuma biežumu nevar uzskatīt par nejaušu, un hipotēze par normālā sadalījuma likumu ir jānoraida. Ja attiecība ir mazāka vai vienāda ar 3, tad varam pieņemt hipotēzi, ka datu sadalījums ir normāls.

Lai iegūtu aptuvenu priekšstatu par gadījuma lieluma sadalījuma formu, tiek uzzīmēts tā sadalījuma sērijas (daudzstūris un histogramma), funkcijas vai sadalījuma blīvuma grafiks. Statistikas pētījumu praksē sastopami ļoti dažādi sadalījumi. Homogēnās populācijas parasti raksturo vienas virsotnes sadalījums. Multivertex norāda uz pētāmās populācijas neviendabīgumu. Šajā gadījumā ir nepieciešams pārgrupēt datus, lai identificētu viendabīgākas grupas.

Lai noteiktu nejaušā lieluma sadalījuma vispārīgo raksturu, ir jānovērtē tā viendabīguma pakāpe, kā arī jāaprēķina asimetrijas un kurtozes rādītāji. Simetriskā sadalījumā, kurā matemātiskā cerība ir vienāda ar mediānu, t.i. , var uzskatīt, ka nav asimetrijas. Bet jo pamanāmāka ir asimetrija, jo lielāka ir novirze starp sadales centra raksturlielumiem – matemātisko cerību un mediānu.

Var uzskatīt par vienkāršāko gadījuma lieluma sadalījuma asimetrijas koeficientu, kur ir matemātiskā cerība, ir mediāna un ir nejaušā lieluma standartnovirze.

Labās puses asimetrijas gadījumā kreisās puses asimetrija. Ja , asimetrija tiek uzskatīta par zemu, ja - vidēju un pie - augstu. Labās un kreisās puses asimetrijas ģeometrisks attēls ir parādīts zemāk esošajā attēlā. Tas parāda atbilstošo nepārtraukto gadījuma lielumu veidu sadalījuma blīvuma grafikus.

Zīmējums. Labās un kreisās puses asimetrijas ilustrācija nepārtrauktu gadījuma lielumu sadalījuma blīvuma diagrammās.

Ir vēl viens gadījuma lieluma sadalījuma asimetrijas koeficients. Var pierādīt, ka nepāra secības centrālais moments, kas nav nulle, norāda uz gadījuma lieluma sadalījuma asimetriju. Iepriekšējā rādītājā mēs izmantojām izteiksmi, kas ir līdzīga pirmās kārtas momentam. Bet parasti šajā citā asimetrijas koeficientā tiek izmantots trešās kārtas centrālais moments , un, lai šis koeficients kļūtu bezizmēra, tas tiek dalīts ar standartnovirzes kubu. Rezultātā iegūtais asimetrijas koeficients ir: . Šim asimetrijas koeficientam, tāpat kā pirmajam labās puses asimetrijas gadījumā, kreisā puse - .

Gadījuma lieluma kurtoze

Gadījuma lieluma sadalījuma kurtoze raksturo tā vērtību koncentrācijas pakāpi netālu no sadalījuma centra: jo lielāka koncentrācija, jo augstāks un šaurāks būs tā sadalījuma blīvuma grafiks. Kurtozes (asuma) indikatoru aprēķina, izmantojot formulu: , kur ir 4. kārtas centrālais moments un ir standartnovirze, kas paaugstināta līdz 4. pakāpei. Tā kā skaitītāja un saucēja pakāpes ir vienādas, kurtosis ir bezdimensijas lielums. Šajā gadījumā par kurtozes neesamības standartu, nulles kurtozi, tiek pieņemts normāls sadalījums. Bet var pierādīt, ka normālam sadalījumam . Tāpēc kurtozes aprēķināšanas formulā skaitlis 3 tiek atņemts no šīs daļdaļas.

Tādējādi normālam sadalījumam kurtoze ir nulle: . Ja kurtoze ir lielāka par nulli, t.i. , tad sadalījums ir augstāks nekā parasti. Ja kurtoze ir mazāka par nulli, t.i. , tad sadalījums ir mazāks par normālu. Negatīvās kurtozes ierobežojošā vērtība ir vērtība ; pozitīvās kurtozes apjoms var būt bezgalīgi liels. Kā izskatās nejaušo lielumu pīķa un plakanvirsmas sadalījuma blīvuma grafiki, salīdzinot ar normālo sadalījumu, parādīts attēlā.

Zīmējums. Nejaušo lielumu pīķa un plakanvirsmas blīvuma sadalījuma ilustrācija salīdzinājumā ar normālo sadalījumu.

Gadījuma lieluma sadalījuma asimetrija un kurtoze parāda, cik daudz tas novirzās no normālā likuma. Lielām asimetrijām un kurtozei nevajadzētu izmantot normālā sadalījuma aprēķinu formulas. Kāds ir asimetrijas un kurtozes pieļaujamības līmenis normālā sadalījuma formulu izmantošanai konkrēta nejauša lieluma datu analīzē, jānosaka pētniekam, pamatojoties uz savām zināšanām un pieredzi.

Definīcija. Mode Diskrēta gadījuma lieluma M 0 sauc par tā visticamāko vērtību. Nepārtrauktam nejaušam mainīgajam režīms ir nejaušā mainīgā lieluma vērtība, pie kuras sadalījuma blīvums ir maksimums.

Ja diskrēta gadījuma lieluma sadalījuma daudzstūrim vai nepārtraukta gadījuma lieluma sadalījuma līknei ir divi vai vairāki maksimumi, tad šādu sadalījumu sauc bimodāls vai multimodāls.

Ja sadalījumam ir minimums, bet nav maksimuma, tas tiek izsaukts antimodāls.

Definīcija. Mediāna Gadījuma lieluma X M D ir tā vērtība, attiecībā pret kuru ir vienlīdz iespējams, ka tiks iegūta lielāka vai mazāka nejaušā lieluma vērtība.

Ģeometriski mediāna ir tā punkta abscisa, kurā sadalījuma līknes ierobežotais laukums tiek dalīts uz pusēm.

Ņemiet vērā, ka, ja sadalījums ir unimodāls, režīms un mediāna sakrīt ar matemātisko cerību.

Definīcija. Sākuma brīdis pasūtījums k gadījuma lielums X ir vērtības X matemātiskā cerība k .

Diskrētam gadījuma mainīgajam: .

.

Pirmās kārtas sākotnējais moments ir vienāds ar matemātisko cerību.

Definīcija. Centrālais moments pasūtījums k gadījuma lielums X ir vērtības matemātiskais sagaidāmais lielums

Diskrētam gadījuma mainīgajam: .

Nepārtrauktam nejaušam mainīgajam: .

Pirmās kārtas centrālais moments vienmēr ir nulle, un otrās kārtas centrālais moments ir vienāds ar dispersiju. Trešās kārtas centrālais moments raksturo sadalījuma asimetriju.

Definīcija. Tiek izsaukta trešās kārtas centrālā momenta attiecība pret standartnovirzi pret trešo pakāpi asimetrijas koeficients.

Definīcija. Lai raksturotu sadalījuma maksimumu un plakanumu, lielumu sauc lieko.

Papildus aplūkotajiem daudzumiem tiek izmantoti arī tā sauktie absolūtie momenti:

Absolūtais sākuma moments: .

Absolūtais centrālais punkts: .

Kvantile , kas atbilst noteiktam varbūtības līmenim R, ir vērtība, pie kuras sadalījuma funkcija iegūst vērtību, kas vienāda ar R, t.i. Kur R- noteikts varbūtības līmenis.

Citiem vārdiem sakot kvantile ir nejauša lieluma vērtība, pie kuras

Varbūtība R, kas norādīts procentos, dod nosaukumu atbilstošajai kvantilei, piemēram, to sauc par 40% kvantili.

20. Notikuma iestāšanās skaita matemātiskā gaidīšana un izkliede neatkarīgos eksperimentos.

Definīcija. Matemātiskās cerības nepārtrauktu gadījuma lielumu X, kura iespējamās vērtības pieder segmentam , sauc par noteiktu integrāli

Ja gadījuma lieluma iespējamās vērtības tiek ņemtas vērā uz visas skaitliskās ass, tad matemātisko cerību nosaka pēc formulas:

Šajā gadījumā, protams, tiek pieņemts, ka nepareizais integrālis saplūst.

Matemātiskās cerības Diskrēts gadījuma lielums ir tā iespējamo vērtību un to atbilstošo varbūtību produktu summa:

M(X) =X 1 R 1 +X 2 R 2 + … +X P R P . (7.1)

Ja nejauša lieluma iespējamo vērtību skaits ir bezgalīgs, tad
, ja iegūtā rinda saplūst absolūti.

1. piezīme. Matemātiskās cerības dažreiz tiek sauktas vidējais svērtais, jo tas ir aptuveni vienāds ar nejaušā mainīgā lieluma novēroto vērtību vidējo aritmētisko lielu skaitu eksperimentu.

2. piezīme. No matemātiskās gaidas definīcijas izriet, ka tā vērtība nav mazāka par mazāko iespējamo nejaušā mainīgā lieluma vērtību un ne lielāka par lielāko.

3. piezīme. Diskrēta gadījuma mainīgā matemātiskā cerība ir nav nejauši(pastāvīgs. Vēlāk mēs redzēsim, ka tas pats attiecas uz nepārtrauktiem nejaušiem mainīgajiem.

Matemātiskās gaidīšanas īpašības.

    Konstantes matemātiskā cerība ir vienāda ar pašu konstanti:

M(AR) =AR.(7.2)

Pierādījums. Ja mēs uzskatām AR kā diskrētu gadījuma lielumu, kam ir tikai viena vērtība AR ar varbūtību R= 1, tad M(AR) =AR·1 = AR.

    Pastāvīgo faktoru var izņemt no matemātiskās gaidīšanas zīmes:

M(CX) =CM(X). (7.3)

Pierādījums. Ja nejaušais mainīgais X dots sadalījuma sērijās

x i

x n

lpp i

lpp n

tad izplatīšanas sērija par CX ir šāda forma:

ARx i

ARx 1

ARx 2

ARx n

lpp i

lpp n

Tad M(CX) =Cx 1 R 1 +Cx 2 R 2 + … +Cx P R P =AR(X 1 R 1 +X 2 R 2 + … +X P R P) =CM(X).

Matemātiskās cerības tiek saukts nepārtraukts gadījuma mainīgais

(7.13)

1. piezīme. Vispārīgā dispersijas definīcija nepārtrauktam nejaušam mainīgajam paliek tāda pati kā diskrētam (def. 7.5), un tās aprēķināšanas formulai ir šāda forma:

(7.14)

Standartnovirzi aprēķina, izmantojot formulu (7.12.).

2. piezīme. Ja visas iespējamās nepārtraukta gadījuma lieluma vērtības neietilpst ārpus intervāla [ a, b], tad šajās robežās tiek aprēķināti integrāļi formulās (7.13) un (7.14).

Teorēma. Notikuma atgadījumu skaita dispersija neatkarīgos izmēģinājumos ir vienāda ar izmēģinājumu skaita un notikuma iestāšanās un nenotikšanas varbūtību reizinājumu vienā izmēģinājumā: .

Pierādījums. Ļaut ir notikuma gadījumu skaits neatkarīgos izmēģinājumos. Tas ir vienāds ar notikuma gadījumu summu katrā izmēģinājumā: . Tā kā testi ir neatkarīgi, nejaušie mainīgie – ir neatkarīgi, tāpēc .

Kā parādīts iepriekš, , un .

Tad ah .

Šajā gadījumā, kā minēts iepriekš, standarta novirze ir .

Analizējot populācijas sadalījumu, būtiska nozīme ir dotā sadalījuma novirzes no simetriskuma vai, citiem vārdiem sakot, šķībuma, novērtējums. Šķibuma (asimetrijas) pakāpe ir viena no svarīgākajām populācijas sadalījuma īpašībām. Ir vairāki statistikas dati, kas paredzēti asimetrijas aprēķināšanai. Visi no tiem atbilst vismaz divām prasībām jebkuram šķībuma indikatoram: tam jābūt bezizmēra un vienādam ar nulli, ja sadalījums ir simetrisks.

Attēlā 2 a, b parāda divu asimetrisku populācijas sadalījumu līknes, no kurām viena ir šķība pa kreisi, bet otra - pa labi. Režīma, mediānas un vidējā relatīvā pozīcija ir parādīta kvalitatīvi. Redzams, ka vienu no iespējamiem šķībuma rādītājiem var konstruēt, ņemot vērā attālumu, kādā atrodas vidējais un režīms viens no otra. Bet, ņemot vērā režīma noteikšanas sarežģītību no empīriskiem datiem un, no otras puses, labi zināmo attiecību (3) starp režīmu, vidējo un vidējo, asimetrijas indeksa aprēķināšanai tika piedāvāta šāda formula:

No šīs formulas izriet, ka sadalījumiem, kas ir šķībi pa kreisi, ir pozitīvs šķībums, bet sadalījumiem, kas ir šķībs pa labi, ir negatīvs šķībums. Protams, simetriskiem sadalījumiem, kuriem vidējais un mediāna sakrīt, asimetrija ir nulle.

Aprēķināsim asimetrijas rādītājus tabulā norādītajiem datiem. 1 un 2. Sirds cikla ilguma sadalījumam mums ir:

Tādējādi šis sadalījums ir nedaudz pa kreisi šķībs. Iegūtā asimetrijas vērtība ir aptuvena un neprecīza, jo tās aprēķināšanai tika izmantotas vienkāršotā veidā aprēķinātās vērtības.

Sulfhidrilgrupu sadalījumam asins serumā mums ir:

Tādējādi šim sadalījumam ir negatīva novirze, t.i. šķībs pa labi.

Teorētiski tiek parādīts, ka ar 13. formulu noteiktā vērtība atrodas 3 robežās. Taču praksē šī vērtība ļoti reti sasniedz robežvērtības, un vidēji asimetriskiem vienas virsotnes sadalījumiem tās absolūtā vērtība parasti ir mazāka par vienu.

Asimetrijas indikatoru var izmantot ne tikai formālam iedzīvotāju sadalījuma aprakstam, bet arī jēgpilnai iegūto datu interpretācijai.

Faktiski, ja mūsu novērotais raksturlielums veidojas daudzu viens no otra neatkarīgu cēloņu ietekmē, no kuriem katrs dod salīdzinoši nelielu ieguldījumu šī raksturlieluma vērtībā, tad saskaņā ar dažām teorētiskajām premisām, kas aplūkotas sadaļu par varbūtību teoriju, mums ir tiesības sagaidīt, ka eksperimenta rezultātā iegūtais populācijas sadalījums būs simetrisks. Taču, ja eksperimentālajiem datiem tiek iegūta nozīmīga asimetrijas vērtība (As modulo skaitliskā vērtība ir dažu desmitdaļu robežās), tad var pieņemt, ka iepriekš norādītie nosacījumi nav izpildīti.

Šajā gadījumā ir jēga pieņemt vai nu viena vai divu faktoru esamību, kuru ieguldījums eksperimentā novērotās vērtības veidošanā ir ievērojami lielāks nekā pārējiem, vai arī postulēt īpaša mehānisma esamību, kas ir atšķiras no daudzu cēloņu neatkarīgas ietekmes uz novērotā raksturlieluma vērtību mehānisma.

Tātad, piemēram, ja izmaiņas mums interesējošā daudzumā, kas atbilst noteikta faktora darbībai, ir proporcionālas pašai šai vērtībai un cēloņa darbības intensitātei, tad iegūtais sadalījums vienmēr būs šķībs pa kreisi, t.i. piemīt pozitīva šķība. Biologi, piemēram, sastopas ar šādu mehānismu, novērtējot daudzumus, kas saistīti ar augu un dzīvnieku augšanu.

Vēl viens veids, kā novērtēt šķībumu, ir balstīts uz momentu metodi, kas tiks apskatīta 44. nodaļā. Saskaņā ar šo metodi šķībumu aprēķina, izmantojot datu rindas visu vērtību noviržu summu attiecībā pret vidējo vērtību. , paaugstināts līdz trešajai pakāpei, t.i.:

Trešā pakāpe nodrošina, ka šīs izteiksmes skaitītājs ir vienāds ar nulli simetriskiem sadalījumiem, jo ​​šajā gadījumā noviržu summas uz augšu un uz leju no vidējā līdz trešajai pakāpei būs vienādas un tām būs pretējas zīmes. Dalīšana ar nodrošina asimetrijas mēra bezizmēru.

Formulu (14) var pārveidot šādi. Iepriekšējā punktā tika ieviestas standartizētas vērtības:

Tādējādi šķībuma mērs ir standartizēto datu vidējais lielums.

Tiem pašiem datiem, kuriem asimetrija tika aprēķināta, izmantojot formulu (13), mēs atrodam rādītāju, izmantojot formulu (15). Mums ir:

Protams, asimetrijas rādītāji, kas aprēķināti, izmantojot dažādas formulas, atšķiras viens no otra pēc lieluma, bet vienādi norāda uz šķībuma raksturu. Statistiskās analīzes lietojumprogrammu pakotnēs, aprēķinot asimetriju, tiek izmantota formula (15), jo tā dod precīzākas vērtības. Lai veiktu provizoriskus aprēķinus, izmantojot vienkāršus kalkulatorus, varat izmantot formulu (13).

Pārmērīgs. Tātad, mēs esam izskatījuši trīs no četrām rādītāju grupām, ar kuru palīdzību tiek aprakstīti iedzīvotāju sadalījumi. Pēdējais no tiem ir pīķa jeb kurtozes (no grieķu valodas - kuprītis) rādītāju grupa. Lai aprēķinātu vienu no iespējamiem kurtozes rādītājiem, tiek izmantota šāda formula:

Izmantojot to pašu pieeju, kas tika izmantota, pārveidojot asimetrijas formulu (14), ir viegli parādīt, ka:

Teorētiski tika pierādīts, ka kurtozes vērtība normālai (Gausa) sadalījuma līknei, kurai ir liela nozīme statistikā, kā arī varbūtības teorijā, skaitliski ir vienāda ar 3. Pamatojoties uz vairākiem apsvērumiem, šī līkne tiek uzskatīta par standartu, un tāpēc kā kurtozes indikatoru izmantojiet vērtību:

Atradīsim tabulā norādīto datu maksimālo vērtību. 1. Mums ir:

Tādējādi sirds ciklu ilguma sadalījuma līkne ir saplacināta salīdzinājumā ar parasto līkni, kurai.

Tabulā 3. attēlā parādīts malējo ziedu skaita sadalījums vienā no krizantēmu sugām. Šim izplatīšanai

Kurtoze var iegūt ļoti lielas vērtības, kā redzams no dotā piemēra, bet tā apakšējā robeža nevar būt mazāka par vienu. Izrādās, ja sadalījums ir bimodāls, tad kurtozes vērtība tuvojas tās apakšējai robežai, tāpēc tai ir tendence uz -2. Tādējādi, ja aprēķinu rezultātā izrādīsies, ka vērtība ir mazāka par -1-1,4, varam būt droši, ka mūsu rīcībā esošais iedzīvotāju sadalījums ir vismaz bimodāls. Īpaši svarīgi to ņemt vērā, kad eksperimentālie dati, apejot pirmapstrādes posmu, tiek analizēti ar digitālo datoru un pētniekam acu priekšā nav tieša populācijas sadalījuma grafiskā attēlojuma.

Eksperimentālo datu divu pīķu sadalījuma līkne var rasties daudzu iemeslu dēļ. Jo īpaši šāds sadalījums var parādīties, apvienojot divas neviendabīgu datu kopas vienā kopā. Lai to ilustrētu, mēs mākslīgi apvienojām vienā komplektā datus par divu veidu fosilo gliemju čaulu platumu (4. tabula, 3. att.).

Attēlā skaidri parādīta divu režīmu klātbūtne, jo ir sajauktas divas datu kopas no dažādām populācijām. Aprēķins dod kurtozes vērtību 1,74, un tāpēc = -1,26. Tādējādi pīķa indeksa aprēķinātā vērtība saskaņā ar iepriekš norādīto pozīciju norāda, ka sadalījumam ir divi maksimumi.

Šeit ir viens brīdinājums. Patiešām, visos gadījumos, kad iedzīvotāju sadalījumam ir divi maksimumi, kurtozes vērtība būs tuvu vienotībai. Tomēr šis fakts nevar automātiski novest pie secinājuma, ka analizētā datu kopa ir divu neviendabīgu paraugu sajaukums. Pirmkārt, šādam maisījumam atkarībā no tā sastāvā esošo agregātu skaita var nebūt divu pīķu, un kurtozes indekss būs ievērojami lielāks par vienu. Otrkārt, viendabīgam paraugam var būt divi režīmi, ja, piemēram, tiek pārkāptas eksperimentālo datu atlases prasības. Tādējādi šajā, tāpat kā citos gadījumos, pēc dažādu statistikas datu formālas aprēķināšanas ir jāveic rūpīga profesionāla analīze, kas ļaus iegūtos datus jēgpilni interpretēt.

Jaunākie materiāli sadaļā:

Trīsstūrveida prizma visas formulas un piemēru uzdevumi
Trīsstūrveida prizma visas formulas un piemēru uzdevumi

Atrodiet visas a vērtības, kurām mazākā funkcijas vērtība komplektā |x|?1 nav mazāka par ** Vienādojumi un nevienādības ar GIA vienotā valsts pārbaudes parametru...

Kā izteikt līdzjūtību nāves gadījumā bez nepatiesības: izteicienu piemēri
Kā izteikt līdzjūtību nāves gadījumā bez nepatiesības: izteicienu piemēri

Pirmkārt, saprotiet un pieņemiet vienu lietu: lai gan jūs esat pazīstami jau ilgu laiku un pazīstat cilvēku no iekšpuses, tagad tas nebūt nenozīmē, ka viņa uzvedība...

Viela, ko veido jonu ķīmiskā saite
Viela, ko veido jonu ķīmiskā saite

1. definīcija Pētot molekulas uzbūvi, rodas jautājums par to spēku būtību, kas nodrošina savienojumu starp neitrālajiem atomiem, kas iekļauti to...