Kako izračunati varianco v statističnem primeru. Varianca in standardni odklon

Teorija verjetnosti je posebna veja matematike, ki jo študirajo samo študenti visokošolskih zavodov. So vam všeč izračuni in formule? Ne bojite se možnosti, da bi se seznanili z normalno porazdelitvijo, entropijo ansambla, matematičnim pričakovanjem in diskretno disperzijo naključna spremenljivka? Potem vam bo ta tema zelo zanimiva. Oglejmo si nekaj najpomembnejših osnovni pojmi to vejo znanosti.

Spomnimo se osnov

Tudi če si najbolj zapomniš preprosti pojmi teorije verjetnosti, ne zanemarite prvih odstavkov članka. Bistvo je, da brez jasnega razumevanja osnov ne boste mogli delati s spodaj obravnavanimi formulami.

Nekaj ​​se torej dogaja naključni dogodek, nekakšen eksperiment. Kot rezultat dejanj, ki jih izvajamo, lahko dobimo več rezultatov – nekateri se pojavljajo pogosteje, drugi redkeje. Verjetnost dogodka je razmerje med številom dejansko doseženih rezultatov ene vrste in skupno število mogoče. Samo vedeti klasična definicija ta koncept lahko začnete preučevati matematično pričakovanje in variance zveznih naključnih spremenljivk.

Aritmetična sredina

Že v šoli ste pri pouku matematike začeli delati z aritmetično sredino. Ta koncept se pogosto uporablja v teoriji verjetnosti, zato ga ni mogoče prezreti. Glavna stvar za nas je v tem trenutku je, da ga bomo srečali v formulah za matematično pričakovanje in disperzijo naključne spremenljivke.

Imamo zaporedje števil in želimo najti aritmetično sredino. Vse, kar se od nas zahteva, je sešteti vse, kar je na voljo, in deliti s številom elementov v zaporedju. Imejmo številke od 1 do 9. Vsota elementov bo enaka 45 in to vrednost bomo delili z 9. Odgovor: - 5.

Razpršenost

Govorjenje znanstveni jezik, disperzija je srednji kvadrat odstopanja dobljenih značilnih vrednosti od aritmetične sredine. Označena je z eno veliko latinsko črko D. Kaj je potrebno za izračun? Za vsak element zaporedja izračunamo razliko med obstoječim številom in aritmetično sredino ter jo kvadriramo. Vrednosti bo natanko toliko, kot je lahko rezultatov za dogodek, ki ga obravnavamo. Nato vse prejeto seštejemo in delimo s številom elementov v zaporedju. Če imamo pet možnih rezultatov, potem delimo s pet.

Tudi disperzija ima lastnosti, ki si jih je treba zapomniti, da jih lahko uporabimo pri reševanju problemov. Na primer, ko se naključna spremenljivka poveča za X-krat, se varianca poveča za X-krat na kvadrat (tj. X*X). Nikoli ni manjši od nič in ni odvisen od vrednosti, ki se premikajo enaka vrednost velik oz manjša stran. Poleg tega za neodvisni testi varianca vsote je enaka vsoti varianc.

Zdaj moramo vsekakor razmisliti o primerih disperzije diskretne naključne spremenljivke in matematičnega pričakovanja.

Recimo, da smo izvedli 21 poskusov in dobili 7 različnih rezultatov. Vsakega od njih smo opazovali 1, 2, 2, 3, 4, 4 oziroma 5-krat. Čemu bo enaka varianca?

Najprej izračunajmo aritmetično sredino: vsota elementov je seveda 21. Delimo jo s 7 in dobimo 3. Zdaj od vsakega števila v prvotnem zaporedju odštejemo 3, vsako vrednost kvadriramo in rezultate seštejemo. Rezultat je 12. Zdaj je vse, kar moramo storiti, je, da število delimo s številom elementov in zdi se, da je to vse. Ampak obstaja ulov! Razpravljajmo o tem.

Odvisnost od števila poskusov

Izkazalo se je, da lahko pri izračunu variance imenovalec vsebuje eno od dveh števil: N ali N-1. Tu je N število izvedenih eksperimentov ali število elementov v zaporedju (kar je v bistvu isto). Od česa je to odvisno?

Če se število testov meri v stotinah, moramo v imenovalec dati N, če v enotah, potem N-1. Znanstveniki so se odločili mejo zarisati precej simbolično: danes gre skozi številko 30. Če smo izvedli manj kot 30 poskusov, bomo količino delili z N-1, če več, pa z N.

Naloga

Vrnimo se k našemu primeru reševanja problema variance in matematičnega pričakovanja. Dobili smo vmesno število 12, ki smo ga morali deliti z N ali N-1. Ker smo izvedli 21 poskusov, kar je manj kot 30, bomo izbrali drugo možnost. Torej je odgovor: varianca je 12/2 = 2.

Pričakovanje

Preidimo na drugi koncept, ki ga moramo upoštevati v tem članku. Matematično pričakovanje je rezultat seštevanja vseh možnih rezultatov, pomnoženih z ustreznimi verjetnostmi. Pomembno je razumeti, da se dobljena vrednost, kot tudi rezultat izračuna variance, pridobi samo enkrat za celotno nalogo, ne glede na to, koliko rezultatov se upošteva.

Formula za matematično pričakovanje je zelo preprosta: vzamemo rezultat, ga pomnožimo z njegovo verjetnostjo, dodamo enako za drugi, tretji rezultat itd. Vsega, kar je povezano s tem konceptom, ni težko izračunati. Na primer, vsota pričakovanih vrednosti je enaka pričakovani vrednosti vsote. Enako velja za delo. Takšna enostavne operacije Tega vam ne omogoča vsaka količina v teoriji verjetnosti. Vzemimo problem in izračunajmo pomen dveh pojmov, ki smo jih preučevali hkrati. Poleg tega nas je zamotila teorija - čas je za prakso.

Še en primer

Izvedli smo 50 poskusov in dobili 10 vrst izidov – številke od 0 do 9 – ki se pojavljajo v različnih odstotek. To so: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Spomnimo se, da morate za pridobitev verjetnosti odstotne vrednosti razdeliti na 100. Tako dobimo 0,02; 0,1 itd. Predstavimo primer reševanja problema za varianco naključne spremenljivke in matematično pričakovanje.

Aritmetično sredino izračunamo po formuli, ki smo si jo zapomnili nižja šola: 50/10 = 5.

Zdaj pa pretvorimo verjetnosti v število izidov "v kosih", da bomo lažje šteli. Dobimo 1, 5, 2, 7, 1, 9, 3, 8, 5 in 9. Od vsake dobljene vrednosti odštejemo aritmetično sredino, nato pa vsakega od dobljenih rezultatov kvadriramo. Oglejte si, kako to storite na primeru prvega elementa: 1 - 5 = (-4). Naprej: (-4) * (-4) = 16. Za druge vrednosti izvedite te operacije sami. Če ste vse naredili pravilno, boste po seštevanju vseh dobili 90.

Nadaljujmo z izračunom variance in pričakovane vrednosti tako, da 90 delimo z N. Zakaj izberemo N namesto N-1? Pravilno, ker število izvedenih poskusov presega 30. Torej: 90/10 = 9. Dobili smo varianco. Če dobite drugo številko, ne obupajte. Najverjetneje ste naredili preprosto napako pri izračunih. Še enkrat preveri, kaj si napisal, pa bo verjetno vse prišlo na svoje mesto.

Na koncu se spomnite formule za matematično pričakovanje. Ne bomo podali vseh izračunov, napisali bomo le odgovor, ki ga lahko preverite po opravljenih vseh zahtevanih postopkih. Pričakovana vrednost bo 5,48. Spomnimo se samo, kako izvajati operacije, na primer s prvimi elementi: 0*0,02 + 1*0,1 ... in tako naprej. Kot lahko vidite, vrednost izida preprosto pomnožimo z njegovo verjetnostjo.

Odstopanje

Drugi koncept, ki je tesno povezan z disperzijo in matematičnim pričakovanjem, je standardna deviacija. Določeno je bodisi z latinskimi črkami sd ali grške male črke "sigma". Ta koncept prikazuje, koliko v povprečju vrednosti odstopajo od osrednje značilnosti. Če želite najti njegovo vrednost, morate izračunati kvadratni koren iz disperzije.

Če načrtujete normalna porazdelitev in želite videti kvadratno odstopanje neposredno na njem, je to mogoče storiti v več fazah. Vzemite polovico slike levo ali desno od načina (osrednja vrednost), narišite pravokotno na vodoravno os, tako da so površine nastalih številk enake. Velikost segmenta med sredino porazdelitve in posledično projekcijo na vodoravno os bo predstavljala standardni odklon.

Programska oprema

Kot je razvidno iz opisov formul in predstavljenih primerov, izračun variance in matematičnega pričakovanja z aritmetičnega vidika ni najenostavnejši postopek. Da ne bi izgubljali časa, je smiselno uporabiti program, ki se uporablja v visokem šolstvu izobraževalne ustanove- imenuje se "R". Ima funkcije, ki vam omogočajo izračun vrednosti za številne pojme iz statistike in teorije verjetnosti.

Na primer, določite vektor vrednosti. To se naredi na naslednji način: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Za zaključek

Razpršenost in matematično pričakovanje sta tista, brez katerih je težko kaj izračunati v prihodnosti. V glavnem predmetu predavanj na univerzah se obravnavajo že v prvih mesecih študija predmeta. Prav zaradi nerazumevanja teh preprostih konceptov in nezmožnosti njihovega izračunavanja veliko študentov takoj začne zaostajati v programu in kasneje ob koncu seje dobi slabe ocene, zaradi česar so prikrajšani za štipendije.

Vsaj en teden, pol ure na dan, vadite reševanje podobnih problemov, kot so predstavljeni v tem članku. Potem se boste na katerem koli testu iz teorije verjetnosti lahko spopadli s primeri brez odvečnih nasvetov in goljufij.

Razpršenost jaz Disperzija (iz latinščine dispersio - razpršenost)

v matematični statistiki in teoriji verjetnosti najpogosteje uporabljena mera razpršenosti, tj. odstopanje od povprečja. V statističnem smislu D.

je aritmetična sredina kvadratnih odstopanj vrednosti x i iz njihove aritmetične sredine

V teoriji verjetnosti D. naključna spremenljivka X imenovano matematično pričakovanje E ( X - m x) 2 kvadratna odstopanja X od svojega matematičnega pričakovanja m x= E ( X). D. naključna spremenljivka X označeno z D ( X) ali skozi σ 2 X. Kvadratni koren iz D. (to je σ, če je D. σ 2) se imenuje standardna deviacija (glej kvadratno deviacijo).

Za naključno spremenljivko X z zvezno porazdelitvijo verjetnosti, za katero je značilna gostota verjetnosti (glej gostoto verjetnosti) r(X), D. se izračuna po formuli

V teoriji verjetnosti je izrek velikega pomena: vsota neodvisnih členov je enaka vsoti njihovih vsot. Nič manj pomembna je neenakost Čebiševa, ki omogoča oceno verjetnosti velikih odstopanj naključne spremenljivke. X od svojega matematičnega pričakovanja.

II Razpršenost

Prisotnost valov D ​​vodi do popačenja oblike signalov, ko se širijo v mediju. To je razloženo z dejstvom, da se harmonični valovi različnih frekvenc, na katere je mogoče razstaviti signal, širijo z različnimi hitrostmi (za več podrobnosti glejte Valovi, Skupinska hitrost). Disperzija svetlobe pri širjenju v prozorni prizmi vodi do razgradnje bele svetlobe v spekter (glej Disperzija svetlobe).


Velika sovjetska enciklopedija. - M.: Sovjetska enciklopedija. 1969-1978 .

Sopomenke:

Oglejte si, kaj je "Variance" v drugih slovarjih:

    disperzija- Nekaj ​​raztreseš. V matematiki disperzija definira odstopanje količin od povprečne vrednosti. Razpršitev bele svetlobe povzroči njeno razgradnjo na komponente. Zvočna disperzija povzroči širjenje. Razpršenost shranjenih podatkov po ... ... Priročnik za tehnične prevajalce

    Sodobna enciklopedija

    - (varianca) Mera razpršenosti podatkov. Varianco nabora N članov dobimo tako, da seštejemo kvadrate njihovih odstopanj od povprečja in delimo z N. Torej, če so člani xi za i = 1, 2,..., N in je njihova sredina m , odstopanje ... ... Ekonomski slovar

    Razpršenost- (iz latinskega dispersio sipanje) valov, odvisnost hitrosti širjenja valov v snovi od valovne dolžine (frekvence). Disperzijo določajo fizikalne lastnosti medija, v katerem se valovi širijo. Na primer v vakuumu ... ... Ilustrirani enciklopedični slovar

    - (iz latinščine dispersio sipanje) v matematični statistiki in teoriji verjetnosti merilo za disperzijo (odklon od povprečja). V statistiki je disperzija aritmetična sredina kvadratnih odstopanj opazovanih vrednosti (x1, x2,...,xn) naključnega... ... Veliki enciklopedični slovar

    V teoriji verjetnosti je najpogosteje uporabljena mera odstopanja od povprečja mera razpršenosti. V angleščini: Dispersion Sinonimi: Statistical dispersion Angleški sinonimi: Statistical dispersion Glej tudi: Vzorčne populacije Finančne... ... Finančni slovar

    - [lat. dispersus raztresen, raztresen] 1) razpršenost; 2) kemija, fizika. razbijanje snovi na zelo majhne delce. D. svetlobna razgradnja bele svetlobe v spekter s pomočjo prizme; 3) mat. odstopanje od povprečja. Slovar tujih besed. Komlev N.G., ... ... Slovar tujih besed ruskega jezika

    disperzija- (variance) indikator razpršenosti podatkov, ki ustreza srednjemu kvadratnemu odstopanju teh podatkov od aritmetične sredine. Enako kvadratu standardnega odklona. Slovar praktičnega psihologa. M.: AST, Žetev. S. Yu Golovin. 1998 ... Velika psihološka enciklopedija

    Razpršenost, razpršenost Slovar ruskih sinonimov. disperzija samostalnik, število sinonimov: 6 nanodisperzija (1) ... Slovar sinonimov

    Razpršenost- značilnost disperzije vrednosti naključne spremenljivke, merjeno s kvadratom njihovih odstopanj od povprečne vrednosti (označeno z d2). D. se razlikuje med teoretičnimi (zveznimi ali diskretnimi) in empiričnimi (tudi zveznimi in... ... Ekonomski in matematični slovar

    Razpršenost- * disperzija * disperzija 1. Disperzija; razpršiti; variacija (glej). 2. Teoretični koncept verjetnosti, ki označuje mero odstopanja naključne spremenljivke od njenega matematičnega pričakovanja. V biometrični praksi je vzorčna varianca s2 ... Genetika. Enciklopedični slovar

knjige

  • Nenormalna disperzija v širokih absorpcijskih pasovih, D.S. Božič. Reproducirano v izvirnem avtorjevem črkovanju izdaje iz leta 1934 (založba Izvestia Akademije znanosti ZSSR). V…

Ta stran opisuje standardni primer iskanja variance, ogledate pa si lahko tudi druge težave za iskanje

Primer 1. Določitev skupinskega, skupinskega povprečja, medskupinske in skupne variance

Primer 2. Iskanje variance in koeficienta variacije v grupirni tabeli

Primer 3. Iskanje variance v diskretni seriji

Primer 4. Za skupino 20 dopisnih študentov so na voljo naslednji podatki. Treba je zgraditi intervalno serijo porazdelitve značilnosti, izračunati povprečno vrednost značilnosti in preučiti njeno disperzijo.

Zgradimo intervalno skupino. Določimo obseg intervala z uporabo formule:

kjer je X max največja vrednost značilnosti združevanja;
X min – najmanjša vrednost značilnosti združevanja;
n – število intervalov:

Sprejemamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Ustvarimo intervalno skupino

Za nadaljnje izračune bomo zgradili pomožno tabelo:

X"i – sredina intervala. (npr. sredina intervala 159 – 165,6 = 162,3)

Povprečno višino študentov določimo s formulo uteženega aritmetičnega povprečja:

Določimo varianco s formulo:

Formulo lahko preoblikujemo takole:

Iz te formule sledi, da varianca je enaka razlika med povprečjem kvadratov možnosti ter kvadratom in povprečjem.

Disperzija v variacijskih serijah z enakimi intervali z uporabo metode momentov lahko izračunamo na naslednji način z uporabo druge lastnosti disperzije (deljenje vseh možnosti z vrednostjo intervala). Določanje variance, izračunana z metodo trenutkov, z uporabo naslednje formule je manj naporna:

kjer je i vrednost intervala;
A je običajna ničla, za katero je primerno uporabiti sredino intervala z najvišjo frekvenco;
m1 je kvadrat momenta prvega reda;
m2 - trenutek drugega reda

Varianca alternativne lastnosti (če se v statistični populaciji značilnost spremeni tako, da obstajata samo dve medsebojno izključujoči možnosti, potem se takšna variabilnost imenuje alternativna) lahko izračunate z uporabo formule:

Če nadomestimo q = 1- p v to disperzijsko formulo, dobimo:

Vrste variance

Skupna varianca meri variacijo lastnosti v celotni populaciji kot celoti pod vplivom vseh dejavnikov, ki povzročajo to variacijo. Je enaka povprečju kvadrata odstopanj posameznih vrednosti značilnosti x od celotne srednje vrednosti x in jo je mogoče opredeliti kot preprosto varianco ali uteženo varianco.

Varianca znotraj skupine označuje naključno variacijo, tj. del variacije, ki je posledica vpliva neupoštevanih dejavnikov in ni odvisen od dejavnika-atributa, ki tvori osnovo skupine. Takšna disperzija je enaka srednjemu kvadratu odstopanj posameznih vrednosti atributa znotraj skupine X od aritmetične sredine skupine in se lahko izračuna kot enostavna disperzija ali kot utežena disperzija.



torej mere variance znotraj skupine variacija lastnosti znotraj skupine in je določena s formulo:

kjer je xi povprečje skupine;
ni je število enot v skupini.

Na primer, variance znotraj skupine, ki jih je treba določiti pri nalogi preučevanja vpliva kvalifikacij delavcev na raven produktivnosti dela v delavnici, kažejo razlike v proizvodnji v vsaki skupini, ki jih povzročajo vsi možni dejavniki (tehnično stanje opreme, razpoložljivost orodja in materiali, starost delavcev, intenzivnost dela itd.), razen razlik v kvalifikacijski kategoriji (znotraj skupine imajo vsi delavci enako kvalifikacijo).

Izračunajmo vMSEXCELvzorčna varianca in standardni odklon. Izračunali bomo tudi varianco naključne spremenljivke, če je znana njena porazdelitev.

Najprej razmislimo disperzija, potem standardni odklon.

Varianca vzorca

Varianca vzorca (odstopanje vzorca,vzorecvarianca) označuje širjenje vrednosti v matriki glede na .

Vse 3 formule so matematično enakovredne.

Iz prve formule je jasno, da vzorčna varianca je vsota kvadratov odstopanj vsake vrednosti v matriki od povprečja, deljeno z velikostjo vzorca minus 1.

odstopanja vzorci uporabljena je funkcija DISP(), angl. ime VAR, tj. VARIANCA. Od različice MS EXCEL 2010 je priporočljiva uporaba njegovega analoga DISP.V(), angleščina. ime VURS, tj. Vzorec VARiance. Poleg tega je od različice MS EXCEL 2010 na voljo funkcija DISP.Г(), angleščina. ime VARP, tj. Population VARiance, ki izračuna disperzija Za prebivalstvo. Celotna razlika se zmanjša na imenovalec: namesto n-1, kot je DISP.V(), ima DISP.G() samo n v imenovalcu. Pred MS EXCEL 2010 se je za izračun variance populacije uporabljala funkcija VAR().

Varianca vzorca
=QUADROTCL(vzorec)/(ŠTEVILO(vzorec)-1)
=(SUM(vzorec)-COUNT(vzorec)*POVPREČJE(vzorec)^2)/ (COUNT(vzorec)-1)– običajna formula
=SUM((Vzorec -AVERAGE(Vzorec))^2)/ (ŠTEVILO(Vzorec)-1) –

Varianca vzorca je enako 0, le če so vse vrednosti enake med seboj in posledično enake povprečna vrednost. Običajno je večja vrednost odstopanja, večja je razpršenost vrednosti v matriki.

Varianca vzorca je točkovna ocena odstopanja porazdelitev naključne spremenljivke, iz katere je bila narejena vzorec. O gradnji intervali zaupanja pri ocenjevanju odstopanja lahko preberete v članku.

Varianca naključne spremenljivke

Za izračun disperzija naključna spremenljivka, jo morate poznati.

Za odstopanja naključna spremenljivka X je pogosto označena kot Var(X). Razpršenost enako kvadratu odstopanja od povprečja E(X): Var(X)=E[(X-E(X)) 2 ]

disperzija izračunano po formuli:

kjer je x i vrednost, ki jo lahko zavzame naključna spremenljivka, μ pa povprečna vrednost (), p(x) je verjetnost, da bo naključna spremenljivka zavzela vrednost x.

Če ima naključna spremenljivka , potem disperzija izračunano po formuli:

Dimenzija odstopanja ustreza kvadratu merske enote prvotnih vrednosti. Na primer, če vrednosti v vzorcu predstavljajo meritve delne teže (v kg), bi bila dimenzija variance kg 2 . To je lahko težko razlagati, zato je za opredelitev širjenja vrednosti vrednost enaka kvadratnemu korenu odstopanjastandardni odklon.

Nekatere lastnosti odstopanja:

Var(X+a)=Var(X), kjer je X naključna spremenljivka in a konstanta.

Var(aH)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ta lastnost disperzije se uporablja v članek o linearni regresiji.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), kjer sta X in Y naključni spremenljivki, Cov(X;Y) je kovarianca teh naključnih spremenljivk.

Če so naključne spremenljivke neodvisne, potem so kovarianca je enako 0 in zato Var(X+Y)=Var(X)+Var(Y). Ta lastnost disperzije se uporablja pri izpeljavi.

Pokažimo, da je za neodvisne količine Var(X-Y)=Var(X+Y). Dejansko Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Ta lastnost disperzije se uporablja za konstrukcijo.

Standardni odklon vzorca

Standardni odklon vzorca je merilo, kako široko so razpršene vrednosti v vzorcu glede na njihove .

po definiciji standardni odklon enako kvadratnemu korenu iz odstopanja:

Standardni odklon ne upošteva velikosti vrednosti v vzorec, temveč le stopnjo razpršenosti vrednot okoli njih povprečje. Za ponazoritev tega navedimo primer.

Izračunajmo standardno deviacijo za 2 vzorca: (1; 5; 9) in (1001; 1005; 1009). V obeh primerih je s=4. Očitno je, da se razmerje med standardnim odklonom in vrednostmi niza med vzorci bistveno razlikuje. Za take primere se uporablja Koeficient variacije(Koeficient variacije, CV) - razmerje Standardni odklon do povprečja aritmetika, izraženo v odstotkih.

V MS EXCEL 2007 in starejših različicah za izračun Standardni odklon vzorca uporabljena je funkcija =STDEVAL(), angleščina. ime STDEV, tj. Standardno odstopanje. Od različice MS EXCEL 2010 je priporočljivo uporabiti njegov analog =STANDDEV.B() , angleško. ime STDEV.S, tj. Vzorec standardnega odstopanja.

Poleg tega je od različice MS EXCEL 2010 na voljo funkcija STANDARDEV.G(), angleščina. ime STDEV.P, tj. Standardni odklon populacije, ki izračuna standardni odklon Za prebivalstvo. Celotna razlika se zmanjša na imenovalec: namesto n-1 kot v STANDARDEV.V(), ima STANDARDEVAL.G() samo n v imenovalcu.

Standardni odklon lahko izračunate tudi neposredno z uporabo spodnjih formul (glejte primer datoteke)
=ROOT(QUADROTCL(vzorec)/(ŠTEVILO(vzorec)-1))
=ROOT((SUM(vzorec)-COUNT(vzorec)*AVERAGE(vzorec)^2)/(COUNT(vzorec)-1))

Druge mere razpršenosti

Funkcija SQUADROTCL() izračuna z vsota kvadratov odstopanj vrednosti od njihovih povprečje. Ta funkcija bo vrnila enak rezultat kot formula =DISP.G( Vzorec)*PREVERI( Vzorec), kje Vzorec- sklic na obseg, ki vsebuje niz vzorčnih vrednosti (). Izračuni v funkciji QUADROCL() so narejeni po formuli:

Funkcija SROTCL() je tudi merilo širjenja nabora podatkov. Funkcija SROTCL() izračuna povprečje absolutnih vrednosti odstopanj vrednosti od povprečje. Ta funkcija bo vrnila enak rezultat kot formula =SUMPRODUCT(ABS(Vzorec-POVPREČJE(Vzorec)))/ŠTEVILO(Vzorec), Kje Vzorec- povezava do obsega, ki vsebuje niz vzorčnih vrednosti.

Izračuni v funkciji SROTCL () so narejeni po formuli:

.

Nasprotno, če je nenegativen a.e. deluje tako, da , potem obstaja absolutno zvezna verjetnostna mera na takšni, da je to njegova gostota.

    Zamenjava mere v Lebesgueovem integralu:

,

kjer je katera koli Borelova funkcija, ki je integrabilna glede na verjetnostno mero.

Disperzija, vrste in lastnosti disperzije Pojem disperzije

Disperzija v statistiki se ugotovi kot standardni odklon posameznih vrednosti značilnosti na kvadrat od aritmetične sredine. Glede na začetne podatke se določi z uporabo enostavnih in tehtanih formul variance:

1. Preprosta varianta(za nezdružene podatke) se izračuna po formuli:

2. Utežena varianca (za serije variacij):

kjer je n frekvenca (ponovljivost faktorja X)

Primer iskanja variance

Ta stran opisuje standardni primer iskanja variance, ogledate pa si lahko tudi druge težave za iskanje

Primer 1. Določitev skupinskega, skupinskega povprečja, medskupinske in skupne variance

Primer 2. Iskanje variance in koeficienta variacije v grupirni tabeli

Primer 3. Iskanje variance v diskretni seriji

Primer 4. Za skupino 20 dopisnih študentov so na voljo naslednji podatki. Treba je zgraditi intervalno serijo porazdelitve značilnosti, izračunati povprečno vrednost značilnosti in preučiti njeno disperzijo.

Zgradimo intervalno skupino. Določimo obseg intervala z uporabo formule:

kjer je X max največja vrednost značilnosti združevanja; X min – najmanjša vrednost značilnosti združevanja; n – število intervalov:

Sprejemamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Ustvarimo intervalno skupino

Za nadaljnje izračune bomo zgradili pomožno tabelo:

X"i – sredina intervala. (npr. sredina intervala 159 – 165,6 = 162,3)

Povprečno višino študentov določimo s formulo uteženega aritmetičnega povprečja:

Določimo varianco s formulo:

Formulo lahko preoblikujemo takole:

Iz te formule sledi, da varianca je enaka razlika med povprečjem kvadratov možnosti ter kvadratom in povprečjem.

Disperzija v variacijskih serijah z enakimi intervali z uporabo metode momentov lahko izračunamo na naslednji način z uporabo druge lastnosti disperzije (deljenje vseh možnosti z vrednostjo intervala). Določanje variance, izračunana z metodo trenutkov, z uporabo naslednje formule je manj naporna:

kjer je i vrednost intervala; A je običajna ničla, za katero je primerno uporabiti sredino intervala z najvišjo frekvenco; m1 je kvadrat momenta prvega reda; m2 - trenutek drugega reda

Varianca alternativne lastnosti (če se v statistični populaciji značilnost spremeni tako, da obstajata samo dve medsebojno izključujoči možnosti, potem se takšna variabilnost imenuje alternativna) lahko izračunate z uporabo formule:

Če nadomestimo q = 1- p v to disperzijsko formulo, dobimo:

Vrste variance

Skupna varianca meri variacijo lastnosti v celotni populaciji kot celoti pod vplivom vseh dejavnikov, ki povzročajo to variacijo. Je enaka povprečju kvadrata odstopanj posameznih vrednosti značilnosti x od celotne srednje vrednosti x in jo je mogoče opredeliti kot preprosto varianco ali uteženo varianco.

Varianca znotraj skupine označuje naključno variacijo, tj. del variacije, ki je posledica vpliva neupoštevanih dejavnikov in ni odvisen od dejavnika-atributa, ki tvori osnovo skupine. Takšna disperzija je enaka srednjemu kvadratu odstopanj posameznih vrednosti atributa znotraj skupine X od aritmetične sredine skupine in se lahko izračuna kot enostavna disperzija ali kot utežena disperzija.

torej mere variance znotraj skupine variacija lastnosti znotraj skupine in je določena s formulo:

kjer je xi povprečje skupine; ni je število enot v skupini.

Na primer, variance znotraj skupine, ki jih je treba določiti pri nalogi preučevanja vpliva kvalifikacij delavcev na raven produktivnosti dela v delavnici, kažejo razlike v proizvodnji v vsaki skupini, ki jih povzročajo vsi možni dejavniki (tehnično stanje opreme, razpoložljivost orodja in materiali, starost delavcev, intenzivnost dela itd.), razen razlik v kvalifikacijski kategoriji (znotraj skupine imajo vsi delavci enako kvalifikacijo).

Povprečje znotrajskupinskih varianc odraža naključno variacijo, to je tisti del variacije, ki je nastal pod vplivom vseh drugih dejavnikov, razen faktorja združevanja. Izračuna se po formuli:

Medskupinska varianca označuje sistematično variacijo nastale značilnosti, ki je posledica vpliva dejavnika-atributa, ki tvori osnovo skupine. Je enak povprečju kvadrata odstopanj skupinskih povprečij od celotnega povprečja. Varianca med skupinami se izračuna po formuli:

Najnovejši materiali v razdelku:

Gibbsova energija in konstanta ravnotežja Vrednost konstante ravnotežja
Gibbsova energija in konstanta ravnotežja Vrednost konstante ravnotežja

Vrnimo se k procesu proizvodnje amoniaka, izraženega z enačbo: N 2 (g) + 3H 2 (g) → 2NH 3 (g) Biti v zaprtem volumnu, dušik in vodik ...

Vektorji.  Vrste vektorjev.  Vektorji za enotni državni izpit iz matematike.  Dejanja na vektorje Oznaka vektorja
Vektorji. Vrste vektorjev. Vektorji za enotni državni izpit iz matematike. Dejanja na vektorje Oznaka vektorja

VEKTOR V fiziki in matematiki je vektor količina, ki je označena s svojo numerično vrednostjo in smerjo. V fiziki je veliko...

V katerih stoletjih so bile odkrite celine?
V katerih stoletjih so bile odkrite celine?

Morda mi ne bo težko odgovoriti, saj nisem ljubitelj le geografije, ampak tudi zgodovine. Zato, če govorimo samo o enem od teh dogodkov ...