Granična greška formule prosječne vrijednosti. Srednje i granične greške uzorkovanja

Da bi se okarakterisala pouzdanost indikatora uzorka, pravi se razlika između srednjih i graničnih grešaka uzorkovanja, koje su karakteristične samo za posmatranja uzorka. Ovi indikatori odražavaju razliku između uzorka i odgovarajućih opštih indikatora.

Prosječna greška uzorka određuje se prvenstveno veličinom uzorka i zavisi od strukture i stepena varijacije osobine koja se proučava.

Značenje srednje greške uzorkovanja je sljedeće. Izračunate vrijednosti frakcije uzorka (w) i srednje vrijednosti uzorka () su po svojoj prirodi slučajne varijable. One mogu poprimiti različite vrijednosti ovisno o tome koje specifične jedinice opće populacije spadaju u uzorak. Na primjer, ako se pri određivanju prosječne starosti zaposlenih u jednom preduzeću više mladih ljudi uključi u jedan uzorak, a stariji radnici u drugi, tada će srednje vrijednosti uzorka i greške uzorka biti različite. Prosječna greška uzorkovanja određuje se formulom:

(27) ili - ponovno uzorkovanje. (28)

Gdje je: μ prosječna greška uzorkovanja;

σ je standardna devijacija osobine u općoj populaciji;

n je veličina uzorka.

Vrijednost greške μ pokazuje kako se srednja vrijednost obilježja, utvrđena uzorkom, razlikuje od prave vrijednosti karakteristike u opštoj populaciji.

Iz formule slijedi da je greška uzorkovanja direktno proporcionalna standardnoj devijaciji i obrnuto proporcionalna kvadratnom korijenu broja jedinica u uzorku. To znači, na primjer, da što je veća rasprostranjenost vrijednosti neke karakteristike u općoj populaciji, odnosno što je veća disperzija, to bi veličina uzorka trebala biti veća ako želimo vjerovati rezultatima ankete uzorka. . Nasuprot tome, uz malu varijansu, može se ograničiti na mali broj populacija uzoraka. Greška uzorkovanja će tada biti unutar prihvatljivih granica.

Budući da se veličina opšte populacije N tokom uzorkovanja smanjuje tokom neponovljene selekcije, dodatni faktor je uključen u formulu za izračunavanje prosječne greške uzorkovanja

(jedan-). Formula za srednju grešku uzorkovanja ima sljedeći oblik:

Prosječna greška je manja za uzorkovanje koji se ne ponavlja, što ga čini širom upotrebom.

Praktični zaključci zahtijevaju karakterizaciju opće populacije na osnovu rezultata uzorka. Uzorak srednjih vrijednosti i proporcija primjenjuju se na opštu populaciju, uzimajući u obzir granicu njihove moguće greške, i sa nivoom vjerovatnoće koji to garantuje. S obzirom na određeni nivo vjerovatnoće, odabire se vrijednost normaliziranog odstupanja i određuje se marginalna greška uzorkovanja.

Pouzdanost (vjerovatnoća pouzdanosti) procjene X prema X* zove verovatnoća γ , sa kojim je nejednakost


׀H-H*׀< δ, (30)

gdje je δ granična greška uzorkovanja koja karakterizira širinu intervala u kojem se vrijednost proučavanog parametra opće populacije nalazi s vjerovatnoćom γ.

Trusted imenuje interval (X* - δ; X* + δ) koji pokriva istraženi parametar X (to jest, vrijednost parametra X je unutar ovog intervala) sa datom pouzdanošću γ.

Obično se pouzdanost procjene unaprijed postavlja, a broj blizu jedan uzima se kao γ: 0,95; 0,99 ili 0,999.

Granična greška δ povezana je sa prosječnom greškom μ na sljedeći način: , (31)

gdje je: t faktor povjerenja, u zavisnosti od vjerovatnoće P, sa kojim se može tvrditi da marginalna greška δ neće premašiti t-struku prosječnu grešku μ (naziva se i kritične tačke ili kvantili Studentove distribucije).

Kao što slijedi iz omjera, granična greška je direktno proporcionalna prosječnoj grešci uzorkovanja i koeficijentu pouzdanosti, koji zavisi od datog nivoa pouzdanosti procjene.

Iz formule za prosječnu grešku uzorkovanja i omjera granične i prosječne greške dobijamo:

Uzimajući u obzir vjerovatnoću povjerenja, ova formula će poprimiti oblik.

Kao što je poznato, u statistici postoje dva načina posmatranja masovnih pojava, u zavisnosti od potpunosti obuhvata objekta: kontinuirani i nekontinuirani. Varijacija diskontinuiranog posmatranja je selektivno posmatranje.

Ispod selektivno posmatranje se podrazumijeva kao nekontinuirano posmatranje, u kojem se jedinice proučavane populacije, nasumično odabrane, podvrgavaju statističkom ispitivanju (posmatranju).

Selektivno posmatranje postavlja sebi zadatak da karakteriše celokupnu populaciju jedinica za ispitivani deo, uz poštovanje svih pravila i principa statističkog posmatranja i naučno organizovanog rada na izboru jedinica.

Skup jedinica odabranih za istraživanje u statistici se obično naziva uzorak populacije , a skup jedinica iz kojih se vrši odabir se poziva opšta populacija . Glavne karakteristike opće populacije i populacije uzorka prikazane su u tabeli 1.

Tabela 1 - Glavne karakteristike opće populacije i populacije uzorka
IndikatorOznaka ili formula
Populacija Populacija uzorka
Broj jedinica N n
Broj jedinica koje imaju funkciju M m
Udio jedinica sa ovom karakteristikom p = M/N ω = m/n
Udio jedinica koje nemaju ovu osobinu q = 1 - str 1 - w
Prosječna vrijednost sign
Disperzija sign
Disperzija alternativnog obilježja (disperzija udjela) pq ω (1 - ω)

Prilikom selektivnog posmatranja dolazi do sistematskih i slučajnih grešaka. Sistematske greške nastaju zbog kršenja pravila za odabir jedinica u uzorku. Promjenom pravila odabira takve greške se mogu eliminirati.

Slučajne greške nastaju zbog diskontinualne prirode istraživanja. Inače se nazivaju greške reprezentativnosti (reprezentativnosti). Slučajne greške se dijele na prosječne i granične greške uzorkovanja, koje se utvrđuju kako pri izračunavanju obilježja tako i pri izračunavanju udjela.

Prosječna i granična greška povezane su sljedećom relacijom :Δ = tμ, gdje je Δ granična greška uzorkovanja, μ je prosječna greška uzorkovanja, t je faktor povjerenja određen u zavisnosti od nivoa vjerovatnoće. Tabela 2 prikazuje neke vrijednosti t preuzete iz teorije vjerovatnoće.

Vrijednost prosječne greške uzorkovanja se izračunava različito ovisno o metodi odabira i postupku uzorkovanja. Glavne formule za izračunavanje grešaka uzorkovanja prikazane su u tabeli 3.

Tabela 3 - Osnovne formule za izračunavanje grešaka uzorkovanja u ponavljajućem i neponovljenom odabiru
IndikatorOznaka i formula
Populacija Populacija uzorka
Srednja greška karakteristike za nasumično ponovno uzorkovanje
Srednja greška udjela za nasumično ponovno uzorkovanje
Granična greška karakteristike u slučaju slučajnog ponovnog odabira
Granična greška dijeljenja u nasumičnom ponovnom izboru
Prosječna greška osobine za slučajni nerepetitivni odabir
Srednja greška udjela u nasumičnom, neponovljivom odabiru
Granična greška karakteristike sa slučajnim odabirom koji se ne ponavlja
Greška graničnog udjela za nasumični nerepetitivni odabir

Izračun prosječne i granične greške uzorkovanja omogućava vam da odredite moguće granice u kojima će karakteristike opće populacije biti .

Na primjer, za srednju vrijednost uzorka, takve granice se postavljaju na osnovu sljedećih odnosa:

Granice udjela osobine u opštoj populaciji str.

Primjeri rješavanja zadataka na temu "Uzorkovanje posmatranja u statistici"

Zadatak 1 . Postoje informacije o proizvodnji proizvoda (radova, usluga) dobijene na osnovu 10% uzorka posmatranja preduzeća u regionu:

Odrediti: 1) za preduzeća uključena u uzorak: a) prosečnu veličinu outputa po preduzeću; b) disperzija obima proizvodnje; c) udio preduzeća sa obimom proizvodnje većim od 400 hiljada rubalja; 2) za region u celini, sa verovatnoćom od 0,954, granice u kojima se može očekivati: a) prosečan obim proizvodnje po preduzeću; b) udio preduzeća sa obimom proizvodnje većim od 400 hiljada rubalja; 3) ukupan obim proizvodnje u regionu.

Rješenje

Da bismo riješili problem, proširujemo predloženu tabelu.

1) Za preduzeća uključena u uzorak, prosječna veličina outputa po preduzeću

110800/400 = 277 hiljada rubalja

Disperziju obima proizvodnje izračunavamo na pojednostavljen način σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Broj preduzeća čiji obim proizvodnje prelazi 400 hiljada rubalja. iznosi 36+12 = 48, a njihov udio je ω = 48:400 = 0,12 = 12%.

2) Iz teorije vjerovatnoće je poznato da je sa vjerovatnoćom P=0,954 faktor povjerenja t=2. Granična greška uzorkovanja

2√12371:400 = 11,12 hiljada rubalja

Postavimo granice opšteg prosjeka: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤Xav ≤ 288,12

Granična greška uzorkovanja udjela preduzeća

2√0,12*0,88/400 = 0,03

Definišemo granice opšteg udela: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ p≤0,15

3) Pošto razmatrana grupa preduzeća čini 10% od ukupnog broja preduzeća u regionu, u regionu u celini ima 4.000 preduzeća. Tada je ukupni obim proizvodnje u regionu unutar 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Zadatak 2 . Prema rezultatima kontrolne revizije poreskih organa 400 poslovnih struktura, njih 140 u poreskim prijavama ne iskazuje u potpunosti prihod koji podleže oporezivanju. Odrediti u opštoj populaciji (za cijeli region) udio poslovnih struktura koje su sakrile dio svojih poreskih prihoda sa vjerovatnoćom od 0,954.

Rješenje

U skladu sa uslovom zadatka, broj jedinica u populaciji uzorka je n=400, broj jedinica sa razmatranim obeležjem je m=140, verovatnoća je P=0,954.

Iz teorije vjerovatnoće je poznato da je sa vjerovatnoćom P=0,954 faktor povjerenja t=2.

Udio jedinica koje imaju naznačeni atribut određuje se po formuli: p=w+∆p, gdje je w = m/n=140/400=0,35=35%,
a granična greška karakteristike ∆p se dobija iz formule: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Tada je p = 35±5%.

Odgovori : Udio poslovnih struktura koje su sakrile dio svojih poreskih prihoda sa vjerovatnoćom od 0,954 iznosi 35±5%.

Koncept selektivnog posmatranja.

Selektivno naziva se takvo opažanje u kojem se daje karakteristika čitavog skupa jedinica prema nekim njihovim dijelovima, odabranim slučajnim redoslijedom.

Razlozi za korištenje selektivnog promatranja:

1. Ušteda materijala, rada, finansijskih sredstava i vremena.

2. Odabrana opservacija često dovodi do povećanja tačnosti podataka, jer smanjenje broja jedinica promatranja naglo smanjuje greške u registraciji vrijednosti znaka (greške u otisku, nedovoljno brojanje, dvostruko brojanje...).

3. Selektivno posmatranje je jedino moguće ako je posmatranje praćeno potpunim ili delimičnim oštećenjem posmatranih objekata (kvalitet šarže jaja, čvrstoća tkiva i sl.).

Obično se naziva onaj dio jedinica koje su odabrane za posmatranje uzorak populacije ili jednostavno uzorkovanje, i cijeli skup jedinica iz kojih se vrši odabir - opšta populacija.

Usvojen je sljedeći sistem označavanja indikatora za odabranu i opštu populaciju.

Ovisno o primjeni tehnike selekcije, uzorak se dijeli na serijski (ugniježđeni) i tipološki.

· Kada tipološki uzorkovanjem, opća populacija se dijeli na tipove (grupe, okruge), a zatim se vrši slučajni odabir jedinica iz svake vrste.

· At serijski uzorak se ne bira po jedinicama, već prema određenim serijama, grupama, oblastima unutar kojih se vrši kontinuirano posmatranje.

Postoje dva načina za odabir jedinica u uzorku:

- ponovni izbor

svaka jedinica u uzorku se vraća u opštu populaciju i ima priliku da bude ponovo uzorkovana.

- selekcija koja se ne ponavlja

odabrana jedinica se ne vraća u populaciju, a vjerovatnije je da će preostale jedinice biti uključene u uzorak. Uzorkovanje koje se ne ponavlja daje preciznije rezultate, ali ponekad to nije moguće (istraživanje potražnje potrošača).

Kvaliteta rezultata uzorkovanja ovisi o tome u kojoj mjeri sastav uzorka predstavlja opću populaciju, drugim riječima, od toga koliko je uzorak predstavnik(predstavnik). Da bi se osigurala reprezentativnost uzorka, potrebno je poštovati princip slučajnog odabira jedinica.

Greška uzorkovanja

Pojam i vrste grešaka uzorkovanja

Budući da se statistička populacija koja se proučava sastoji od jedinica sa različitim karakteristikama, sastav populacije uzorka može se donekle razlikovati od sastava opšte populacije.

Nesklad između karakteristika uzorka i opće populacije je greška uzorkovanja.

Vrste grešaka uzorkovanja

Glavni zadatak metode uzorkovanja je proučavanje slučajnih grešaka reprezentativnosti.

Prosječna greška uzorkovanja

Slučajna greška reprezentativnosti zavisi od sledećih činjenica (pretpostavlja se da nema grešaka u registraciji):

1. Što je veća veličina uzorka, ceteris paribus, to je manja greška uzorkovanja, tj. greška uzorkovanja je obrnuto proporcionalna njegovoj veličini.

2. Što je manja varijacija atributa, manja je greška uzorkovanja. Ako se predznak uopće ne mijenja, pa je varijansa nula, tada neće biti greške uzorkovanja, jer bilo koja jedinica populacije će tačno okarakterizirati cjelokupnu populaciju na ovoj osnovi. Dakle, greška uzorkovanja je direktno proporcionalna veličini varijanse.

U matematičkoj statistici je dokazano da se vrijednost prosječne greške slučajnog ponovnog uzorkovanja može odrediti formulom

Međutim, treba imati na umu da je veličina disperzije u opštoj populaciji s2 ne znamo, jer selektivno posmatranje. Možemo samo izračunati varijansu u populaciji uzorka S2. Odnos između varijansi opšte populacije i populacije uzorka izražava se formulom:

(6.2)

Ako a n velika, dakle

s2 = S2

A formula za prosječnu grešku ponovnog uzorkovanja (6.1.) će poprimiti oblik:

Ali ovdje smo uzeli u obzir samo grešku uzorkovanja za srednju vrijednost karakteristike od interesa. Tu je i indikator udjela jedinica sa obilježjem od interesa. Izračun greške ovog indikatora ima svoje karakteristike.

Varijanca za karakteristični indikator udjela određena je formulom:

S 2 \u003d w (1-w) (6.4)

Tada će prosječna greška uzorkovanja za mjeru udjela karakteristike biti jednaka:

(6.5)

Dokaz formula (6.3) i (6.5) počinje od šeme ponovnog uzorkovanja. Obično je uzorak organiziran na način koji se ne ponavlja. Jer uz nerepetitivnu selekciju, veličinu opće populacije N je skraćeno u kodu uzorkovanja, tada je dodatni faktor uključen u formule greške uzorkovanja , a formule imaju oblik:

(6.6)

(6.7)

Primjer 1. Odredimo koliko se uzorak i opći pokazatelji razlikuju prema podacima 10% neponovljenog uzorka uspješnosti učenika.

Izračun greške ne-ponovnog uzorkovanja za srednju vrijednost:

n= 100 N= 1000

Pronađite varijansu uzorka koristeći formulu:

Ovdje vrijednost nije poznata, koja se može naći kao običan ponderirani prosjek:

dakle,

One. možemo reći da je prosječna ocjena svih učenika () 3,65 ± 0,07

Sada izračunajmo udio studenata u opštoj populaciji koji studiraju za "4" i "5".

Na osnovu uzorka naći ćemo udio učenika koji su dobili ocjene “4” i “5”.

(ili 64%)

Izračunavanje greške ne-ponovnog uzorkovanja za udio vrši se prema formuli:

(ili 4,5%)

Dakle, udio učenika upisanih na "4" i "5" u opštoj populaciji ( P) je 0,64±0,045 (ili 64%±4,5%).

Granična greška uzorkovanja

Činjenica da opći prosjek i opći udio neće preći određene granice može se tvrditi ne sa apsolutnom sigurnošću, već samo sa određenim stepenom vjerovatnoće.

U matematičkoj statistici je dokazano da opšte karakteristike odstupaju od uzoraka za količinu greške uzorkovanja (± m), samo sa vjerovatnoćom od 0,683. Što se tiče studija uzoraka, to se podrazumijeva da se vrijednosti granica mogu garantirati samo u 683 slučaja od 1000. U preostalih 317 slučajeva vrijednosti ovih granica će biti različite.

Vjerovatnoća prosuđivanja može se povećati proširenjem granica odstupanja uzimajući kao mjeru prosječnu grešku uzorkovanja, uvećanu za t jednom.

One. sa određenim stepenom verovatnoće možemo tvrditi da odstupanja karakteristika uzorka od opštih neće preći određenu vrednost, koja se naziva marginalna greška uzorkovanja D (delta):

gdje t– faktor pouzdanosti (faktor multipliciteta greške), određen u zavisnosti od nivoa pouzdanosti sa kojim je potrebno garantovati rezultate studije uzorka.

U praksi se koriste tabele u kojima se izračunavaju vjerovatnoće za različite vrijednosti t. Pogledajmo neke od njih.

t Vjerovatnoća t Vjerovatnoća
0,5 0,383 2,0 0,954
1,0 0,683 2,5 0,988
1,5 0,866 3,0 0,997

Na primjer, ako u našem primjeru želimo povećati vjerovatnoću prosuđivanja na 0,954, onda uzimamo t= 2 i na taj način mijenjaju granice odstupanja prosječne ocjene svih učenika i udjela učenika upisanih na "4" i "5".

Odnosno (6.9)

To jest, (6.10)

Tokom selektivnog posmatranja, to treba osigurati nezgoda izbor jedinice. Svaka jedinica mora imati jednaku priliku da bude izabrana sa ostalima. Na tome se zasniva nasumično uzorkovanje.

To odgovarajući slučajni uzorak odnosi se na odabir jedinica iz cjelokupne opće populacije (bez prethodnog dijeljenja na bilo koju grupu) žrijebom (uglavnom) ili nekom drugom sličnom metodom, na primjer, korištenjem tablice slučajnih brojeva. Slučajni odabir Ovaj odabir nije slučajan. Princip slučajnosti sugerira da na uključivanje ili isključivanje objekta iz uzorka ne može utjecati nijedan drugi faktor osim slučajnosti. Primjer zapravo nasumično izbor može poslužiti kao cirkulacije dobitaka: od ukupnog broja izdatih listića, nasumično se bira određeni dio brojeva koji čine dobitke. Štaviše, svim brojevima se pruža jednaka prilika da uđu u uzorak. U ovom slučaju, broj jedinica odabranih u skupu uzoraka obično se određuje na osnovu prihvaćenog udjela uzorka.

Udio uzorka je omjer broja jedinica populacije uzorka i broja jedinica opće populacije:

Dakle, sa 5% uzorka iz serije delova u 1000 jedinica. veličina uzorka P iznosi 50 jedinica, a sa 10% uzorka - 100 jedinica. itd. Uz pravilnu naučnu organizaciju uzorkovanja, greške reprezentativnosti se mogu svesti na minimalne vrijednosti, kao rezultat toga, selektivno posmatranje postaje dovoljno precizno.

Pravilna nasumična selekcija "u svom čistom obliku" se rijetko koristi u praksi selektivnog posmatranja, ali je polazna tačka među svim drugim vrstama selekcije, sadrži i implementira osnovne principe selektivnog posmatranja.

Razmotrimo neka pitanja teorije metode uzorkovanja i formule greške za jednostavan slučajni uzorak.

Prilikom primjene metode uzorkovanja u statistici, obično se koriste dvije glavne vrste generalizirajućih indikatora: prosječna vrijednost kvantitativne osobine i relativna vrijednost alternativne karakteristike(udio ili udio jedinica u statističkoj populaciji, koje se od svih ostalih jedinica ove populacije razlikuju samo po prisustvu osobine koja se proučava).

Udio uzorka (w), ili učestalost, određena je omjerom broja jedinica koje imaju karakteristiku koja se proučava T, na ukupan broj jedinica uzorkovanja P:

Na primjer, ako od 100 detalja uzorka ( n=100), pokazalo se da je 95 dijelova standardno (t=95), zatim frakcija uzorka

w=95/100=0,95 .

Da bi se okarakterisala pouzdanost indikatora uzorka, postoje srednji i marginalna greška uzorkovanja.

Greška uzorkovanja ? ili, drugim riječima, greška reprezentativnosti je razlika između odgovarajućeg uzorka i općih karakteristika:

*

*

Greška uzorkovanja je karakteristična samo za selektivna opažanja. Što je veća vrijednost ove greške, to se indikatori uzorka više razlikuju od odgovarajućih općih indikatora.

Srednja vrijednost uzorka i udio uzorka su inherentni slučajne varijable, koje mogu poprimiti različite vrijednosti u zavisnosti od toga koje su jedinice populacije bile uključene u uzorak. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga odredite prosjek mogućih grešaka – prosječnu grešku uzorka.

Od čega zavisi znači greška uzorkovanja? U skladu sa principom slučajnog odabira, prosječna greška uzorkovanja se prvenstveno utvrđuje veličina uzorka:što je veća populacija, ceteris paribus, manja je prosječna greška uzorkovanja. Pokrivajući uzorkovanu anketu sa sve većim brojem jedinica opšte populacije, sve preciznije karakterišemo celokupnu populaciju.

Srednja greška uzorkovanja takođe zavisi od stepen varijacije proučavana osobina. Stepen varijacije, kao što znate, karakteriše disperzija? 2 ili w(1-w)-- za alternativnu funkciju. Što je manja varijacija karakteristike, a time i varijansa, manja je prosječna greška uzorkovanja, i obrnuto. Uz nultu disperziju (atribut se ne mijenja), prosječna greška uzorkovanja je nula, tj. bilo koja jedinica opće populacije će precizno karakterizirati cijelu populaciju prema ovom atributu.

Zavisnost prosječne greške uzorkovanja od njegovog volumena i stepena varijacije atributa ogleda se u formulama koje se mogu koristiti za izračunavanje prosječne greške uzorkovanja u uslovima posmatranja uzorka, kada su opšte karakteristike ( x,p) su nepoznate, pa stoga nije moguće pronaći stvarnu grešku uzorkovanja direktno iz formula (form. 1), (form. 2).

W Sa slučajnim odabirom prosečne greške teoretski izračunato prema sljedećim formulama:

* za prosječnu kvantitativnu osobinu

* za udio (alternativna karakteristika)

Budući da je praktično varijansa atributa u općoj populaciji? 2 nije točno poznato, u praksi koriste vrijednost varijanse S 2 izračunatu za populaciju uzorka na osnovu zakona velikih brojeva, prema kojem populacija uzorka s dovoljno velikom veličinom uzorka precizno reproducira karakteristike uzorka. opšta populacija.

dakle, formule za izračunavanje srednji greške uzorkovanja nasumično ponovno uzorkovanje će biti kako slijedi:

* za prosječnu kvantitativnu osobinu

* za udio (alternativna karakteristika)

Međutim, varijansa populacije uzorka nije jednaka varijansi opšte populacije, pa će stoga prosječne greške uzorkovanja izračunate korištenjem formula (form. 5) i (obrazac. 6) biti približne. Ali u teoriji vjerovatnoće je dokazano da se opšta varijansa izražava kroz izbornost sljedećom relacijom:

As P/(n-1) za dovoljno velike P -- vrijednosti blizu jedinice, može se pretpostaviti da se, stoga, u praktičnim proračunima prosječnih grešaka uzorkovanja, mogu koristiti formule (form. 5) i (form. 6). I samo u slučajevima malog uzorka (kada veličina uzorka ne prelazi 30) potrebno je uzeti u obzir koeficijent P/(n-1) i izračunaj mala srednja greška uzorka prema formuli:

W X Sa slučajnim odabirom koji se ne ponavlja u gornjim formulama za izračunavanje prosječnih grešaka uzorkovanja potrebno je korijenski izraz pomnožiti sa 1-(n/N), pošto se broj jedinica u opštoj populaciji smanjuje u procesu nerepetitivnog uzorkovanja. Stoga, za izbor koji se ne ponavlja formule za izračunavanje srednja greška uzorkovanja će poprimiti sljedeći oblik:

* za prosječnu kvantitativnu osobinu

* za udio (alternativna karakteristika)

. (obrazac. 10)

As P uvek manje N, zatim dodatni faktor 1-( n/n) uvijek će biti manji od jedan. Iz ovoga slijedi da će prosječna greška kod nerepetitivnog odabira uvijek biti manja nego kod ponovljenog odabira. Istovremeno, sa relativno malim procentom uzorka, ovaj faktor je blizu jedan (npr. kod uzorka od 5% iznosi 0,95, kod uzorka od 2% iznosi 0,98 itd.). Stoga se ponekad u praksi koriste formule (obrasci 5) i (obrasci 6) za određivanje prosječne greške uzorkovanja bez navedenog množitelja, iako je uzorak organiziran kao neponovljiv. Ovo se dešava kada je broj jedinica opšte populacije N nepoznat ili neograničen, ili kada P vrlo malo u poređenju sa N, a u suštini, uvođenje dodatnog faktora, po vrijednosti bliskog jedinici, praktično neće uticati na vrijednost prosječne greške uzorkovanja.

Mehaničko uzorkovanje sastoji se u tome da se odabir jedinica uzorka iz općeg, podijeljenih neutralnim kriterijem na jednake intervale (grupe), vrši na način da se iz svake takve grupe u uzorku bira samo jedna jedinica. Da bi se izbjegle sistematske greške, treba odabrati jedinicu koja se nalazi u sredini svake grupe.

Prilikom organiziranja mehaničke selekcije, jedinice populacije su unaprijed raspoređene (obično na listi) određenim redoslijedom (na primjer, abecednim redom, po lokaciji, uzlaznim ili silaznim redoslijedom vrijednosti bilo kojeg indikatora koji nije povezan sa ispitivanim svojstvom, itd.) itd.), nakon čega se zadati broj jedinica bira mehanički, u određenom intervalu. U ovom slučaju, veličina intervala u općoj populaciji jednaka je recipročnom udjelu uzorka. Dakle, kod uzorka od 2% bira se i provjerava svaka 50. jedinica (1:0,02), sa uzorkom od 5% svaka 20. jedinica (1:0,05), na primjer, silazni detalj sa mašine.

Sa dovoljno velikom populacijom, mehanički odabir u smislu tačnosti rezultata je blizu pravog slučajnog. Stoga se za određivanje prosječne greške mehaničkog uzorka koriste formule za samoslučajno neponavljajuće uzorkovanje (form. 9), (obrazac. 10).

Za odabir jedinica iz heterogene populacije, tzv tipičan uzorak , koji se koristi u slučajevima kada se sve jedinice opšte populacije mogu podijeliti u nekoliko kvalitativno homogenih, sličnih grupa prema karakteristikama koje utiču na indikatore koji se proučavaju.

Prilikom anketiranja preduzeća, takve grupe mogu biti, na primjer, industrija i podsektor, oblici vlasništva. Zatim se iz svake tipične grupe vrši pojedinačni odabir jedinica u uzorak slučajnim ili mehaničkim uzorkom.

Tipičan uzorak se obično koristi u proučavanju složenih statističkih populacija. Na primjer, u uzorku istraživanja porodičnih budžeta radnika i zaposlenih u pojedinim sektorima privrede, produktivnost rada radnika u preduzeću, predstavljena posebnim grupama po kvalifikacijama.

Tipičan uzorak daje preciznije rezultate u poređenju sa drugim metodama odabira jedinica u skupu uzoraka. Tipizacija opšte populacije obezbeđuje reprezentativnost takvog uzorka, zastupljenost svake tipološke grupe u njemu, što omogućava da se isključi uticaj međugrupne disperzije na prosečnu grešku uzorka.

Prilikom utvrđivanja prosječna greška tipičnog uzorka kao indikator varijacije prosjek varijansi unutar grupe.

Srednja greška uzorkovanja nalaze se po formulama:

* za prosječnu kvantitativnu osobinu

(ponovni odabir); (obrazac. 11)

(nepovratna selekcija); (obrazac. 12)

* za udio (alternativna karakteristika)

(ponovni odabir); (form.13)

(neponavljajući izbor), (obrazac. 14)

gdje je prosjek varijansi unutar grupe za populaciju uzorka;

Prosjek unutargrupnih varijansi udjela (alternativna osobina) u populaciji uzorka.

serijsko uzorkovanje uključuje slučajni odabir iz opće populacije ne pojedinačnih jedinica, već njihovih jednakih grupa (gnijezda, serije) kako bi se sve jedinice bez izuzetka podvrgle promatranju u takvim grupama.

Upotreba serijskog uzorkovanja je zbog činjenice da se mnoga roba za njihov transport, skladištenje i prodaju pakira u pakete, kutije itd. Stoga je pri kontroli kvaliteta upakovane robe racionalnije provjeriti nekoliko pakovanja (serija) nego odabrati potrebnu količinu robe iz svih pakovanja.

Budući da se unutar grupa (serija) ispituju sve jedinice bez izuzetka, prosječna greška uzorkovanja (pri odabiru jednakih serija) zavisi samo od međugrupne (međuserijalne) varijanse.

W Srednja greška uzorkovanja za srednji rezultat prilikom serijske selekcije nalaze se po formulama:

(ponovni odabir); (forma.15)

(neponavljajući izbor), (obrazac. 16)

gdje r- broj odabranih serija; R- ukupan broj epizoda.

Međugrupna varijansa serijskog uzorka izračunava se na sljedeći način:

gdje je prosjek i- th serija; - opći prosjek za cjelokupnu populaciju uzorka.

W Prosječna greška uzorkovanja za dijeljenje (alternativna karakteristika) u serijskoj selekciji:

(ponovni odabir); (obrazac. 17)

(neponavljajući izbor). (obrazac. 18)

Intergroup(međuserija) varijansa udjela serijskog uzorka određena formulom:

, (form. 19)

gdje je udio karakteristike u i th serija; - ukupan udio osobine u cijelom uzorku.

U praksi statističkih istraživanja, pored prethodno razmatranih metoda selekcije, koristi se njihova kombinacija (kombinovani izbor).

Koncept selektivnog posmatranja.

Statističkom metodom posmatranja moguće je koristiti dvije metode posmatranja: kontinuirano, koje obuhvata sve jedinice populacije, i selektivno (nekontinuirano).

Pod metodom uzorkovanja podrazumijeva se istraživačka metoda povezana sa uspostavljanjem generalizirajućih pokazatelja populacije za neke njene dijelove na osnovu metode slučajnog odabira.

Selektivnim posmatranjem ispituje se relativno mali dio cjelokupne populacije (5-10%).

Totalnost koju treba ispitati se zove opšta populacija.

Dio jedinica odabranih iz opće populacije koji je predmet istraživanja naziva se uzorak populacije ili uzorak.

Indikatori koji karakterišu opštu populaciju i populaciju uzorka:

1) udio alternativnog znaka;

AT stanovništva udio jedinica koje imaju neku alternativnu osobinu označava se slovom "P".

AT okvir za uzorkovanje udio jedinica koje imaju neki alternativni atribut označen je slovom "w".

2) prosečna veličina znaka;

AT stanovništva prosječna veličina karakteristike je označena slovom (opći prosjek).

AT okvir za uzorkovanje prosječna veličina karakteristike je označena slovom (srednja vrijednost uzorka).

Definicija greške uzorkovanja.

Selektivno posmatranje se zasniva na principu jednake mogućnosti ulaska jedinica opšte populacije u uzorak. Ovo izbegava sistematske greške u posmatranju. Međutim, zbog činjenice da se ispitana populacija sastoji od jedinica s različitim karakteristikama, sastav uzorka se može razlikovati od sastava opće populacije, što uzrokuje neslaganja između općih karakteristika i karakteristika uzorka.

Takva odstupanja se nazivaju greške reprezentativnosti ili greške uzorkovanja.

Utvrđivanje greške uzorkovanja glavni je zadatak koji treba riješiti tokom selektivnog posmatranja.

U matematičkoj statistici je dokazano da je prosječna greška uzorkovanja određena formulom:

gdje je m greška uzorkovanja;

s 2 0 je varijansa opšte populacije;

n je broj jedinica uzorka.

U praksi, varijansa populacije uzorka s 2 se koristi za određivanje srednje greške uzorkovanja.

Postoji jednakost između opće i uzorka varijanse:

(2).

Iz formule (2) se može vidjeti da je opća varijansa veća od varijanse uzorka za vrijednost (). Međutim, za dovoljno veliku veličinu uzorka, ovaj omjer je blizu jedinice, tako da to možemo zapisati

Međutim, ova formula za određivanje srednje greške uzorkovanja primjenjiva je samo na ponovno uzorkovanje.

U praksi se obično koristi selekcija koja se ne ponavlja a srednja greška uzorkovanja se izračunava malo drugačije, jer se veličina uzorka smanjuje tokom studije:

(4)

gdje je n veličina uzorka;

N je veličina opće populacije;

s 2 - varijansa uzorka.

Za udio alternativne karakteristike, prosječna greška uzorkovanja na bez ponovnog izbora određuje se formulom:

(5), gdje

w (1-w) - prosječna greška uzorka udjela alternativne karakteristike;

w je udio alternativne karakteristike populacije uzorka.

At ponovna selekcija prosječna greška udjela alternativne karakteristike određena je pojednostavljenom formulom:

(6)

Ako a veličina uzorka ne prelazi 5%, prosječna greška uzorka i srednje vrijednosti uzorka određuju se pojednostavljenim formulama (3) i (6).

Određivanje srednje greške uzorka srednje vrijednosti i uzorka potrebno je da bi se utvrdile moguće vrijednosti opšte srednje vrijednosti (x) i opšteg udjela (P) na osnovu srednje vrijednosti uzorka (x) i uzorka (w).

Jedna od mogućih vrijednosti unutar koje se nalazi opći prosjek određena je formulom:

Za opći dio, ovaj interval se može zapisati kao :

(8)

Karakteristike udjela i ovako dobivenog prosjeka u opštoj populaciji razlikuju se od vrijednosti udjela uzorka i prosjeka uzorka za vrijednost m. Međutim, to se ne može garantovati sa potpunom sigurnošću, već samo sa određenim stepenom verovatnoće.

U matematičkoj statistici je dokazano da se granice vrijednosti karakteristika opšte i uzorkovane srednje vrijednosti razlikuju za m samo sa vjerovatnoćom od 0,683. Dakle, samo u 683 slučaja od 1000 opšti prosek je unutar x= x m x, u drugim slučajevima, to će preći ove granice.

Vjerovatnoća prosuđivanja može se povećati proširenjem granica odstupanja uzimajući kao mjeru prosječnu grešku uzorkovanja, uvećanu za t puta.

Faktor t se naziva faktor povjerenja. Određuje se u zavisnosti od nivoa pouzdanosti sa kojim je potrebno garantovati rezultate studije.

Matematičar A.M. Lyapushev izračunao je različite vrijednosti t, koje se obično daju u gotovim tabelama.

Nedavni članci u rubrici:

Najveće operacije izvedene tokom partizanskog pokreta
Najveće operacije izvedene tokom partizanskog pokreta

Partizanska akcija "Koncert" Partizani su ljudi koji se dobrovoljno bore u sastavu oružanih organizovanih partizanskih snaga na ...

Meteoriti i asteroidi.  Asteroidi.  komete.  meteori.  meteoriti.  Geograf je asteroid blizu Zemlje koji je ili dvostruki objekt ili ima vrlo nepravilan oblik.  Ovo proizilazi iz zavisnosti njegove svetlosti od faze rotacije oko sopstvene ose
Meteoriti i asteroidi. Asteroidi. komete. meteori. meteoriti. Geograf je asteroid blizu Zemlje koji je ili dvostruki objekt ili ima vrlo nepravilan oblik. Ovo proizilazi iz zavisnosti njegove svetlosti od faze rotacije oko sopstvene ose

Meteoriti su mala kamena tijela kosmičkog porijekla koja padaju u guste slojeve atmosfere (na primjer, poput planete Zemlje), i ...

Sunce rađa nove planete (2 fotografije) Neobične pojave u svemiru
Sunce rađa nove planete (2 fotografije) Neobične pojave u svemiru

Na Suncu se s vremena na vreme dešavaju snažne eksplozije, ali ono što su naučnici otkrili iznenadiće sve. Američka vazduhoplovna agencija...