Vidējās vērtības formulas robežkļūda. Vidējās un marginālās izlases kļūdas

Lai raksturotu izlases rādītāju ticamību, tiek izdalītas vidējās un robežkļūdas, kas raksturīgas tikai izlases novērojumiem. Šie rādītāji atspoguļo atšķirību starp izlasi un attiecīgajiem vispārējiem rādītājiem.

Vidējā izlases kļūda galvenokārt nosaka izlases lielums, un tas ir atkarīgs no pētāmās pazīmes struktūras un variācijas pakāpes.

Vidējās izlases kļūdas nozīme ir šāda. Aprēķinātās parauga daļas (w) un parauga vidējās vērtības () pēc savas būtības ir nejauši mainīgie. Viņiem var būt dažādas vērtības atkarībā no tā, kuras konkrētās vispārējās populācijas vienības ietilpst izlasē. Piemēram, ja, nosakot uzņēmuma darbinieku vidējo vecumu, vienā izlasē iekļauts vairāk jauniešu, bet citā – gados vecāku darbinieku, tad izlases līdzekļi un izlases kļūdas būs atšķirīgas. Vidējā izlases kļūda nosaka pēc formulas:

(27) vai - atkārtota paraugu ņemšana. (28)

kur: μ ir vidējā izlases kļūda;

σ ir pazīmes standarta novirze vispārējā populācijā;

n ir izlases lielums.

Kļūdas vērtība μ parāda, kā izlasē noteiktā objekta vidējā vērtība atšķiras no objekta patiesās vērtības vispārējā populācijā.

No formulas izriet, ka izlases kļūda ir tieši proporcionāla standartnovirzei un apgriezti proporcionāla parauga vienību skaita kvadrātsaknei. Tas nozīmē, piemēram, jo lielāka ir objekta vērtību izplatība vispārējā populācijā, tas ir, jo lielāka ir izkliede, jo lielākam jābūt izlases lielumam, ja mēs vēlamies uzticēties izlases aptaujas rezultātiem. . Un otrādi, ar nelielu novirzi var aprobežoties ar nelielu izlases populāciju skaitu. Tad izlases kļūda būs pieļaujamās robežās.

Tā kā neatkārtotas atlases laikā vispārējās populācijas N lielums izlases laikā samazinās, vidējās izlases kļūdas aprēķināšanas formulā ir iekļauts papildu faktors.

(viens-). Vidējās izlases kļūdas formula ir šāda:

Vidējā kļūda ir mazāka vienreizējai paraugu ņemšanai, kas padara to plašāk izmantotu.

Praktiskiem secinājumiem ir nepieciešams raksturot vispārējo populāciju, pamatojoties uz izlases rezultātiem. Izlases līdzekļi un proporcijas tiek piemērotas vispārējai populācijai, ņemot vērā to iespējamās kļūdas robežu un ar tādu varbūtības līmeni, kas to garantē. Ņemot vērā noteiktu varbūtības līmeni, tiek izvēlēta normalizētās novirzes vērtība un noteikta izlases robežkļūda.

Novērtējuma X ar X ticamība (uzticamības varbūtība) sauc par varbūtību γ , ar kuru nevienlīdzība

׀Х-Х*׀< δ, (30)

kur δ ir izlases robežkļūda, kas raksturo tā intervāla platumu, kurā tiek atrasta vispārējās populācijas pētāmā parametra vērtība ar varbūtību γ.

Uzticams nosauciet intervālu (X* - δ; X* + δ), kas aptver pētāmo parametru X (tas ir, parametra X vērtība atrodas šajā intervālā) ar noteiktu ticamību γ.

Parasti aplēses ticamība tiek noteikta iepriekš, un skaitlis, kas ir tuvu vienam, tiek pieņemts kā γ: 0,95; 0,99 vai 0,999.

Ierobežojošā kļūda δ ir saistīta ar vidējo kļūdu μ šādi: , (31)

kur: t ir ticamības koeficients atkarībā no varbūtības P, ar kuru var apgalvot, ka robežkļūda δ nepārsniegs t-kārtīgu vidējo kļūdu μ (to sauc arī par Stjudenta sadalījuma kritiskajiem punktiem vai kvantilēm).

Kā izriet no koeficienta, robežkļūda ir tieši proporcionāla vidējai izlases kļūdai un ticamības koeficientam, kas ir atkarīgs no dotā novērtējuma ticamības līmeņa.

No vidējās izlases kļūdas formulas un robežkļūdu un vidējo kļūdu attiecības iegūstam:

Ņemot vērā ticamības varbūtību, šai formulai būs šāda forma.

Kā zināms, statistikā ir divi masu parādību novērošanas veidi atkarībā no objekta pārklājuma pilnības: nepārtraukts un nepārtraukts. Nepārtrauktas novērošanas variācija ir selektīva novērošana.

Zem selektīvs novērojums tiek saprasts kā nepārtraukts novērojums, kurā pētāmās populācijas vienības, kas atlasītas nejauši, tiek pakļautas statistiskai pārbaudei (novērojumam).

Selektīvā novērošana izvirza uzdevumu raksturot visu pārbaudāmās daļas vienību kopu, ievērojot visus statistiskās novērošanas noteikumus un principus un zinātniski organizētu darbu pie vienību atlases.

Apsekojumam atlasīto vienību kopu statistikā parasti sauc izlases populācija , un tiek izsaukta vienību kopa, no kuras tiek veikta atlase vispārējā populācija . Vispārējās un izlases populācijas galvenie raksturlielumi ir parādīti 1. tabulā.

1. tabula - Galvenās vispārējās un izlases populācijas pazīmes

Rādītājs	Apzīmējums vai formula
Rādītājs	Populācija	Izlases populācija
Vienību skaits	N	n
Vienību skaits, kurām ir funkcija	M	m
Vienību īpatsvars ar šo funkciju	p = M/N	ω = m/n
To vienību īpatsvars, kurām nav šīs pazīmes	q = 1 - p	1 - w
*Vidējā vērtība* zīme
*Izkliede* zīme
Alternatīvas pazīmes izkliede (daļas izkliede)	pq	ω (1–ω)

Veicot selektīvu novērošanu, rodas sistemātiskas un nejaušas kļūdas. Sistemātiskas kļūdas rodas, pārkāpjot izlases vienību atlases noteikumus. Mainot atlases noteikumus, šādas kļūdas var novērst.

Nejaušas kļūdas rodas apsekojuma pārtraukuma dēļ. Citādi tās sauc par reprezentativitātes (reprezentativitātes) kļūdām. Nejaušas kļūdas iedala vidējās un marginālās izlases kļūdās, kuras nosaka gan aprēķinot pazīmi, gan aprēķinot daļu.

Vidējās un robežkļūdas ir saistītas ar šādu sakarību :Δ = tμ, kur Δ ir izlases robežkļūda, μ ir vidējā izlases kļūda, t ir ticamības koeficients, kas noteikts atkarībā no varbūtības līmeņa. 2. tabulā parādītas dažas t vērtības, kas ņemtas no varbūtības teorijas.

Vidējās izlases kļūdas vērtību aprēķina atšķirīgi atkarībā no atlases metodes un izlases procedūras. Galvenās izlases kļūdu aprēķināšanas formulas ir parādītas 3. tabulā.

3. tabula - Pamatformulas izlases kļūdu aprēķināšanai atkārtotas un neatkārtotas atlases gadījumā

Rādītājs	Apzīmējums un formula
Rādītājs	Populācija	Izlases populācija
Vidējā līdzekļa kļūda nejaušai atkārtotai izlasei
Vidējā koplietošanas kļūda nejaušai atkārtotai izlasei
Objekta kļūdas ierobežojums nejaušas atkārtotas atlases gadījumā
Robeždalības kļūda nejaušas atkārtotas atlases laikā
Objekta vidējā kļūda nejaušai neatkārtotai atlasei
Vidējā daļas kļūda nejaušā neatkārtotajā izlasē
Objekta kļūdas ierobežojums ar nejaušu, neatkārtotu atlasi
Robeždaļas kļūda nejaušai neatkārtotai atlasei

Vidējo un marginālo izlases kļūdu aprēķins ļauj noteikt iespējamās robežas, kurās būs vispārējās populācijas raksturlielumi. .

Piemēram, izlases vidējam rādītājam šādas robežas tiek noteiktas, pamatojoties uz šādām attiecībām:

Pazīmes īpatsvara robežas vispārējā populācijā lpp.

Problēmu risināšanas piemēri par tēmu "Izlases novērošana statistikā"

1. uzdevums . Ir informācija par produkcijas (darbu, pakalpojumu) izlaidi, kas iegūta, pamatojoties uz 10% reģiona uzņēmumu izlases novērošanu:

Noteikt: 1) izlasē iekļautajiem uzņēmumiem: a) vidējo izlaides apjomu uz vienu uzņēmumu; b) ražošanas apjoma izkliede; c) to uzņēmumu daļa, kuru ražošanas apjoms pārsniedz 400 tūkstošus rubļu; 2) reģionam kopumā ar varbūtību 0,954 robežas, kurās var sagaidīt: a) vidējo ražošanas apjomu uz vienu uzņēmumu; b) to uzņēmumu daļa, kuru ražošanas apjoms pārsniedz 400 tūkstošus rubļu; 3) kopējais produkcijas apjoms reģionā.

Risinājums

Lai atrisinātu problēmu, mēs paplašinām piedāvāto tabulu.

1) Izlasē iekļautajiem uzņēmumiem vidējais produkcijas apjoms uz vienu uzņēmumu

110800/400 = 277 tūkstoši rubļu

Ražošanas apjoma izkliedi aprēķinām vienkāršotā veidā σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Uzņēmumu skaits, kuru ražošanas apjoms pārsniedz 400 tūkstošus rubļu. vienāds ar 36+12 = 48, un to daļa ir vienāda ar ω = 48:400 = 0,12 = 12%.

2) No varbūtības teorijas zināms, ka ar varbūtību P=0,954 ticamības koeficients t=2. Margināla izlases kļūda

2√12371:400 = 11,12 tūkstoši rubļu

Nosakīsim vispārējā vidējā robežas: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤Xav ≤ 288,12

Uzņēmumu īpatsvara robežkļūda

2√0,12*0,88/400 = 0,03

Nosakīsim vispārējās daļas robežas: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ p≤0,15

3) Tā kā aplūkojamā uzņēmumu grupa ir 10% no kopējā uzņēmumu skaita reģionā, tad reģionā kopumā ir 4000 uzņēmumu. Tad kopējais produkcijas apjoms reģionā ir 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

2. uzdevums . Saskaņā ar nodokļu iestāžu veiktās kontroles audita rezultātiem 400 uzņēmējdarbības struktūrās 140 no tām nodokļu deklarācijās pilnībā nenorāda ar nodokli apliekamos ienākumus. Nosakiet kopējos populācijās (visam reģionam) to uzņēmējdarbības struktūru īpatsvaru, kuras slēpa daļu no saviem nodokļu ieņēmumiem ar varbūtību 0,954.

Risinājums

Atbilstoši uzdevuma nosacījumam vienību skaits izlases populācijā ir n=400, vienību skaits ar aplūkoto pazīmi m=140, varbūtība P=0,954.

No varbūtības teorijas zināms, ka ar varbūtību P=0,954 ticamības koeficients t=2.

To vienību īpatsvaru, kurām ir norādītais atribūts, nosaka pēc formulas: p=w+∆p, kur w = m/n=140/400=0,35=35%,
un pazīmes ∆p robežkļūdu iegūst no formulas: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Tad p = 35±5%.

Atbilde : Uzņēmējdarbības struktūru īpatsvars, kas slēpa daļu no saviem nodokļu ienākumiem ar varbūtību 0,954, ir 35±5%.

Selektīvās novērošanas jēdziens.

Selektīvs tiek saukts šāds novērojums, kurā visas vienību kopas raksturlielums ir dots atbilstoši dažām to daļām, kas atlasītas nejaušā secībā.

Selektīvas novērošanas izmantošanas iemesli:

1. Materiālu, darbaspēka, finanšu resursu un laika taupīšana.

2. Izvēlētais novērojums bieži noved pie datu precizitātes palielināšanās, jo novērojumu vienību skaita samazināšanās krasi samazina kļūdas zīmes vērtību reģistrēšanā (drukāšanas kļūdas, nepietiekama uzskaite, dubultā uzskaite ...).

3. Selektīvais novērojums ir vienīgais iespējamais, ja novērojumu pavada pilnīgs vai daļējs novērojamo objektu bojājums (olu partiju kvalitāte, audu stiprums u.c.).

To vienību daļu, kas tiek atlasīta novērošanai, parasti sauc izlases populācija vai vienkārši paraugu ņemšana, un viss vienību komplekts, no kura tiek veikta atlase - vispārējā populācija.

Ir pieņemta šāda rādītāju noteikšanas sistēma atlasītajai un vispārējai populācijai.

Atkarībā no atlases tehnikas pielietojuma paraugu iedala sērijveida (ligzdotajā) un tipoloģiskā.

· Kad tipoloģisks veicot izlasi, vispārējā populācija tiek sadalīta tipos (grupās, rajonos), un pēc tam tiek veikta nejauša vienību atlase no katra veida.

· Plkst seriāls izlasi izvēlas nevis pa vienībām, bet pa noteiktām sērijām, grupām, apgabaliem, kuru ietvaros tiek veikta nepārtraukta novērošana.

Ir divi veidi, kā atlasīt vienības paraugā:

- atkārtota atlase

katra izlases vienība tiek atgriezta vispārējā populācijā, un tai ir iespēja tikt atkārtoti atlasītai.

- neatkārtota atlase

atlasītā vienība netiek atgriezta populācijā, un pārējās vienības, visticamāk, tiks iekļautas izlasē. Neatkārtota paraugu ņemšana dod precīzākus rezultātus, bet dažreiz to nevar izdarīt (patērētāju pieprasījuma izpēte).

Izlases rezultātu kvalitāte ir atkarīga no tā, cik lielā mērā izlases sastāvs pārstāv vispārējo populāciju, citiem vārdiem sakot, no tā, cik lielā mērā izlase pārstāvis(pārstāvis). Lai nodrošinātu izlases reprezentativitāti, ir jāievēro vienību nejaušās atlases princips.

Izlases kļūda

Izlases kļūdu jēdziens un veidi

Tā kā pētāmā statistiskā populācija sastāv no vienībām ar dažādām pazīmēm, izlases kopas sastāvs var zināmā mērā atšķirties no vispārējās populācijas sastāva.

Izlases un vispārējās populācijas raksturlielumu neatbilstība ir izlases kļūda.

Izlases kļūdu veidi

Izlases metodes galvenais uzdevums ir izpētīt izlases reprezentativitātes kļūdas.

Vidējā izlases kļūda

Nejaušā reprezentativitātes kļūda ir atkarīga no šādiem faktiem (tiek pieņemts, ka reģistrācijas kļūdu nav):

1. Jo lielāks izlases lielums, ceteris paribus, jo mazāka ir izlases kļūda, t.i. izlases kļūda ir apgriezti proporcionāla tās lielumam.

2. Jo mazāka ir atribūta variācija, jo mazāka ir izlases kļūda. Ja zīme nemaz nemainās un līdz ar to dispersija ir nulle, tad izlases kļūdas nebūs, jo jebkura populācijas vienība uz šī pamata precīzi raksturos visu populāciju. Tādējādi izlases kļūda ir tieši proporcionāla dispersijas lielumam.

Matemātiskajā statistikā ir pierādīts, ka nejaušas atkārtotas izlases vidējās kļūdas vērtību var noteikt pēc formulas

Tomēr jāpatur prātā, ka izkliedes lielums vispārējā populācijā s2 mēs nezinām, jo selektīvs novērojums. Mēs varam aprēķināt tikai izlases populācijas dispersiju S2. Attiecību starp vispārējās un izlases populācijas dispersiju izsaka ar formulu:

(6.2)

Ja n liels, tāpēc

s2 = S2

Un vidējās atkārtotās izlases kļūdas (6.1.) formula būs šāda:

Bet šeit mēs esam ņēmuši vērā tikai interesējošās pazīmes vidējās vērtības izlases kļūdu. Ir arī rādītājs par vienību īpatsvaru ar interesējošo pazīmi. Šī rādītāja kļūdas aprēķinam ir savas īpašības.

Raksturīgās daļas rādītāja dispersiju nosaka pēc formulas:

S 2 \u003d w (1-w) (6.4)

Tad vidējā izlases kļūda objekta daļas mērīšanai būs vienāda ar:

(6.5)

Formulu (6.3) un (6.5) pierādīšana sākas no atkārtotas izlases shēmas. Parasti izlase tiek organizēta neatkārtojoties. Jo ar neatkārtotu atlasi, kopējās populācijas lielums N ir saīsināts izlases kodā, tad izlases kļūdu formulās tiek iekļauts papildu faktors , un formulas ir šādā formā:

(6.6)

(6.7)

Piemērs 1. Noteiksim, cik ļoti atšķiras izlases un vispārīgie rādītāji pēc 10% neatkārtotas skolēnu sekmju izlases datiem.

Neatkārtotas izlases kļūdas aprēķins vidējam:

n= 100 N= 1000

Atrodiet izlases dispersiju, izmantojot formulu:

Šeit vērtība nav zināma, un to var atrast kā parastu vidējo svērto vērtību:

Pa šo ceļu,

Tie. varam teikt, ka visu studentu vidējais vērtējums () ir 3,65 ± 0,07

Tagad aprēķināsim to studentu īpatsvaru kopējā populācijā, kuri mācās uz "4" un "5".

Balstoties uz izlasi, atradīsim to skolēnu īpatsvaru, kuri saņēmuši atzīmes “4” un “5”.

(jeb 64%)

Neatkārtotas izlases kļūdas aprēķins daļai tiek veikts pēc formulas:

(jeb 4,5%)

Tādējādi "4" un "5" studentu īpatsvars kopējā populācijā ( P) ir 0,64±0,045 (jeb 64%±4,5%).

Margināla izlases kļūda

To, ka vispārējais vidējais un vispārējā daļa nepārsniegs noteiktas robežas, var apgalvot nevis pilnīgi droši, bet tikai ar zināmu varbūtības pakāpi.

Matemātiskajā statistikā ir pierādīts, ka vispārīgie raksturlielumi atšķiras no izlases raksturlielumiem par izlases kļūdas lielumu (± m), tikai ar varbūtību 0,683. Attiecībā uz izlases pētījumiem ar to saprot, ka robežvērtības var garantēt tikai 683 gadījumos no 1000. Pārējos 317 gadījumos šo robežvērtību vērtības būs atšķirīgas.

Sprieduma varbūtību var palielināt, paplašinot novirzes robežas, par mēru ņemot vidējo izlases kļūdu, kas palielināta par t vienreiz.

Tie. ar noteiktu varbūtības pakāpi varam apgalvot, ka izlases raksturlielumu novirzes no vispārīgajiem nepārsniegs noteiktu vērtību, ko sauc par izlases robežkļūdu D (delta):

kur t– ticamības koeficients (kļūdu daudzkārtības koeficients), kas noteikts atkarībā no ticamības līmeņa, ar kādu nepieciešams garantēt izlases pētījuma rezultātus.

Praksē tiek izmantotas tabulas, kurās aprēķina varbūtības dažādām vērtībām t. Apskatīsim dažus no tiem.

t	Varbūtība	t	Varbūtība
0,5	0,383	2,0	0,954
1,0	0,683	2,5	0,988
1,5	0,866	3,0	0,997

Piemēram, ja mūsu piemērā mēs vēlamies palielināt sprieduma varbūtību līdz 0,954, tad ņemam t= 2 un tādējādi mainīt visu studentu vidējā rezultāta noviržu robežas un "4" un "5" uzņemto skolēnu īpatsvaru.

Tas ir, (6.9)

Tas ir, (6.10)

Selektīvas novērošanas laikā tas ir jānodrošina nelaimes gadījums vienības izvēle. Katrai vienībai ir jābūt vienādām iespējām tikt izvēlētai ar pārējām. Uz to balstās nejauša izlase.

Uz pareiza izlases veida izlase attiecas uz vienību atlasi no visas vispārējās populācijas (bez iepriekšējas sadalīšanas kādās grupās) ar izlozes palīdzību (galvenokārt) vai kādu citu līdzīgu metodi, piemēram, izmantojot nejaušo skaitļu tabulu. Nejauša atlaseŠī atlase nav nejauša. Nejaušības princips liecina, ka objekta iekļaušanu vai izslēgšanu no izlases nevar ietekmēt neviens cits faktors, izņemot nejaušību. Piemērs patiesībā nejauši atlase var kalpot kā laimestu aprites: no kopējā izsniegto biļešu skaita nejauši tiek atlasīta noteikta daļa no skaitļiem, kas veido laimestus. Turklāt visiem numuriem tiek nodrošināta vienlīdzīga iespēja iekļūt izlasē. Šajā gadījumā izlases komplektā atlasīto vienību skaitu parasti nosaka, pamatojoties uz pieņemto parauga proporciju.

Parauga koplietošana ir izlases kopas vienību skaita attiecība pret vispārējās populācijas vienību skaitu:

Tātad, ar 5% paraugu no detaļu partijas 1000 vienībās. parauga lielums P ir 50 vienības, un ar 10% paraugu - 100 vienības. utt. Pareizi zinātniski organizējot paraugu ņemšanu, reprezentativitātes kļūdas var samazināt līdz minimālām vērtībām, kā rezultātā selektīvais novērojums kļūst pietiekami precīzs.

Pareiza izlases veida atlase "tīrā veidā" selektīvās novērošanas praksē tiek izmantota reti, taču tā ir sākumpunkts starp visiem citiem atlases veidiem, tā satur un īsteno selektīvās novērošanas pamatprincipus.

Apskatīsim dažus izlases metodes teorijas jautājumus un kļūdas formulu vienkāršai izlases veidam.

Piemērojot statistikā izlases metodi, parasti tiek izmantoti divi galvenie vispārinošo rādītāju veidi: kvantitatīvās pazīmes vidējā vērtība un alternatīvās pazīmes relatīvā vērtība(vienību īpatsvars vai īpatsvars statistiskajā populācijā, kas atšķiras no visām pārējām šīs populācijas vienībām tikai ar pētāmās pazīmes esamību).

Parauga koplietošana (w), vai biežumu nosaka pēc to vienību skaita attiecības, kurām ir pētāmais raksturlielums t, uz kopējo paraugu ņemšanas vienību skaitu P:

Piemēram, ja no 100 parauga detaļām ( n=100), 95 daļas izrādījās standarta (t=95), tad parauga daļa

w=95/100=0,95 .

Lai raksturotu izlases rādītāju ticamību, ir vidū un margināla izlases kļūda.

Izlases kļūda ? vai, citiem vārdiem sakot, reprezentativitātes kļūda ir atšķirība starp atbilstošo paraugu un vispārīgajiem raksturlielumiem:

Izlases kļūda ir raksturīga tikai selektīviem novērojumiem. Jo lielāka ir šīs kļūdas vērtība, jo vairāk izlases rādītāji atšķiras no atbilstošajiem vispārīgajiem rādītājiem.

Izlases vidējais rādītājs un izlases daļa ir raksturīgi nejaušie mainīgie, kas var iegūt dažādas vērtības atkarībā no tā, kuras populācijas vienības tika iekļautas izlasē. Tāpēc izlases kļūdas ir arī nejauši mainīgie un var iegūt dažādas vērtības. Tāpēc nosakiet iespējamo kļūdu vidējo lielumu - vidējo izlases kļūdu.

No kā tas ir atkarīgs nozīmē izlases kļūdu? Ievērojot nejaušās atlases principu, pirmām kārtām nosaka vidējo izlases kļūdu parauga lielums: jo lielāka populācija, ceteris paribus, jo mazāka ir vidējā izlases kļūda. Aptverot izlases aptauju ar pieaugošu kopējās populācijas vienību skaitu, mēs arvien precīzāk raksturojam visu populāciju.

Vidējā izlases kļūda ir atkarīga arī no variācijas pakāpe pētīta īpašība. Variācijas pakāpi, kā jūs zināt, raksturo izkliede? 2 vai w(1-w)-- alternatīvai funkcijai. Jo mazāka ir objekta variācija un līdz ar to arī dispersija, jo mazāka ir vidējā izlases kļūda un otrādi. Ar nulles izkliedi (atribūts nemainās) vidējā izlases kļūda ir nulle, t.i., jebkura vispārējās populācijas vienība precīzi raksturos visu populāciju atbilstoši šim atribūtam.

Vidējās izlases kļūdas atkarība no tās apjoma un atribūta variācijas pakāpes ir atspoguļota formulās, ar kurām var aprēķināt vidējo izlases kļūdu izlases novērošanas apstākļos, kad vispārīgie raksturlielumi ( x, p) nav zināmi, un tāpēc nav iespējams atrast īsto izlases kļūdu tieši no formulām (1. forma), (2. forma).

W Ar nejaušu atlasi vidējās kļūdas teorētiski aprēķina pēc šādām formulām:

* par vidējo kvantitatīvo pazīmi

* akcijai (alternatīva īpašība)

Tā kā praktiski atribūta dispersija vispārējā populācijā? 2 nav precīzi zināms, praksē viņi izmanto dispersijas S 2 vērtību, kas aprēķināta izlases kopai, pamatojoties uz lielo skaitļu likumu, saskaņā ar kuru izlases kopa ar pietiekami lielu izlases lielumu precīzi reproducē izlases raksturlielumus. vispārējā populācija.

Pa šo ceļu, aprēķinu formulas vidū izlases kļūdas izlases veida atkārtota atlase būs šāda:

* par vidējo kvantitatīvo pazīmi

* akcijai (alternatīva īpašība)

Tomēr izlases kopas dispersija nav vienāda ar vispārējās kopas dispersiju, un tāpēc vidējās izlases kļūdas, kas aprēķinātas pēc formulām (5. veidlapa) un (6. veidlapa), būs aptuvenas. Bet varbūtības teorijā ir pierādīts, ka vispārējā dispersija caur izvēles priekšmetu tiek izteikta ar šādu sakarību:

Jo P/(n-1) pietiekami lielam P -- vērtība tuvu vienībai, var pieņemt, ka un tāpēc vidējo izlases kļūdu praktiskos aprēķinos var izmantot formulas (5. veidlapa) un (6. veidlapa). Un tikai nelielas izlases gadījumos (kad izlases lielums nepārsniedz 30) ir jāņem vērā koeficients P/(n-1) un aprēķināt neliela izlases vidējā kļūda pēc formulas:

W X Ar nejaušu, neatkārtotu atlasi iepriekš minētajās vidējās izlases kļūdu aprēķināšanas formulās saknes izteiksme ir jāreizina ar 1-(n / N), jo vienību skaits vispārējā populācijā tiek samazināts neatkārtotas izlases procesā. Tāpēc neatkārtotai atlasei aprēķinu formulas nozīmē izlases kļūdu būs šādā formā:

* par vidējo kvantitatīvo pazīmi

* akcijai (alternatīva īpašība)

. (veidlapa 10)

Jo P vienmēr mazāk N, tad papildu koeficients 1-( n/n) vienmēr būs mazāks par vienu. No tā izriet, ka vidējā kļūda ar neatkārtotu atlasi vienmēr būs mazāka nekā ar atkārtotu atlasi. Tajā pašā laikā ar salīdzinoši nelielu procentuālo daļu šis koeficients ir tuvu vienam (piemēram, ar 5% izlasi ir 0,95; ar 2% izlasi ir 0,98 utt.). Tāpēc dažkārt praksē tiek izmantotas formulas (5. veidlapa) un (6. veidlapa), lai noteiktu vidējo izlases kļūdu bez norādītā reizinātāja, lai gan izlase tiek organizēta kā neatkārtota. Tas notiek, ja vispārējās populācijas N vienību skaits nav zināms vai neierobežots, vai kad Pļoti maz, salīdzinot ar N, un būtībā papildu faktora, kura vērtība ir tuvu vienai, ieviešana praktiski neietekmēs vidējās izlases kļūdas vērtību.

Mehāniskā paraugu ņemšana sastāv no tā, ka vienību atlase izlasē no vispārējās, kas sadalīta pēc neitrāla kritērija vienādos intervālos (grupās), tiek veikta tā, ka no katras šādas izlases grupas tiek atlasīta tikai viena vienība. Lai izvairītos no sistemātiskām kļūdām, jāizvēlas tā vienība, kas atrodas katras grupas vidū.

Organizējot mehānisko atlasi, populācijas vienības tiek iepriekš sakārtotas (parasti sarakstā) noteiktā secībā (piemēram, alfabēta secībā, pēc atrašanās vietas, augošā vai dilstošā jebkura rādītāja vērtību secībā, kas nav saistīta ar pētāmo īpašumu utt.) utt.), pēc tam mehāniski, ar noteiktu intervālu, tiek izvēlēts noteikts vienību skaits. Šajā gadījumā intervāla lielums vispārējā populācijā ir vienāds ar izlases daļas apgriezto vērtību. Tātad, izmantojot 2% paraugu, tiek atlasīta un pārbaudīta katra 50. vienība (1: 0,02), ar 5 % paraugu — katra 20. vienība (1: 0,05), piemēram, lejupejošā detaļa no iekārtas.

Ar pietiekami lielu populāciju mehāniskā atlase rezultātu precizitātes ziņā ir tuvu pareizai nejaušībai. Tāpēc, lai noteiktu mehāniskā parauga vidējo kļūdu, tiek izmantotas pašaizlases neatkārtotas izlases formulas (9. veidlapa), (10. veidlapa).

Lai atlasītu vienības no neviendabīgas populācijas, t.s tipisks paraugs , ko izmanto gadījumos, kad visas vispārējās populācijas vienības var iedalīt vairākās kvalitatīvi viendabīgās, līdzīgās grupās pēc pazīmēm, kas ietekmē pētītos rādītājus.

Apsekojot uzņēmumus, šādas grupas var būt, piemēram, nozare un apakšnozare, īpašuma formas. Pēc tam no katras tipiskās grupas izlases vai mehāniskas izlases veidā veic individuālu vienību atlasi paraugā.

Sarežģītu statistisko kopu izpētē parasti izmanto tipisku paraugu. Piemēram, izlases apsekojumā par strādnieku ģimeņu budžetu un darbinieku atsevišķās tautsaimniecības nozarēs darbinieku darba ražīgumu uzņēmumā, kas pārstāvēts ar atsevišķām prasmju grupām.

Tipisks paraugs sniedz precīzākus rezultātus salīdzinājumā ar citām vienību atlases metodēm paraugu komplektā. Vispārējās kopas tipizēšana nodrošina šādas izlases reprezentativitāti, katras tipoloģiskās grupas reprezentāciju tajā, kas ļauj izslēgt starpgrupu dispersijas ietekmi uz vidējo izlases kļūdu.

Nosakot tipiska izlases vidējā kļūda kā variācijas indikators ir grupas iekšējo dispersiju vidējā vērtība.

Vidējā izlases kļūda tiek atrasti pēc formulām:

* par vidējo kvantitatīvo pazīmi

(atkārtota atlase); (veidlapa 11)

(neatgriezeniska atlase); (veidlapa 12)

* akcijai (alternatīva īpašība)

(atkārtota atlase); (form.13)

(neatkārtota atlase), (14. veidlapa)

kur ir izlases kopas grupas iekšējo dispersiju vidējā vērtība;

Izlases populācijas īpatsvara (alternatīvās pazīmes) grupas iekšējo dispersiju vidējā vērtība.

sērijveida paraugu ņemšana ietver nejaušu atlasi no vispārējās populācijas nevis atsevišķas vienības, bet gan to vienādas grupas (ligzdas, sērijas), lai šādās grupās novērotu visas vienības bez izņēmuma.

Sērijveida paraugu ņemšanas izmantošana ir saistīta ar to, ka daudzas preces to transportēšanai, uzglabāšanai un pārdošanai tiek iepakotas iepakojumos, kastēs utt. Līdz ar to, kontrolējot iepakoto preču kvalitāti, racionālāk ir pārbaudīt vairākas pakas (sērijas), nevis atlasīt vajadzīgo preču daudzumu no visiem iepakojumiem.

Tā kā grupu (sērijas) ietvaros tiek pārbaudītas visas vienības bez izņēmuma, vidējā izlases kļūda (izvēloties vienādas sērijas) ir atkarīga tikai no starpgrupu (starprindu) dispersijas.

W Vidējā izlases kļūda vidējam rezultātam sērijas atlases laikā tos atrod pēc formulām:

(atkārtota atlase); (form.15)

(neatkārtota atlase), (16. veidlapa)

kur r- izvēlēto sēriju skaits; R- kopējais epizožu skaits.

Sērijas izlases starpgrupu dispersiju aprēķina šādi:

kur ir vidējais rādītājs i- sērija; - vispārējais vidējais rādītājs visai izlases kopai.

W Vidējā koplietošanas izlases kļūda (alternatīva funkcija) sērijas atlasē:

(atkārtota atlase); (veidlapa 17)

(neatkārtota atlase). (veidlapa 18)

Starpgrupa(starp sēriju) sērijas izlases daļas dispersija nosaka pēc formulas:

, (19. veidlapa)

kur ir objekta daļa i sērija; - kopējās pazīmes īpatsvars visā paraugā.

Statistisko aptauju praksē papildus iepriekš aplūkotajām atlases metodēm tiek izmantota to kombinācija (kombinētā atlase).

Selektīvās novērošanas jēdziens.

Ar statistisko novērošanas metodi ir iespējams izmantot divas novērošanas metodes: nepārtrauktu, aptverot visas populācijas vienības, un selektīvo (nepārtraukto).

Izlases metode tiek saprasta kā pētījuma metode, kas saistīta ar vispārīgu populācijas rādītāju noteikšanu dažām tās daļām, pamatojoties uz nejaušās atlases metodi.

Ar selektīvu novērošanu pārbaudei tiek pakļauta salīdzinoši neliela daļa no visas populācijas (5-10%).

Pārbaudāmo kopumu sauc vispārējā populācija.

No vispārējās populācijas atlasīto vienību daļu, uz kuru attiecas apsekojums, sauc izlases populācija vai paraugs.

Rādītāji, kas raksturo vispārējo un izlases kopu:

1) alternatīvas pazīmes daļa;

AT populācija to vienību īpatsvaru, kurām ir kāda alternatīva pazīme, apzīmē ar burtu "P".

AT paraugu ņemšanas rāmis to vienību īpatsvaru, kurām ir kāds alternatīvs atribūts, apzīmē ar burtu "w".

2) objekta vidējais izmērs;

AT populācija objekta vidējo lielumu apzīmē ar burtu (vispārējais vidējais).

AT paraugu ņemšanas rāmis objekta vidējo lielumu apzīmē ar burtu (izlases vidusmēra).

Izlases kļūdas definīcija.

Selektīvā novērošana ir balstīta uz principu par vienādu iespēju iekļaut izlasē vispārējās populācijas vienības. Tas ļauj izvairīties no sistemātiskām novērojumu kļūdām. Tomēr, ņemot vērā to, ka pētāmā populācija sastāv no vienībām ar atšķirīgām īpašībām, izlases sastāvs var atšķirties no vispārējās populācijas sastāva, radot neatbilstības starp vispārīgajiem un izlases raksturlielumiem.

Šādas neatbilstības sauc par reprezentativitātes kļūdām vai izlases kļūdām.

Paraugu ņemšanas kļūdas noteikšana ir galvenais uzdevums, kas jāatrisina selektīvās novērošanas laikā.

Matemātiskajā statistikā ir pierādīts, ka vidējo izlases kļūdu nosaka pēc formulas:

kur m ir izlases kļūda;

s 2 0 ir vispārējās populācijas dispersija;

n ir parauga vienību skaits.

Praksē izlases populācijas dispersiju s 2 izmanto, lai noteiktu vidējo izlases kļūdu.

Pastāv vienlīdzība starp vispārējām un izlases atšķirībām:

(2).

No formulas (2) var redzēt, ka vispārējā dispersija ir lielāka par izlases dispersiju par vērtību (). Tomēr pietiekami lielam izlases lielumam šī attiecība ir tuvu vienotībai, tāpēc mēs to varam rakstīt

Tomēr šī formula vidējās izlases kļūdas noteikšanai ir piemērojama tikai atkārtotai paraugu ņemšanai.

Praksē to parasti izmanto neatkārtota atlase un vidējā izlases kļūda tiek aprēķināta nedaudz savādāk, jo pētījuma gaitā izlases lielums samazinās:

(4)

kur n ir izlases lielums;

N ir kopējās populācijas lielums;

s 2 — izlases dispersija.

Alternatīvas pazīmes proporcijai vidējā izlases kļūda pie bez atkārtotas atlases nosaka pēc formulas:

(5), kur

w (1-w) - alternatīvās pazīmes izlases daļas vidējā kļūda;

w ir izlases kopas alternatīvās pazīmes daļa.

Plkst atkārtota atlase alternatīvā atribūta daļas vidējo kļūdu nosaka pēc vienkāršotas formulas:

(6)

Ja izlases lielums nepārsniedz 5%, izlases daļas vidējo kļūdu un izlases vidējo lielumu nosaka ar vienkāršotām (3) un (6) formulām.

Izlases vidējās un izlases daļas vidējās kļūdas noteikšana ir nepieciešama, lai noteiktu iespējamās vispārējās vidējās (x) un vispārējās daļas (P) vērtības, pamatojoties uz izlases vidējo (x) un izlases daļu (w).

Vienu no iespējamām vērtībām, kurās atrodas vispārējais vidējais rādītājs, nosaka pēc formulas:

Vispārējai akcijai šo intervālu var uzrakstīt kā :

(8)

Šādā veidā iegūtās daļas un vidējā rādītāja raksturojums vispārējā populācijā atšķiras no izlases daļas vērtības un izlases vidējā par vērtību m. Tomēr to nevar garantēt ar pilnīgu pārliecību, bet tikai ar noteiktu varbūtības pakāpi.

Matemātiskajā statistikā ir pierādīts, ka vispārējā un izlases vidējā raksturlielumu vērtību robežas atšķiras par m tikai ar varbūtību 0,683. Līdz ar to tikai 683 gadījumos no 1000 vispārējais vidējais ir robežās x= x m x, citos gadījumos tas pārsniegs šīs robežas.

Spriedumu iespējamību var palielināt, paplašinot noviržu robežas, par mēru ņemot vidējo izlases kļūdu, kas palielināta par t reizēm.

Faktoru t sauc par ticamības koeficientu. To nosaka atkarībā no ticamības līmeņa, ar kādu ir nepieciešams garantēt pētījuma rezultātus.

Matemātiķis A.M. Ļapuševs aprēķināja dažādas t vērtības, kuras parasti ir norādītas gatavās tabulās.