Az átlagérték képletének maximális hibája. Átlagos és maximális mintavételi hibák

A mintamutatók megbízhatóságának jellemzésére különbséget teszünk az átlagos és a maximális mintavételi hibák között, amelyek csak a minta megfigyelésekre jellemzőek. Ezek a mutatók a minta és a megfelelő általános mutatók közötti különbséget tükrözik.

Átlagos mintavételi hiba elsősorban a minta mérete határozza meg, és a vizsgált tulajdonság szerkezetétől és variációs fokától függ.

Az átlagos mintavételi hiba jelentése a következő. A mintaarány (w) és a mintaátlag () számított értékei véletlenszerű változók. Különböző értékeket vehetnek fel attól függően, hogy melyik populációs egység szerepel a mintában. Például, ha egy vállalkozás munkavállalóinak átlagéletkorának meghatározásakor az egyik mintában több fiatal, a másikban pedig az idősebb munkavállaló szerepel, akkor a minta átlaga és a mintavételi hibák eltérőek lesznek. Átlagos mintavételi hiba képlet határozza meg:

(27) vagy - újramintavételezés. (28)

ahol: μ – átlagos mintavételi hiba;

σ – a jellemző szórása az általános sokaságban;

n – mintanagyság.

A μ hiba nagysága megmutatja, hogy a mintában megállapított attribútum átlagos értéke mennyiben tér el az attribútum valódi értékétől az általános sokaságban.

A képletből az következik, hogy a mintavételi hiba egyenesen arányos a szórással és fordítottan arányos a mintában szereplő egységek számának négyzetgyökével. Ez például azt jelenti, hogy minél nagyobb az attribútumértékek szórása a sokaságban, vagyis minél nagyobb a szóródás, annál nagyobbnak kell lennie a mintának, ha megbízunk a mintavételes felmérés eredményeiben. És fordítva, alacsony szórás mellett a mintapopuláció egy kis részére korlátozhatja magát. A mintavételi hiba elfogadható határokon belül van.

Mivel nem ismétlődő mintavételnél az N populáció mérete csökken a mintavétel során, az átlagos mintavételi hiba kiszámítására szolgáló képletben egy további tényező is szerepel.

(1- ). Az átlagos mintavételi hiba képlete a következő:

Nem ismétlődő mintavétel esetén az átlagos hiba kisebb, ami meghatározza a szélesebb körű használatát.

A gyakorlati következtetésekhez a sokaság mintaeredmények alapján történő jellemzése szükséges. A mintaátlagokat és részesedéseket a lehetséges hibájuk határának figyelembe vételével, az azt garantáló valószínűségi szinttel osztjuk szét a teljes sokaság között. Egy adott valószínűségi szint megadása után kiválasztjuk a normalizált eltérés értékét és meghatározzuk a maximális mintavételi hibát.

X értékelésének megbízhatósága (megbízhatósági valószínűsége) X* alapján valószínűségnek nevezzük γ , amellyel az egyenlőtlenség megvalósul


׀Х-Х*׀< δ, (30)

ahol δ a maximális mintavételi hiba, amely annak az intervallumnak a szélességét jellemzi, amelyben γ valószínűséggel a vizsgált populációs paraméter értéke található.

Megbízható intervallumnak nevezzük (X* - δ; X* + δ), amely adott γ megbízhatósággal fedi le a vizsgált X paramétert (vagyis az X paraméter értéke ezen az intervallumon belül van).

Általában a becslés megbízhatóságát előre megadják, és egy közeli számot vesznek fel γ-nak: 0,95; 0,99 vagy 0,999.

A δ maximális hiba a μ átlagos hibához kapcsolódik a következő összefüggéssel: , (31)

ahol: t a P valószínűségtől függő konfidencia együttható, amellyel kijelenthető, hogy a δ határhiba nem haladja meg a μ átlagos hiba t-szeresét (ezt a Student-eloszlás kritikus pontjainak vagy kvantiliseinek is nevezik).

A relációból következik, hogy a határhiba egyenesen arányos az átlagos mintavételi hibával és a konfidencia együtthatóval, amely a becslés adott megbízhatósági szintjétől függ.

Az átlagos mintavételi hiba képletéből, valamint a határ- és átlaghiba arányából kapjuk:

A megbízhatósági valószínűséget figyelembe véve ez a képlet a következőképpen alakul:

Mint ismeretes, a statisztikában a tömegjelenségek megfigyelésének két módja van az objektum lefedettségének teljességétől függően: folyamatos és nem folyamatos. A nem folyamatos megfigyelés egy fajtája a szelektív megfigyelés.

Alatt szelektív megfigyelés nem folyamatos megfigyelésre utal, melynek során a vizsgált sokaság véletlenszerűen kiválasztott egységeit statisztikai vizsgálatnak (megfigyelésnek) vetik alá.

A mintamegfigyelés azt a feladatot tűzi ki maga elé, hogy a vizsgált részre vonatkozóan jellemezze az egységek teljes sokaságát, a statisztikai megfigyelés és az egységek kiválasztásával kapcsolatos tudományosan szervezett munka összes szabályának és elvének betartása mellett.

A statisztikákban felmérésre kiválasztott mértékegységek halmazát általában ún mintapopuláció , és az egységek halmaza, amelyből kiválasztásra kerül, meghívásra kerül Általános népesség . Az általános és a minta sokaság főbb jellemzőit az 1. táblázat mutatja be.

Asztal 1 - Az általános és minta sokaság főbb jellemzői
IndexMegnevezés vagy képlet
Népesség Mintapopuláció
Egységek száma N n
A bármely jellemzővel rendelkező egységek száma M m
Az ezzel a tulajdonsággal rendelkező egységek aránya p = M/N ω = m/n
Azon egységek aránya, amelyek nem rendelkeznek ezzel a tulajdonsággal q = 1 - p 1 - ω
Átlagos érték jel
Diszperzió jel
Egy alternatív jellemző varianciája (részesedés szórása) pq ω (1 - ω)

A mintavételes megfigyelések során szisztematikus és véletlenszerű hibák fordulnak elő. A szisztematikus hibák a mintában szereplő egységek kiválasztására vonatkozó szabályok megsértése miatt merülnek fel. A kiválasztási szabályok megváltoztatásával megszabadulhat az ilyen hibáktól.

Véletlenszerű hibák a felmérés hiányos jellegéből adódnak. Egyébként reprezentativitási hibának (reprezentativitás) nevezzük. A véletlenszerű hibákat átlagos és maximális mintavételi hibákra osztják, amelyeket mind a jellemző, mind a részesedés kiszámításakor határoznak meg.

Az átlagos és maximális hibákat a következő összefüggés kapcsolja össze :Δ = tμ, ahol Δ a maximális mintavételi hiba, μ az átlagos mintavételi hiba, t a konfidencia együttható, a valószínűségi szinttől függően. A 2. táblázat a valószínűségszámításból vett néhány t értéket mutat be.

Az átlagos mintavételi hiba a kiválasztási módszertől és a mintavételi eljárástól függően eltérően kerül kiszámításra. A mintavételi hibák kiszámításának alapképleteit a 3. táblázat tartalmazza.

3. táblázat - Alapvető képletek a mintavételi hibák kiszámításához ismételt és nem ismétlődő mintavétel során
IndexMegnevezés és képlet
Népesség Mintapopuláció
Egy tulajdonság átlagos hibája véletlenszerű ismételt kiválasztással
Átlagos arányhiba véletlenszerű újramintavételezéssel
Egy tulajdonság határhibája véletlenszerű ismételt kiválasztás során
Az arány határhibája véletlenszerű újramintavétel esetén
Egy tulajdonság átlagos hibája véletlenszerű, nem ismétlődő kiválasztás során
Átlagos tört hiba véletlenszerű, nem ismétlődő mintavételnél
Egy tulajdonság maximális hibája véletlenszerű, nem ismétlődő kiválasztásnál
A tört határhibája véletlenszerű, nem ismétlődő kiválasztás esetén

Az átlagos és maximális mintavételi hibák kiszámítása lehetővé teszi számunkra, hogy meghatározzuk azokat a lehetséges határokat, amelyeken belül az általános sokaság jellemzői lesznek .

Például egy mintaátlaghoz az ilyen korlátok a következő összefüggések alapján vannak beállítva:

A jellemző részesedésének határai a folyó általános populációjában.

Példák a „Mintamegfigyelés a statisztikában” témában problémamegoldásra

1. probléma . A régió vállalkozásainak 10%-os mintavételezése alapján nyert információk a termékek (építési beruházások, szolgáltatások) kibocsátásáról:

Határozza meg: 1) a mintában szereplő vállalkozások esetében: a) az előállított termékek átlagos nagyságát vállalkozásonként; b) a termelési mennyiség szórása; c) a 400 ezer rubelnél nagyobb termelési volumenű vállalkozások részesedése; 2) a régió egészében 0,954 valószínűséggel azon határok, amelyeken belül várható: a) az egy vállalkozásra jutó átlagos termelési volumen; b) a 400 ezer rubelnél nagyobb termelési volumenű vállalkozások részesedése; 3) a termelés teljes mennyisége a régióban.

Megoldás

A probléma megoldásához bontsa ki a javasolt táblázatot.

1) A mintában szereplő vállalkozások esetében a termelés átlagos nagysága vállalkozásonként

110800/400 = 277 ezer rubel.

A termelési mennyiség szórását leegyszerűsítve számítjuk ki: σ 2 = 35640000/400 – 277 2 = 89100 – 76229 = 12371.

Azon vállalkozások száma, amelyek termelési volumene meghaladja a 400 ezer rubelt. egyenlő 36+12 = 48, részarányuk pedig ω = 48:400 = 0,12 = 12%.

2) Valószínűségelméletből ismert, hogy P = 0,954 valószínűség mellett a konfidencia együttható t = 2. Marginális mintavételi hiba

2√12371:400 = 11,12 ezer rubel.

Állítsuk be az általános átlag határait: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12

A vállalkozások részesedésének határmintavételi hibája

2√0,12*0,88/400 = 0,03

Határozzuk meg az általános részesedés határait: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ р ≤0,15

3) Mivel a vizsgált vállalkozáscsoport a régió összes vállalkozásának 10%-át teszi ki, így összesen 4000 vállalkozás van a régióban. Ekkor a régió teljes termelési volumene a 265,88×4000≤Q≤288,12×4000 tartományba esik; 1063520 ≤ Q ≤ 1152480

2. probléma . 400 gazdálkodó szervezet adószolgálata által végzett ellenőrző ellenőrzés eredménye szerint 140 vállalkozás nem tüntette fel teljes körűen az adóköteles jövedelmet bevallásában. Határozza meg a teljes népességben (a teljes körzetben) azon üzleti struktúrák arányát, amelyek bevételük egy részét adók alól rejtették el 0,954 valószínűséggel!

Megoldás

A feladat feltételei szerint a mintapopuláció egységeinek száma n = 400, a vizsgált jellemzővel rendelkező egységek száma m = 140, valószínűsége P = 0,954.

A valószínűségszámításból ismert, hogy P = 0,954 valószínűség mellett a konfidencia együttható t = 2.

A megadott jellemzővel rendelkező egységek arányát a következő képlet határozza meg: p=w+∆p, ahol w = m/n=140/400=0,35=35%,
és a ∆p előjel maximális hibája a következő képletből adódik: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Ekkor p = 35±5%.

Válasz : 35±5% azoknak az üzleti struktúráknak az aránya, amelyek 0,954-es valószínűséggel rejtették el bevételük egy részét adókból.

A szelektív megfigyelés fogalma.

Szelektív egy olyan megfigyelés, amelyben az egységek teljes sokaságának jellemzőit adják meg ezek közül néhány alapján, véletlenszerűen kiválasztva.

A mintamegfigyelés használatának okai:

1. Anyag-, munkaerő-, anyagi erőforrások és időmegtakarítás.

2. A kiválasztott megfigyelés gyakran fokozott adatpontosságot eredményez, mert a megfigyelési egységek számának csökkentése jelentősen csökkenti a hibákat az attribútumértékek rögzítésében (nyomtatási hibák, alulszámlálás, kettős számlálás...).

3. A szelektív megfigyelés csak akkor lehetséges, ha a megfigyelést a megfigyelt tárgyak teljes vagy részleges károsodása kíséri (tojástételek minősége, szövetek szilárdsága stb.).

Az egységek megfigyelésre kiválasztott részét általában ún mintapopuláció vagy egyszerűen mintavétel, és az egységek teljes készlete, amelyből kiválasztás történik - Általános népesség.

A kiválasztott és általános sokaságra vonatkozó mutatók meghatározására a következő rendszer került elfogadásra.

A kiválasztási technika alkalmazásától függően a mintavételt soros (klaszter) és tipológiai mintavételre osztják.

· Amikor tipológiai mintavételkor az általános sokaságot típusokra (csoportokra, területekre) osztják, majd minden típusból véletlenszerűen kiválasztják az egységeket.

· Nál nél sorozatszám A mintában nem egységek kerülnek kiválasztásra, hanem bizonyos sorozatok, csoportok, területek, amelyeken belül folyamatos megfigyelés történik.

Kétféleképpen lehet egységeket kiválasztani egy minta keretben:

- újraválasztás

A mintában szereplő minden egység visszakerül az általános sokaságba, és esélye van ismét a mintába kerülni.

- ismételje meg a kiválasztást

a kiválasztott egység nem kerül vissza a sokaságba, és a fennmaradó egységek esetében nő a mintába kerülés valószínűsége. A nem ismétlődő mintavétel pontosabb eredményt ad, de előfordul, hogy nem végezhető el (fogyasztói igény-kutatás).

A mintamegfigyelés eredményeinek minősége attól függ, hogy a minta összetétele mennyire reprezentatív az általános sokaságra, más szóval attól, hogy a minta mennyire reprezentatív. reprezentatív(reprezentatív). A minta reprezentativitásának biztosítása érdekében be kell tartani az egységek véletlenszerű kiválasztásának elvét.

Mintavételi hiba

A mintavételi hibák fogalma és típusai

Mivel a vizsgált statisztikai sokaság változó jellemzőkkel rendelkező egységekből áll, a minta sokaságának összetétele bizonyos mértékben eltérhet az általános sokaság összetételétől.

A minta és a sokaság jellemzői közötti eltérés az mintavételi hiba.

A mintavételi hibák típusai

A mintavételi módszer fő feladata a reprezentativitás véletlenszerű hibáinak vizsgálata.

Átlagos mintavételi hiba

A véletlenszerű reprezentativitási hiba a következő tényektől függ (feltéve, hogy nincsenek regisztrációs hibák):

1. Minél nagyobb a minta mérete, minden más tényező azonossága mellett, annál kisebb a mintavételi hiba, pl. mintavételi hiba fordítottan arányos a méretével.

2. Minél kisebb a jellemző változása, annál kisebb a mintavételi hiba. Ha az attribútum egyáltalán nem változik, és ezért a diszperzió értéke nulla, akkor nem lesz mintavételi hiba, mert a populáció bármely egysége abszolút pontosan fogja jellemezni a teljes populációt ezen az alapon. Így a mintavételi hiba egyenesen arányos a variancia mértékével.

A matematikai statisztikában bebizonyosodott, hogy egy véletlenszerűen ismétlődő minta átlagos hibájának értéke meghatározható a képlettel

Mindazonáltal szem előtt kell tartani, hogy a szórás mértéke a populációban s 2 nem tudjuk, mert a megfigyelés szelektív. Csak a mintapopuláció szórásnégyzetét tudjuk kiszámítani S 2. Az általános és a mintapopuláció varianciái közötti kapcsolatot a következő képlettel fejezzük ki:

(6.2)

Ha n nagyszerű tehát

s2 = S2

Az átlagos újramintavételi hiba képlete (6.1.) pedig a következőképpen alakul:

De itt csak a vizsgált tulajdonság átlagértékének mintavételi hibáját vettük figyelembe. A kamatjellemzővel rendelkező egységek arányának mutatója is van. Ennek a mutatónak a hibájának kiszámítása saját jellemzőkkel rendelkezik.

A jellemző részesedésének mutatójának szórását a következő képlet határozza meg:

S 2 =w(1-w) (6.4)

Ekkor a jellemző részesedésmutató átlagos újramintavételi hibája egyenlő lesz:

(6.5)

A (6.3) és (6.5) képletek bizonyítása egy újramintavételezési sémából származik. A mintát általában nem ismétlődő módon szervezik. Mert nem ismétlődő szelekcióval az általános populáció nagysága N csökken a mintavételi kódban, akkor egy további tényező szerepel a mintavételi hibaképletekben , és a képletek a következőt öltik:

(6.6)

(6.7)

1. példa Határozzuk meg, mennyire különböznek a minta és az általános mutatók a tanulói teljesítmények 10%-os nem ismétlődő mintájából származó adatok alapján.

Az átlagérték nem ismétlődő mintavételi hibájának kiszámítása:

n= 100 N= 1000

Keressük meg a minta varianciáját a képlet segítségével:

Itt a mennyiség nem ismert, ez a szokásos súlyozott átlagban található:

És így,

Azok. elmondhatjuk, hogy az összes tanuló átlagpontszáma () 3,65±0,07

Most számoljuk ki a „4”-en és „5-ös” tanulók arányát a teljes népességen belül.

Határozzuk meg a 4-es és 5-ös osztályzatot kapott tanulók arányát a mintában.

(vagy 64%)

A részvény nem ismétlődő mintavételi hibáját a következő képlet segítségével számítjuk ki:

(vagy 4,5%)

Így a 4-es és 5-ös tanulók aránya a teljes népességben ( P) értéke 0,64±0,045 (vagy 64%±4,5%).

Marginális mintavételi hiba

Az, hogy az általános átlag és az általános részesedés nem lép túl bizonyos határokat, nem állítható teljes bizonyossággal, csak bizonyos fokú valószínűséggel.

A matematikai statisztikában bebizonyosodott, hogy az általános jellemzők a mintavételi hiba mértékével térnek el a minta jellemzőitől (± m), csak 0,683 valószínűséggel. A mintavizsgálatokkal kapcsolatban ez azt jelenti, hogy a határértékek 1000-ből csak 683 esetben garantálhatók. A fennmaradó 317 esetben ezek a határértékek eltérőek lesznek.

A megítélés valószínűsége növelhető az eltérési határok kiterjesztésével, ha mérjük az átlagos mintavételi hibával megnövelt értéket. t egyszer.

Azok. bizonyos valószínűséggel kijelenthetjük, hogy a minta jellemzőinek eltérései az általánostól nem haladnak meg egy bizonyos értéket, amelyet D maximális mintavételi hibának (delta) nevezünk:

Ahol t– megbízhatósági együttható (hibatényező), attól függően, hogy milyen konfidenciaszinttel kell garantálni a mintavizsgálat eredményeit.

A gyakorlatban olyan táblázatokat használnak, amelyekben különböző értékekre számítanak ki valószínűségeket t. Soroljunk fel néhányat közülük.

t Valószínűség t Valószínűség
0,5 0,383 2,0 0,954
1,0 0,683 2,5 0,988
1,5 0,866 3,0 0,997

Például, ha példánkban az ítélet valószínűségét 0,954-re akarjuk növelni, akkor vegyük t= 2, és ezzel megváltoztatja az összes hallgató átlagpontszámának és a „4”-en és „5-ös” tanulók arányának eltérési határait.

Azaz (6.9)

Azaz (6.10)

A szelektív megfigyelés során biztosítani kell baleset egységek kiválasztása. Minden egységnek egyenlő eséllyel kell kiválasztani. Ezen alapul a véletlenszerű minta.

NAK NEK tényleges véletlenszerű minta az egységek kiválasztását jelenti a teljes sokaságból (anélkül, hogy először bármilyen csoportra osztanák) sorshúzással (főleg) vagy más hasonló módszerrel, például véletlen számtáblázat segítségével. Véletlenszerű kiválasztás- ez a kiválasztás nem véletlen. A véletlenszerűség elve azt feltételezi, hogy egy tárgy felvételét vagy kizárását a mintából a véletlenen kívül más tényező nem befolyásolhatja. Példa valójában véletlenszerű a nyertes sorsolások kiválasztásként szolgálhatnak: az összes kibocsátott jegyből véletlenszerűen kiválasztják a nyereményt adó számok egy részét. Sőt, minden szám egyenlő lehetőséget biztosít a mintába való bekerülésre. Ebben az esetben a minta sokaságában kiválasztott egységek számát általában az elfogadott mintaarány alapján határozzák meg.

Minta megosztás a minta sokaságában lévő egységek számának és az általános sokaság egységeinek számának aránya:

Tehát 5%-os mintával egy 1000 egységnyi alkatrészből. minta nagysága P 50 egység, 10%-os mintával pedig 100 egység. stb. A mintavétel helyes tudományos szervezésével a reprezentativitási hibák minimális értékekre csökkenthetők, ennek eredményeként a minta megfigyelése meglehetősen pontossá válik.

A megfelelő véletlenszerű szelekciót „tiszta formájában” ritkán alkalmazzák a szelektív megfigyelés gyakorlatában, de ez a kiindulópont az összes többi szelekciós típus között, tartalmazza és megvalósítja a szelektív megfigyelés alapelveit.

Nézzük meg a mintavételi módszer elméletének néhány kérdését és egy egyszerű véletlenszerű minta hibaképletét.

A statisztikában a mintavételi módszer alkalmazásakor általában két fő típusú általános mutatót használnak: mennyiségi jellemző átlagos értékeÉs az alternatív jellemző relatív értéke(az olyan egységek részesedése vagy fajsúlya egy statisztikai sokaságban, amelyek csak a vizsgált jellemző jelenlétében különböznek e sokaság összes többi egységétől).

Szelektív részesedés (w), vagy gyakoriság, amelyet a vizsgált jellemzővel rendelkező egységek számának aránya határoz meg T, a minta sokaságában lévő egységek teljes számához P:

Például, ha a 100 mintarészletből ( n=100), 95 alkatrész bizonyult szabványosnak (T=95), majd a mintafrakciót

w=95/100=0,95 .

A mintamutatók megbízhatóságának jellemzésére vannak átlagosÉs maximális mintavételi hiba.

Mintavételi hiba ? vagy más szóval a reprezentativitási hiba a megfelelő minta és az általános jellemzők közötti különbség:

*

*

A mintavételi hiba csak a minta megfigyelésekre jellemző. Minél nagyobb ez a hiba, annál jobban eltérnek a mintamutatók a megfelelő általános mutatóktól.

A minta átlaga és a minta aránya eredendően összefügg Véletlen változók amelyek különböző értékeket vehetnek fel attól függően, hogy a sokaság mely egységei szerepelnek a mintában. Ezért a mintavételi hibák is valószínűségi változók, és különböző értékeket vehetnek fel. Ezért meghatározzák a lehetséges hibák átlagát - az átlagos mintavételi hibát.

Mitől függ átlagos mintavételi hiba? Ha a véletlen szelekció elvét betartjuk, akkor mindenekelőtt az átlagos mintavételi hibát határozzuk meg minta nagysága: Minél nagyobb ez a szám, ha más tényezők azonosak, annál kisebb az átlagos mintavételi hiba. Azáltal, hogy a teljes sokaság egyre több egységét fedjük le mintás felméréssel, egyre pontosabban jellemezzük a teljes általános sokaságot.

Az átlagos mintavételi hiba attól is függ variáció mértéke a vizsgált tulajdonság. A variáció mértékét, mint ismeretes, a szóródás jellemzi? 2 vagy w(1-w)-- alternatív jelre. Minél kisebb a jellemző változása, és ezáltal a szórása, annál kisebb az átlagos mintavételi hiba, és fordítva. Nulla szórás esetén (a jellemző nem változik) az átlagos mintavételi hiba nulla, vagyis az általános sokaság bármely egysége pontosan jellemezni fogja a teljes sokaságot ennek a jellemzőnek megfelelően.

Az átlagos mintavételi hiba volumenétől és az attribútum variációs fokától való függését olyan képletek tükrözik, amelyek segítségével az átlagos mintavételi hiba kiszámítható szelektív megfigyelés körülményei között, amikor az általános jellemzők ( x,p) ismeretlenek, és ezért úgy tűnik, hogy a valódi mintavételi hibát képletekkel közvetlenül nem lehet megtalálni (1. űrlap), (2. űrlap).

SH Véletlenszerű újramintavétellel átlagos hibák elméletileg a következő képletekkel számítjuk ki:

* az átlagos mennyiségi jellemzőre

* megosztásra (alternatív attribútum)

Mivel gyakorlatilag egy tulajdonság szórása a populációban? 2 nem ismert pontosan, a gyakorlatban a minta sokaságra a nagy számok törvénye alapján számított S2 diszperzió értékét használják, amely szerint a minta sokasága kellően nagy mintaméret mellett elég pontosan reprodukálja a az általános populáció jellemzői.

És így, számítási képletek átlagos mintavételi hibák véletlenszerű újraválasztással a következők lesznek:

* az átlagos mennyiségi jellemzőre

* megosztásra (alternatív attribútum)

A minta sokaságának szórása azonban nem egyenlő az általános sokaság szórásával, ezért az (5. űrlap) és (6. űrlap) képletekkel számított átlagos mintavételi hibák közelítőek lesznek. A valószínűségelméletben azonban bebizonyosodott, hogy az általános diszperziót a következő összefüggés fejezi ki a szelektív diszperzión keresztül:

Mert P/(n-1) kellően nagy P --érték közel van az egységhez, akkor feltételezhetjük, hogy, és ezért az átlagos mintavételi hibák gyakorlati számításaiban az (5. űrlap) és a (6. űrlap) képletek használhatók. És csak kis minta esetén (amikor a minta mérete nem haladja meg a 30-at) kell figyelembe venni az együtthatót P/(n-1) és számítsa ki kis minta átlagos hiba képlet szerint:

W X Véletlenszerű, nem ismétlődő kiválasztással A fenti képletekben az átlagos mintavételi hibák kiszámításához szükséges a gyök kifejezést 1-(n/N) szorozni, mivel a nem ismétlődő mintavétel során az általános sokaság egységeinek száma csökken. Ezért a nem ismétlődő mintavételhez számítási képletek átlagos mintavételi hiba a következő formában lesz:

* az átlagos mennyiségi jellemzőre

* megosztásra (alternatív attribútum)

. (10. űrlap)

Mert P mindig kevesebbet N, akkor a további tényező 1-( n/N) mindig kevesebb lesz egynél. Ebből következik, hogy az átlagos hiba a nem ismétlődő kiválasztás során mindig kisebb lesz, mint az ismételt kiválasztásnál. Ugyanakkor a minta viszonylag kis százalékánál ez a szorzó az egységhez közeli (például 5%-os mintánál 0,95; 2%-os mintánál 0,98 stb.). Ezért a gyakorlatban néha a megadott szorzó nélkül képleteket használnak (5. űrlap) és (6. űrlap) az átlagos mintavételi hiba meghatározásához, bár a minta nem ismétlődő jellegű. Ez olyan esetekben fordul elő, amikor az N populáció egységeinek száma ismeretlen vagy korlátlan, vagy amikor P nagyon kevés ahhoz képest N, és lényegében egy további, az egységhez közeli szorzó bevezetése gyakorlatilag semmilyen hatással nem lesz az átlagos mintavételi hiba értékére.

Mechanikus mintavétel abból áll, hogy a semleges ismérv szerint egyenlő intervallumokra (csoportokra) osztott általános sokaságból az egységek kiválasztása a mintapopulációba úgy történik, hogy minden ilyen csoportból csak egy egység kerül kiválasztásra. minta. A torzítás elkerülése érdekében az egyes csoportok közepén lévő egységet kell kiválasztani.

A mechanikus szelekció megszervezésekor a sokaság egységeit előzetesen (általában listában) egy bizonyos sorrendben (például ábécé, hely szerint, valamely, a tulajdonsághoz nem kapcsolódó mutató értékének növekvő vagy csökkenő sorrendjében) rendezik el. tanulmányozás alatt stb.). stb.), amely után egy adott számú egységet mechanikusan, meghatározott időközönként kiválasztanak. Ebben az esetben a sokaságban lévő intervallum mérete megegyezik a minta arányának fordított értékével. Tehát 2%-os mintánál minden 50. egységet kiválasztanak és ellenőrzik (1: 0,02), 5%-os mintával - minden 20. egységet (1: 0,05), például a gép konvergens részét.

Kellően nagy populáció esetén a mechanikai szelekció az eredmények pontosságát tekintve közel áll a tiszta véletlenszerű szelekcióhoz. Ezért a mechanikai mintavétel átlagos hibájának meghatározásához a megfelelő véletlenszerű, nem ismétlődő mintavétel képleteit használjuk (9. űrlap), (10. űrlap).

Egy heterogén populációból egységek kiválasztására az ún tipikus minta , amelyet olyan esetekben használunk, amikor a vizsgált mutatókat befolyásoló jellemzők szerint a teljes sokaság összes egysége több minőségileg homogén, hasonló csoportra osztható.

A vállalkozások felmérésekor ilyen csoportok lehetnek például iparágak és alágazatok, tulajdonosi formák. Ezután minden tipikus csoportból egy tisztán véletlenszerű vagy mechanikus mintát használnak az egységek egyenkénti kiválasztására a mintapopulációba.

A tipikus mintavételt általában összetett statisztikai sokaságok tanulmányozásakor alkalmazzák. Például a gazdaság egyes ágazataiban dolgozók és alkalmazottak családi költségvetésének mintavételes felmérése során a vállalati dolgozók munkatermelékenysége, szakképzettség szerint külön-külön csoportokban képviselve.

Egy tipikus minta pontosabb eredményeket ad a mintapopuláció egységeinek kiválasztásának más módszereihez képest. Az általános sokaság tipizálása biztosítja egy ilyen minta reprezentativitását, az egyes tipológiai csoportok reprezentációját, ami lehetővé teszi a csoportok közötti szóródás átlagos mintavételi hibára gyakorolt ​​hatásának kizárását.

Amikor meghatározzák egy tipikus minta átlagos hibája a változás jelzőjeként működik a csoporton belüli eltérések átlaga.

Átlagos mintavételi hiba képletekkel találjuk meg:

* az átlagos mennyiségi jellemzőre

(újraválasztás); (11. űrlap)

(irreverzibilis szelekció); (12. űrlap)

* megosztásra (alternatív attribútum)

(újraválasztás); (form.13)

(nem ismétlődő kijelölés), (14. űrlap)

ahol a mintapopuláció csoporton belüli eltéréseinek átlaga;

Az arány (egy alternatív jellemző) csoporton belüli eltéréseinek átlaga a minta sokaságára vonatkozóan.

Soros mintavétel Ez magában foglalja az általános sokaságból nem az egyes egységek, hanem az egyenrangú csoportok (fészkek, sorozatok) véletlenszerű kiválasztását annak érdekében, hogy az ilyen csoportokban lévő összes egységet kivétel nélkül megfigyelés alá vonják.

A sorozatos mintavétel alkalmazása annak köszönhető, hogy sok árut a szállításhoz, tároláshoz és értékesítéshez kötegbe, dobozba stb. Ezért a csomagolt áruk minőségének ellenőrzésekor ésszerűbb több csomagot (sorozatot) ellenőrizni, mint az összes csomagból kiválasztani a szükséges mennyiségű terméket.

Mivel a csoportokon (sorozatokon) belül kivétel nélkül minden egységet vizsgálunk, az átlagos mintavételi hiba (egyenlő sorozatok kiválasztásakor) csak a csoportok közötti (sorok közötti) diszperziótól függ.

SH Átlagos mintavételi hiba az átlagos mennyiségi tulajdonságra a sorozatkiválasztás során a következő képletekkel találjuk meg őket:

(újraválasztás); (form.15)

(nem ismétlődő kijelölés), (16. űrlap)

Ahol r- a kiválasztott epizódok száma; R- epizódok teljes száma.

A sorozatminta csoportok közötti variancia kiszámítása a következőképpen történik:

hol van az átlag én- th sorozat; - a teljes mintapopuláció általános átlaga.

SH Átlagos mintavételi hiba a megosztásnál (alternatív attribútum) sorozatválasztásban:

(újraválasztás); (17. űrlap)

(nem ismétlődő kiválasztás). (18. űrlap)

Csoportközi(sorozatok között) a soros minta hányadának szórása képlet határozza meg:

, (19. űrlap)

hol van a jellemző részesedése én-th sorozat; - a jellemző teljes részesedése a teljes mintapopulációban.

A statisztikai felmérések gyakorlatában a korábban tárgyalt kiválasztási módszerek mellett ezek kombinációját alkalmazzák (kombinált kiválasztás).

A szelektív megfigyelés fogalma.

A statisztikai megfigyelési módszerrel kétféle megfigyelési mód alkalmazható: folyamatos, a sokaság minden egységére kiterjedő és szelektív (nem folyamatos).

A mintavételen olyan kutatási módszert értünk, amely a populáció egy részének általános mutatóinak megállapításához kapcsolódik véletlen szelekciós módszer alapján.

A szelektív megfigyelés során a teljes populáció viszonylag kis részét (5-10%) vizsgálják.

A teljes vizsgálandó lakosság ún Általános népesség.

Az általános sokaságból kiválasztott egységek felmérés tárgyát képező részét ún mintapopuláció vagy mintavétel.

Az általános és minta sokaságot jellemző mutatók:

1) Alternatív jellemző részesedése;

BAN BEN népesség az alternatív jellemzőkkel rendelkező egységek arányát a „P” betű jelöli.

BAN BEN mintapopuláció az alternatív jellemzőkkel rendelkező egységek arányát a „w” betű jelöli.

2) Átlagos elemméret;

BAN BEN népesség Egy jellemző átlagos méretét betű jelzi (általános átlag).

BAN BEN mintapopuláció Az átlagos terepméretet egy betű (mintaátlag) jelzi.

A mintavételi hiba definíciója.

A mintamegfigyelés azon az elven alapul, hogy az általános sokaság egységei egyenlő esélyekkel kerüljenek a mintába. Ezzel elkerülhetők a szisztematikus megfigyelési hibák. Tekintettel azonban arra, hogy a vizsgált sokaság változó jellemzőkkel rendelkező egységekből áll, a minta összetétele eltérhet az általános sokaság összetételétől, ami eltéréseket okoz az általános és a minta jellemzői között.

Az ilyen eltéréseket reprezentativitási hibának vagy mintavételi hibának nevezzük.

A mintavételi hiba meghatározása a fő probléma, amelyet a minta megfigyelése során megoldanak.

A matematikai statisztikában bebizonyosodott, hogy az átlagos mintavételi hibát a következő képlet határozza meg:

ahol m a mintavételi hiba;

s 2 0 – az általános populáció szórása;

n – egységek száma a minta sokaságában.

A gyakorlatban az s 2 mintapopuláció-varianciát használják az átlagos mintavételi hiba meghatározására.

Egyenlőség van az általános és a minta szórások között:

(2).

A (2) képletből világosan látszik, hogy az általános szórás a () értékkel nagyobb, mint a minta szórása. Márpedig kellően nagy mintaszám mellett ez az arány az egységhez közelít, így ezt írhatjuk

Az átlagos mintavételi hiba meghatározására szolgáló képlet azonban csak ismételt mintavételre vonatkozik.

A gyakorlatban általában használják ismételje meg a kiválasztástés az átlagos mintavételi hiba kiszámítása kissé eltérő, mivel a minta mérete a vizsgálat során csökken:

(4)

ahol n a minta sokaságának mérete;

N – populáció mérete;

s 2 - minta variancia.

Egy alternatív jellemző részesedésére az átlagos mintavételi hiba at ismételt kiválasztás képlet határozza meg:

(5), hol

w (1-w) - egy alternatív jellemző mintaarányának átlagos hibája;

w egy alternatív jellemző részesedése a minta sokaságában.

Nál nél újraválasztás Az alternatív jellemző részesedésének átlagos hibáját egy egyszerűsített képlet segítségével határozzuk meg:

(6)

Ha a minta mérete nem haladja meg az 5%-ot a mintafrakció és a mintaátlag átlagos hibáját a (3) és (6) egyszerűsített képletekkel határozzuk meg.

A mintaátlag és a mintaarány átlagos hibájának meghatározása szükséges az általános átlag (x) és az általános arány (P) lehetséges értékeinek megállapításához a mintaátlag (x) és a mintaarány (w) alapján. .

Az egyik lehetséges értéket, amelyen belül az általános átlag található, a következő képlet határozza meg:

Az általános részvény esetében ez az intervallum így írható fel :

(8)

Az így kapott általános sokaságban a részarány és az átlag jellemzői a mintarészesedés értékétől és a mintaátlag értékétől annyiban térnek el. m. Ez azonban nem garantálható teljes bizonyossággal, csak bizonyos fokú valószínűséggel.

A matematikai statisztikában bebizonyosodott, hogy az általános és a mintaátlagok jellemzőinek határai a mennyiségben eltérnek. m csak 0,683 valószínűséggel. Ebből következően 1000-ből csak 683 esetben van az általános átlagon belül x= x m x, más esetekben túllépi ezeket a határokat.

Az ítéletek valószínűsége növelhető, ha az eltérések határait t-szeresére növelve mérjük az átlagos mintavételi hibát.

A t tényezőt konfidencia együtthatónak nevezzük. Ennek meghatározása attól függ, hogy a kutatási eredményeket milyen megbízhatósági szinttel kell garantálni.

A.M. Lyapushev matematikus kiszámította a t különböző értékeit, amelyeket általában kész táblázatokban adnak meg.

A rovat legfrissebb anyagai:

Sofa csapatok lassú reakció A csapatok lassú reakció
Sofa csapatok lassú reakció A csapatok lassú reakció

Ványa a kanapén fekszik, Sört iszik fürdés után.Ivánunk nagyon szereti megereszkedett díványát.Az ablakon kívül szomorúság és melankólia,Zoknijából lyuk néz ki,De Iván nem...

Kik ők
Kik a "nyelvtani nácik"

A náci nyelvtan fordítása két nyelvről történik. Angolul az első szó jelentése "nyelvtan", a második pedig németül "náci". Ez körülbelül...

Vessző az „és” előtt: mikor használják és mikor nem?
Vessző az „és” előtt: mikor használják és mikor nem?

A koordináló kötőszó összekapcsolhatja: a mondat homogén tagjait; egyszerű mondatok összetett mondat részeként; homogén...