Błąd graniczny formuły wartości średniej. Średnie i krańcowe błędy próbkowania

W celu scharakteryzowania rzetelności wskaźników próby rozróżnia się błędy średnie i krańcowe próby, które są charakterystyczne tylko dla obserwacji próby. Wskaźniki te odzwierciedlają różnicę między próbą a odpowiednimi wskaźnikami ogólnymi.

Średni błąd próbki zależy przede wszystkim od wielkości próby i zależy od struktury i stopnia zmienności badanej cechy.

Znaczenie średniego błędu próbkowania jest następujące. Obliczone wartości frakcji próbki (w) i średniej próbki () są z natury zmiennymi losowymi. Mogą przybierać różne wartości w zależności od tego, jakie konkretnie jednostki z populacji ogólnej wchodzą do próby. Na przykład, jeśli przy określaniu średniego wieku pracowników przedsiębiorstwa w jednej próbie uwzględni się więcej osób młodych, a w drugiej starszych pracowników, to średnie próby i błędy doboru będą inne. Średni błąd próbkowania określa wzór:

(27) lub - ponowne próbkowanie. (28)

gdzie: μ to średni błąd próbkowania;

σ to odchylenie standardowe cechy w populacji ogólnej;

n to wielkość próbki.

Wartość błędu μ pokazuje, jak średnia wartość cechy ustalona przez próbę różni się od rzeczywistej wartości cechy w populacji ogólnej.

Ze wzoru wynika, że ​​błąd próbkowania jest wprost proporcjonalny do odchylenia standardowego i odwrotnie proporcjonalny do pierwiastka kwadratowego liczby jednostek w próbie. Oznacza to np., że im większy rozrzut wartości cechy w populacji ogólnej, czyli im większy rozrzut, tym większa powinna być wielkość próby, jeśli chcemy ufać wynikom badania reprezentacyjnego . I odwrotnie, przy małej wariancji można ograniczyć się do małej liczby populacji próbnych. Błąd próbkowania będzie wówczas mieścił się w dopuszczalnych granicach.

Ponieważ liczebność populacji ogólnej N podczas doboru próby zmniejsza się podczas doboru wielokrotnego, do wzoru na średni błąd doboru dobierany jest dodatkowy czynnik

(jeden- ). Wzór na średni błąd próbkowania przyjmuje postać:

Błąd średni jest mniejszy w przypadku prób nie powtarzających się, co sprawia, że ​​jest on szerzej stosowany.

Praktyczne wnioski wymagają scharakteryzowania populacji ogólnej na podstawie wyników próby. Średnie i proporcje próby stosuje się do populacji ogólnej, z uwzględnieniem granicy ich możliwego błędu iz prawdopodobieństwem, które to gwarantuje. Przy określonym poziomie prawdopodobieństwa dobierana jest wartość znormalizowanego odchylenia i wyznaczany jest marginalny błąd próbkowania.

Wiarygodność (prawdopodobieństwo ufności) oszacowania X przez X* zwany prawdopodobieństwem γ , z którym nierówność


׀Х-Х*׀< δ, (30)

gdzie δ jest marginalnym błędem próbkowania charakteryzującym szerokość przedziału, w którym z prawdopodobieństwem γ znajduje się wartość badanego parametru populacji ogólnej.

Zaufany nazwij przedział (X* - δ; X* + δ), który obejmuje badany parametr X (czyli wartość parametru X znajduje się wewnątrz tego przedziału) z zadaną niezawodnością γ.

Zwykle wiarygodność oszacowania jest ustalana z góry, a liczbę zbliżoną do jedności przyjmuje się jako γ: 0,95; 0,99 lub 0,999.

Błąd graniczny δ jest powiązany z błędem średnim μ w następujący sposób: , (31)

gdzie: t jest współczynnikiem ufności zależnym od prawdopodobieństwa P, z którym można argumentować, że błąd krańcowy δ nie przekroczy t-krotnego błędu średniego μ (nazywa się go również punktami krytycznymi lub kwantylami rozkładu Studenta).

Ze współczynnika wynika, że ​​błąd krańcowy jest wprost proporcjonalny do średniego błędu próbkowania i współczynnika ufności, który zależy od danego poziomu wiarygodności estymacji.

Ze wzoru na średni błąd próbkowania i stosunek błędu krańcowego do średniego otrzymujemy:

Biorąc pod uwagę prawdopodobieństwo ufności, wzór ten przyjmie postać.

Jak wiadomo, w statystyce istnieją dwa sposoby obserwacji zjawisk masowych w zależności od zupełności pokrycia obiektu: ciągły i nieciągły. Odmianą obserwacji nieciągłej jest obserwacja selektywna.

Pod selektywna obserwacja rozumiany jest jako nieciągła obserwacja, w której wybrane losowo jednostki badanej populacji poddawane są badaniu statystycznemu (obserwacji).

Obserwacja wybiórcza stawia sobie za zadanie scharakteryzowanie całej populacji jednostek dla badanej części, z zachowaniem wszelkich reguł i zasad obserwacji statystycznej i naukowo zorganizowanej pracy nad doborem jednostek.

Zestaw jednostek wybranych do badania w statystyce jest zwykle nazywany próbka populacji , a zbiór jednostek, z których dokonuje się wyboru, nazywa się ogólna populacja . Główne cechy populacji ogólnej i próbnej przedstawiono w tabeli 1.

Tabela 1 - Główne cechy populacji ogólnej i próbnej
WskaźnikOznaczenie lub formuła
Populacja Populacja próbki
Liczba jednostek n n
Liczba jednostek, które mają funkcję M m
Proporcja jednostek z tą funkcją p = M/N ω = m/n
Odsetek jednostek, które nie mają tej funkcji q = 1 - p 1 - w
Średnia wartość znak
Dyspersja znak
Rozproszenie cechy alternatywnej (rozproszenie udziału) pq (1 - ω)

Podczas prowadzenia selektywnej obserwacji pojawiają się błędy systematyczne i losowe. Błędy systematyczne powstają w wyniku naruszenia zasad doboru jednostek w próbie. Zmieniając zasady selekcji, takie błędy można wyeliminować.

Błędy losowe powstają z powodu nieciągłości ankiety. W przeciwnym razie nazywane są błędami reprezentatywności (reprezentatywności). Błędy losowe dzielą się na średnie i krańcowe błędy próbkowania, które są określane zarówno przy obliczaniu cechy, jak i przy obliczaniu udziału.

Błędy średnie i graniczne są powiązane następującą zależnością :Δ = tμ, gdzie Δ to marginalny błąd próbkowania, μ to średni błąd próbkowania, t to współczynnik ufności wyznaczony w zależności od poziomu prawdopodobieństwa. Tabela 2 pokazuje niektóre wartości t zaczerpnięte z teorii prawdopodobieństwa.

Wartość średniego błędu próbkowania oblicza się różnicowo w zależności od metody doboru i procedury próbkowania. Główne wzory na obliczanie błędów doboru próby przedstawiono w tabeli 3.

Tabela 3 - Podstawowe wzory do obliczania błędów próbkowania w zaznaczaniu powtarzalnym i nie powtarzającym się
WskaźnikOznaczenie i formuła
Populacja Populacja próbki
Średni błąd funkcji dla losowego ponownego próbkowania
Średni błąd udziału dla losowego ponownego próbkowania
Ogranicz błąd funkcji w przypadku losowego ponownego wyboru
Marginalny błąd udziału w losowym ponownym wyborze
Średni błąd cechy dla losowego, nie powtarzającego się wyboru
Średni błąd udziału w losowym niepowtarzającym się próbkowaniu
Ogranicz błąd funkcji z losowym, nie powtarzalnym wyborem
Błąd krańcowy udziału dla losowego, nie powtarzającego się wyboru

Obliczenie średnich i krańcowych błędów próbkowania pozwala określić możliwe granice, w jakich będą się charakteryzować cechy populacji ogólnej .

Na przykład dla średniej z próby takie limity są ustalane na podstawie następujących zależności:

Granice udziału cechy w populacji ogólnej s.

Przykłady rozwiązywania problemów na temat „Obserwacja próbkowania w statystyce”

Zadanie 1 . Informacja o produkcji wyrobów (robót, usług) uzyskana na podstawie 10% obserwacji próby przedsiębiorstw w regionie:

Określ: 1) dla przedsiębiorstw objętych próbą: a) średnią wielkość produkcji na przedsiębiorstwo; b) rozproszenie wielkości produkcji; c) udział przedsiębiorstw o ​​wielkości produkcji przekraczającej 400 tysięcy rubli; 2) dla regionu jako całości, z prawdopodobieństwem 0,954, granice, w których można oczekiwać: a) średniej wielkości produkcji przypadającej na przedsiębiorstwo; b) udział przedsiębiorstw o ​​wielkości produkcji przekraczającej 400 tysięcy rubli; 3) łączny wolumen produkcji w regionie.

Decyzja

Aby rozwiązać problem, rozszerzamy proponowaną tabelę.

1) Dla przedsiębiorstw objętych próbą średnia wielkość produkcji na przedsiębiorstwo

110800/400 = 277 tysięcy rubli

Rozrzut wielkości produkcji obliczamy w sposób uproszczony σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Liczba przedsiębiorstw, których wielkość produkcji przekracza 400 tysięcy rubli. wynosi 36+12 = 48, a ich udział jest równy ω = 48:400 = 0,12 = 12%.

2) Z rachunku prawdopodobieństwa wiadomo, że przy prawdopodobieństwie P=0,954 współczynnik ufności t=2. Krańcowy błąd próbkowania

2√12371:400 = 11,12 tys. rubli

Ustalmy granice średniej ogólnej: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤Xav ≤ 288,12

Krańcowy błąd próby udziału przedsiębiorstw

2√0,12*0,88/400 = 0,03

Określmy granice udziału ogólnego: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤p≤0,15

3) Ponieważ rozpatrywana grupa przedsiębiorstw stanowi 10% ogólnej liczby przedsiębiorstw w regionie, w całym regionie jest 4000 przedsiębiorstw. Wtedy całkowita wielkość produkcji w regionie mieści się w granicach 265,88×4000≤Q≤288.12×4000; 1063520 ≤ Q ≤ 1152480

Zadanie 2 . Zgodnie z wynikami przeprowadzonej przez organy podatkowe kontroli kontrolnej 400 struktur gospodarczych, 140 z nich nie wskazuje w swoich zeznaniach podatkowych w pełni dochodu podlegającego opodatkowaniu. Określ w populacji ogólnej (dla całego regionu) udział struktur biznesowych, które ukryły część swoich wpływów podatkowych z prawdopodobieństwem 0,954.

Decyzja

Zgodnie ze stanem problemu liczba jednostek w populacji próby wynosi n=400, liczba jednostek z rozpatrywaną cechą to m=140, prawdopodobieństwo P=0,954.

Z rachunku prawdopodobieństwa wiadomo, że przy prawdopodobieństwie P=0,954 współczynnik ufności t=2.

Odsetek jednostek posiadających wskazany atrybut określa wzór: p=w+∆p, gdzie w = m/n=140/400=0,35=35%,
a błąd graniczny cechy ∆p otrzymujemy ze wzoru: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈0,5 = 5%

Wtedy p = 35±5%.

Odpowiedź : Udział struktur biznesowych, które ukryły część swoich dochodów podatkowych z prawdopodobieństwem 0,954, wynosi 35±5%.

Pojęcie obserwacji selektywnej.

Selektywny taką obserwację nazywa się, w której charakterystyka całego zbioru jednostek jest podana według niektórych ich części, wybranych w losowej kolejności.

Powody stosowania obserwacji wybiórczej:

1. Oszczędność materiałów, pracy, środków finansowych i czasu.

2. Wybrana obserwacja często prowadzi do zwiększenia dokładności danych, ponieważ spadek liczby jednostek obserwacyjnych znacznie zmniejsza błędy w rejestrowaniu wartości znaku (błędy drukarskie, podliczenie, podwójne liczenie ...).

3. Obserwacja wybiórcza jest możliwa tylko wtedy, gdy obserwacji towarzyszy całkowite lub częściowe uszkodzenie obserwowanych obiektów (jakość partii jaj, wytrzymałość tkanek itp.).

Ta część jednostek wybranych do obserwacji jest zwykle nazywana próbka populacji lub po prostu próbowanie, a cały zestaw jednostek, z których dokonywany jest wybór - ogólna populacja.

Przyjęto następujący system oznaczenia wskaźników dla populacji wybranej i populacji ogólnej.

W zależności od zastosowania techniki selekcji próba dzieli się na seryjną (zagnieżdżoną) i typologiczną.

· Kiedy typologiczny dobór próby, populację ogólną dzieli się na typy (grupy, powiaty), a następnie dokonuje się losowego doboru jednostek z każdego typu.

· Na seryjny próba jest wybierana nie według jednostek, ale przez pewne serie, grupy, obszary, w ramach których prowadzona jest ciągła obserwacja.

W próbce można wybrać jednostki na dwa sposoby:

- reselekcja

każda jednostka w próbie jest zwracana do populacji ogólnej i ma szansę na ponowne pobranie próbki.

- nie powtarzalny wybór

wybrana jednostka nie jest zwracana do populacji, a pozostałe jednostki z większym prawdopodobieństwem zostaną uwzględnione w próbie. Niepowtarzalne pobieranie próbek daje dokładniejsze wyniki, ale czasami nie można tego zrobić (badanie popytu konsumentów).

Jakość wyników doboru próby zależy od tego, w jakim stopniu skład próbki reprezentuje populację ogólną, innymi słowy od tego, jak bardzo przedstawiciel(przedstawiciel). Aby zapewnić reprezentatywność próby, należy przestrzegać zasady losowego doboru jednostek.

Błąd próbkowania

Pojęcie i rodzaje błędów próbkowania

Ponieważ badana populacja statystyczna składa się z jednostek o różnej charakterystyce, skład populacji próby może w pewnym stopniu różnić się od składu populacji ogólnej.

Rozbieżność między cechami próby a populacji ogólnej wynosi błąd próbkowania.

Rodzaje błędów próbkowania

Głównym zadaniem metody doboru próby jest badanie błędów losowych reprezentatywności.

Średni błąd próbkowania

Losowy błąd reprezentatywności zależy od następujących faktów (zakłada się brak błędów rejestracyjnych):

1. Im większa liczebność próby, ceteris paribus, tym mniejszy błąd próbkowania, tj. błąd próbkowania jest odwrotnie proporcjonalny do jego wielkości.

2. Im mniejsza zmienność atrybutu, tym mniejszy błąd próbkowania. Jeśli znak w ogóle się nie zmienia, a w konsekwencji wariancja wynosi zero, to nie będzie błędu próbkowania, ponieważ każda jednostka populacji będzie na tej podstawie dokładnie scharakteryzować całą populację. Zatem błąd próbkowania jest wprost proporcjonalny do wielkości wariancji.

W statystyce matematycznej udowodniono, że wartość błędu średniego losowego ponownego próbkowania można wyznaczyć ze wzoru

Należy jednak pamiętać, że wielkość rozproszenia w populacji ogólnej s2 nie wiemy, bo selektywna obserwacja. Możemy obliczyć tylko wariancję w populacji próby S2. Stosunek wariancji populacji ogólnej i próbnej wyraża się wzorem:

(6.2)

Jeśli n dlatego duże

s2 = S2

A wzór na średni błąd resamplingu (6.1.) przyjmie postać:

Ale tutaj rozważyliśmy tylko błąd próbkowania dla średniej wartości interesującej nas cechy. Istnieje również wskaźnik proporcji jednostek z cechą zainteresowania. Obliczenie błędu tego wskaźnika ma swoją własną charakterystykę.

Wariancję charakterystycznego wskaźnika udziału określa wzór:

S 2 \u003d w (1-w) (6.4)

Wówczas średni błąd próbkowania miary udziału cechy będzie równy:

(6.5)

Dowód formuł (6.3) i (6.5) rozpoczyna się od schematu resamplingu. Zazwyczaj próbka jest zorganizowana w sposób nie powtarzalny. Dlatego przy selekcji nie powtarzalnej, wielkość populacji ogólnej n jest skrócony w kodzie próbkowania, to we wzorach błędu próbkowania uwzględniany jest dodatkowy czynnik , a formuły przyjmują postać:

(6.6)

(6.7)

Przykład 1. Określmy, jak bardzo próbka i wskaźniki ogólne różnią się na podstawie danych z 10% nie powtarzającej się próby wyników uczniów.

Obliczenie błędu braku ponownego próbkowania dla średniej:

n= 100 n= 1000

Znajdź wariancję próbki, korzystając ze wzoru:

Tutaj wartość nie jest znana, którą można znaleźć jako zwykłą średnią ważoną:

W ten sposób,

Tych. możemy powiedzieć, że średni wynik wszystkich uczniów () wynosi 3,65 ± 0,07

Teraz obliczmy odsetek studentów w populacji ogólnej studiujących na „4” i „5”.

Na podstawie próby znajdziemy odsetek uczniów, którzy otrzymali oceny „4” i „5”.

(lub 64%)

Obliczenia błędu braku ponownego próbkowania dla udziału dokonuje się według wzoru:

(lub 4,5%)

Tym samym udział uczniów zapisanych na „4” i „5” w ogólnej populacji ( P) wynosi 0,64±0,045 (lub 64%±4,5%).

Krańcowy błąd próbkowania

Fakt, że ogólna średnia i ogólny udział nie przekroczą pewnych granic, można stwierdzić nie z absolutną pewnością, ale tylko z pewnym stopniem prawdopodobieństwa.

W statystyce matematycznej udowodniono, że ogólna charakterystyka odbiega od wzorcowych o wielkość błędu próbkowania (± m), tylko z prawdopodobieństwem 0,683. W odniesieniu do badań przykładowych należy przez to rozumieć, że wartości limitów można zagwarantować tylko w 683 przypadkach na 1000. W pozostałych 317 przypadkach wartości tych limitów będą inne.

Prawdopodobieństwo oceny można zwiększyć, rozszerzając granice odchylenia, przyjmując jako miarę średni błąd próbkowania, powiększony o t raz.

Tych. z pewnym prawdopodobieństwem możemy stwierdzić, że odchylenia cech próby od ogólnych nie przekroczą pewnej wartości, którą nazywamy błędem krańcowym próby D (delta):

gdzie t– współczynnik ufności (współczynnik krotności błędu), wyznaczany w zależności od poziomu ufności, z jakim konieczne jest zagwarantowanie wyników badania na próbie.

W praktyce stosuje się tabele, w których oblicza się prawdopodobieństwa dla różnych wartości t. Przyjrzyjmy się niektórym z nich.

t Prawdopodobieństwo t Prawdopodobieństwo
0,5 0,383 2,0 0,954
1,0 0,683 2,5 0,988
1,5 0,866 3,0 0,997

Na przykład, jeśli w naszym przykładzie chcemy zwiększyć prawdopodobieństwo osądu do 0,954, to bierzemy t= 2 i tym samym zmienić granice odchyleń od średniego wyniku wszystkich uczniów oraz proporcji uczniów zapisanych na „4” i „5”.

To znaczy (6.9)

To znaczy (6.10)

Podczas selektywnej obserwacji należy to zapewnić wypadek wybór jednostki. Każda jednostka musi mieć równe szanse na wybór z innymi. Na tym polega losowe pobieranie próbek.

DO właściwa próbka losowa odnosi się do wyboru jednostek z całej populacji ogólnej (bez wstępnego podziału na jakiekolwiek grupy) przez losowanie (głównie) lub inną podobną metodą, na przykład za pomocą tabeli liczb losowych. Losowy wybór Ten wybór nie jest przypadkowy. Zasada losowości sugeruje, że na włączenie lub wyłączenie obiektu z próby nie może mieć wpływu żaden inny czynnik niż przypadek. Przykład faktycznie losowo selekcja może służyć jako obiegi wygranych: z całkowitej liczby wystawionych losów losowo wybierana jest pewna część liczb, które składają się na wygraną. Co więcej, wszystkie liczby mają równe szanse na dostanie się do próby. W takim przypadku liczba jednostek wybranych w zestawie próbek jest zwykle określana na podstawie przyjętej proporcji próbki.

Przykładowy udział to stosunek liczby jednostek populacji próbnej do liczby jednostek populacji ogólnej:

Czyli z 5% próbką z partii części w 1000 sztuk. wielkość próbki P wynosi 50 jednostek, a przy próbce 10% - 100 jednostek. itp. Przy prawidłowej naukowej organizacji pobierania próbek błędy reprezentatywności można zredukować do wartości minimalnych, dzięki czemu obserwacja selektywna staje się wystarczająco dokładna.

Właściwy dobór losowy „w czystej postaci” jest rzadko stosowany w praktyce obserwacji wybiórczej, ale stanowi punkt wyjścia wśród wszystkich innych rodzajów doboru, zawiera i realizuje podstawowe zasady obserwacji wybiórczej.

Rozważmy kilka pytań dotyczących teorii metody doboru próby i wzoru błędu dla prostej próby losowej.

Stosując metodę doboru próby w statystyce, zwykle stosuje się dwa główne typy wskaźników uogólniających: średnia wartość cechy ilościowej oraz względna wartość alternatywnej cechy(proporcja lub udział jednostek w populacji statystycznej, które różnią się od wszystkich innych jednostek tej populacji jedynie obecnością badanej cechy).

Przykładowy udział (w), lub częstotliwość, jest określana przez stosunek liczby jednostek, które mają badaną charakterystykę t, do całkowitej liczby jednostek próby P:

Na przykład, jeśli na 100 przykładowych szczegółów ( n=100), 95 części okazało się standardem (T=95), to frakcja próbki

w=95/100=0,95 .

Aby scharakteryzować wiarygodność przykładowych wskaźników, istnieją środek oraz marginalny błąd próbkowania.

Błąd próbkowania ? lub innymi słowy błąd reprezentatywności jest różnicą między odpowiednią próbą a ogólną charakterystyką:

*

*

Błąd próbkowania jest charakterystyczny tylko dla obserwacji selektywnych. Im większa wartość tego błędu, tym bardziej wskaźniki próby różnią się od odpowiadających im wskaźników ogólnych.

Średnia próbki i udział próbki są z natury zmienne losowe, które mogą przybierać różne wartości w zależności od tego, jakie jednostki populacji zostały uwzględnione w próbie. Dlatego też błędy próbkowania są również zmiennymi losowymi i mogą przybierać różne wartości. Dlatego wyznacz średnią z możliwych błędów - średni błąd próbki.

Od czego to zależy oznacza błąd próbkowania? Z zastrzeżeniem zasady doboru losowego, średni błąd próbkowania określany jest przede wszystkim wielkość próbki: im większa populacja, ceteris paribus, tym mniejszy średni błąd próby. Obejmując badanie reprezentacyjne coraz większą liczbą jednostek populacji ogólnej, coraz dokładniej charakteryzujemy całą populację.

Średni błąd próbkowania zależy również od stopień zmienności badana cecha. Stopień zróżnicowania, jak wiesz, charakteryzuje się rozproszeniem? 2 lub w(1-w)-- dla alternatywnej funkcji. Im mniejsza zmienność cechy, a co za tym idzie wariancja, tym mniejszy średni błąd próbkowania i odwrotnie. Przy zerowym rozproszeniu (atrybut nie zmienia się) średni błąd próbkowania wynosi zero, tj. dowolna jednostka populacji ogólnej będzie dokładnie charakteryzować całą populację zgodnie z tym atrybutem.

Zależność średniego błędu próbkowania od jego wielkości i stopnia zmienności atrybutu odzwierciedlają wzory, które można wykorzystać do obliczenia średniego błędu próby w warunkach obserwacji próby, gdy ogólna charakterystyka ( x,p) są nieznane, w związku z czym nie jest możliwe znalezienie rzeczywistego błędu próbkowania bezpośrednio ze wzorów (form. 1), (form. 2).

W Z losowym wyborem średnie błędy teoretycznie obliczone według następujących wzorów:

* dla średniej cechy ilościowej

* dla akcji (charakterystyka alternatywna)

Skoro praktycznie wariancja atrybutu w populacji ogólnej? 2 nie jest dokładnie znana, w praktyce posługują się wartością wariancji S 2 obliczoną dla populacji próbnej na podstawie prawa dużych liczb, zgodnie z którym populacja próby o odpowiednio dużej liczebności próby dokładnie odwzorowuje cechy ogólna populacja.

W ten sposób, formuły obliczeniowe środek błędy próbkowania losowe ponowne próbkowanie będzie wyglądać następująco:

* dla średniej cechy ilościowej

* dla akcji (charakterystyka alternatywna)

Jednak wariancja populacji próbnej nie jest równa wariancji populacji ogólnej, a zatem średnie błędy losowania obliczone za pomocą wzorów (form. 5) i (form. 6) będą przybliżone. Ale w teorii prawdopodobieństwa udowodniono, że ogólna wariancja wyraża się poprzez elektywną następującą relacją:

Dlatego P/(n-1) dla wystarczająco dużych P -- wartości bliskiej jedności można przyjąć, że i dlatego w praktycznych obliczeniach średnich błędów próbkowania można stosować formuły (form. 5) i (form. 6). I tylko w przypadku małej próby (gdy wielkość próby nie przekracza 30) konieczne jest uwzględnienie współczynnika P/(n-1) i oblicz mały błąd średni próbki według wzoru:

W X Z losowym, nie powtarzającym się wyborem w powyższych wzorach do obliczania średnich błędów próbkowania konieczne jest pomnożenie wyrażenia pierwiastka przez 1-(n / N), ponieważ liczba jednostek w populacji ogólnej jest zmniejszana w procesie nie powtarzalnego pobierania próbek. Dlatego w przypadku nie powtarzającej się selekcji formuły obliczeniowe średni błąd próbkowania przyjmie następującą formę:

* dla średniej cechy ilościowej

* dla akcji (charakterystyka alternatywna)

. (formularz 10)

Dlatego P zawsze mniej n, to dodatkowy czynnik 1-( n/N) zawsze będzie mniej niż jeden. Wynika z tego, że średni błąd przy selekcji nie powtarzalnej będzie zawsze mniejszy niż przy selekcji powtórnej. Jednocześnie przy stosunkowo niewielkim procencie próby współczynnik ten jest bliski jedności (np. przy próbie 5% jest to 0,95; przy próbie 2% jest to 0,98 itd.). Dlatego czasami w praktyce do wyznaczenia średniego błędu próby bez podanego mnożnika stosuje się formuły (formularze 5) i (formularze 6) mimo, że próba jest zorganizowana jako niepowtarzalna. Dzieje się tak, gdy liczba jednostek w populacji ogólnej N jest nieznana lub nieograniczona lub gdy P bardzo mało w porównaniu do n, a w istocie wprowadzenie dodatkowego czynnika o wartości zbliżonej do jedności praktycznie nie wpłynie na wartość średniego błędu próbkowania.

Próbkowanie mechaniczne polega na tym, że dobór jednostek w próbie z ogólnej, podzielonej neutralnym kryterium na równe przedziały (grupy), odbywa się w taki sposób, że z każdej takiej grupy w próbie wybierana jest tylko jedna jednostka. Aby uniknąć systematycznego błędu, należy wybrać jednostkę znajdującą się w środku każdej grupy.

Podczas organizowania selekcji mechanicznej jednostki populacji są wstępnie ułożone (zwykle na liście) w określonej kolejności (na przykład alfabetycznie, według lokalizacji, w porządku rosnącym lub malejącym wartości dowolnego wskaźnika, który nie jest powiązany z badaną nieruchomością itp.) itp.), po czym w określonych odstępach czasu mechanicznie dobierana jest określona liczba jednostek. W tym przypadku wielkość przedziału w populacji ogólnej jest równa odwrotności udziału próby. Tak więc przy próbce 2% co 50. jednostka (1: 0,02) jest wybierana i sprawdzana, przy próbce 5%, co 20. jednostka (1: 0,05), na przykład malejąco detalu z maszyny.

Przy dostatecznie dużej populacji dobór mechaniczny pod względem dokładności wyników jest zbliżony do właściwego losowego. Dlatego do wyznaczenia błędu średniego próbki mechanicznej wykorzystuje się wzory na losowe, niepowtarzalne próbkowanie (form. 9), (form. 10).

Aby wybrać jednostki z niejednorodnej populacji, tzw typowa próbka , który jest stosowany w przypadkach, gdy wszystkie jednostki populacji ogólnej można podzielić na kilka jednorodnych jakościowo, podobnych grup według cech wpływających na badane wskaźniki.

Przy badaniu przedsiębiorstw takimi grupami mogą być np. przemysł i podsektor, formy własności. Następnie z każdej typowej grupy dokonuje się indywidualnego doboru jednostek do próby metodą losową lub mechaniczną.

Typowa próba jest zwykle używana w badaniu złożonych populacji statystycznych. Na przykład w badaniu reprezentacyjnym budżetów rodzinnych pracowników i pracowników w określonych sektorach gospodarki wydajność pracy pracowników w przedsiębiorstwie reprezentowana przez odrębne grupy według kwalifikacji.

Typowa próbka daje dokładniejsze wyniki w porównaniu z innymi metodami doboru jednostek w zestawie próbek. Typizacja populacji ogólnej zapewnia reprezentatywność takiej próby, reprezentację w niej każdej grupy typologicznej, co pozwala wykluczyć wpływ rozrzutu międzygrupowego na średni błąd próby.

Przy ustalaniu średni błąd typowej próbki jako wskaźnik zmienności jest średnia wariancji wewnątrzgrupowych.

Średni błąd próbkowania znajdują się we wzorach:

* dla średniej cechy ilościowej

(reselekcja); (formularz 11)

(wybór nieodwracalny); (formularz 12)

* dla akcji (charakterystyka alternatywna)

(reselekcja); (formularz 13)

(wybór nie powtarzalny), (form. 14)

gdzie jest średnią wariancji wewnątrzgrupowych dla populacji próby;

Średnia wariancji wewnątrzgrupowych udziału (cechy alternatywnej) w populacji próby.

seryjne pobieranie próbek polega na losowym doborze z ogólnej populacji nie pojedynczych jednostek, ale ich równorzędnych grup (gniazd, szeregów) w celu poddania wszystkich jednostek bez wyjątku obserwacji w takich grupach.

Stosowanie seryjnego pobierania próbek wynika z faktu, że wiele towarów do ich transportu, przechowywania i sprzedaży jest pakowanych w paczki, pudła itp. Dlatego przy kontroli jakości pakowanych towarów bardziej racjonalne jest sprawdzanie kilku opakowań (serii) niż wybieranie wymaganej ilości towaru ze wszystkich opakowań.

Ponieważ w obrębie grup (szeregów) badane są wszystkie jednostki bez wyjątku, średni błąd próbkowania (przy wyborze równych szeregów) zależy tylko od wariancji międzygrupowej (międzyseryjnej).

W Średni błąd próbkowania dla średniego wyniku podczas selekcji seryjnej znajdują się one według wzorów:

(reselekcja); (formularz 15)

(wybór nie powtarzalny), (formularz 16)

gdzie r- liczba wybranych serii; R-łączna liczba odcinków.

Wariancję międzygrupową próbki seryjnej oblicza się w następujący sposób:

gdzie jest średnia? i- seria; - ogólna średnia dla całej populacji próby.

W Średni błąd próbkowania dla udziału (funkcja alternatywna) w doborze seryjnym:

(reselekcja); (formularz 17)

(wybór nie powtarzalny). (formularz 18)

Międzygrupa(między seriami) wariancja udziału próbki seryjnej określone wzorem:

, (formularz 19)

gdzie jest udział funkcji w i seria; - łączny udział cechy w całej próbie.

W praktyce badań statystycznych, oprócz wcześniej rozważanych metod selekcji, stosuje się ich kombinację (wybór łączony).

Pojęcie obserwacji selektywnej.

Przy statystycznej metodzie obserwacji możliwe jest zastosowanie dwóch metod obserwacji: ciągłej, obejmującej wszystkie jednostki populacji, oraz selektywnej (nieciągłej).

Przez dobór próby rozumie się metodę badawczą związaną z ustaleniem wskaźników uogólniających populację dla niektórych jej części w oparciu o metodę doboru losowego.

Przy obserwacji wybiórczej badaniu poddaje się stosunkowo niewielką część całej populacji (5-10%).

Całość do zbadania nazywa się ogólna populacja.

Część jednostek wybranych z populacji ogólnej, która jest objęta badaniem, nazywa się próbka populacji lub próbka.

Wskaźniki charakteryzujące populację ogólną i próbną:

1) Udział znaku alternatywnego;

W populacja odsetek jednostek, które mają jakąś alternatywną cechę, oznaczono literą „P”.

W operat losowania proporcja jednostek, które mają jakiś alternatywny atrybut, oznaczono literą „w”.

2) Średnia wielkość znaku;

W populacjaśrednia wielkość obiektu jest oznaczona literą (średnia ogólna).

W operat losowaniaśredni rozmiar cechy jest oznaczony literą (średnia z próby).

Definicja błędu próbkowania.

Obserwacja selektywna opiera się na zasadzie równej możliwości doboru jednostek z populacji ogólnej do próby. Pozwala to uniknąć systematycznych błędów obserwacyjnych. Jednak ze względu na fakt, że badana populacja składa się z jednostek o różnej charakterystyce, skład próby może odbiegać od składu populacji ogólnej, powodując rozbieżności między charakterystyką ogólną a charakterystyką próby.

Takie rozbieżności nazywane są błędami reprezentatywności lub błędami próbkowania.

Wyznaczenie błędu próbkowania jest głównym zadaniem do rozwiązania podczas obserwacji selektywnej.

W statystyce matematycznej udowodniono, że średni błąd próbkowania określa wzór:

gdzie m jest błędem próbkowania;

s 2 0 to wariancja populacji ogólnej;

n to liczba jednostek próbki.

W praktyce wariancja populacji próbnej s 2 służy do określenia średniego błędu próbkowania.

Istnieje równość między wariancjami ogólnymi i próbnymi:

(2).

Ze wzoru (2) widać, że ogólna wariancja jest większa niż wariancja próbki o wartość (). Jednak dla odpowiednio dużej liczebności próby stosunek ten jest bliski jedności, więc możemy napisać, że

Jednak ten wzór na określenie średniego błędu próbkowania ma zastosowanie tylko do ponownego próbkowania.

W praktyce jest zwykle używany nie powtarzalny wybór a średni błąd próbkowania oblicza się nieco inaczej, ponieważ wielkość próby zmniejsza się w trakcie badania:

(4)

gdzie n jest wielkością próbki;

N to wielkość populacji ogólnej;

s 2 - wariancja próbki.

Dla proporcji alternatywnej cechy, średni błąd próbkowania przy brak ponownego wyboru określa wzór:

(5), gdzie

w (1-w) - średni błąd udziału próbki cechy alternatywnej;

w to udział alternatywnej cechy populacji próby.

Na ponowna selekcjaśredni błąd udziału cechy alternatywnej określa uproszczony wzór:

(6)

Jeśli wielkość próbki nie przekracza 5%,średni błąd udziału próby i średniej próby określają uproszczone wzory (3) i (6).

Wyznaczenie średniego błędu średniej próbki i udziału próbki jest konieczne do ustalenia możliwych wartości średniej ogólnej (x) i udziału ogólnego (P) na podstawie średniej próbki (x) i udziału próbki (w).

Jedną z możliwych wartości, w których znajduje się średnia ogólna, określa wzór:

Dla udziału ogólnego ten przedział można zapisać jako :

(8)

Uzyskane w ten sposób charakterystyki udziału i średniej w populacji ogólnej różnią się od wartości udziału próby i średniej próby o wartość m. Nie można tego jednak zagwarantować z całkowitą pewnością, ale tylko z pewnym prawdopodobieństwem.

W statystyce matematycznej udowodniono, że granice wartości cech średniej ogólnej i średniej z próby różnią się o m tylko z prawdopodobieństwem 0,683. Dlatego tylko w 683 przypadkach na 1000 ogólna średnia mieści się w granicach x= x m x, w innych przypadkach przekroczy te granice.

Prawdopodobieństwo ocen można zwiększyć, rozszerzając granice odchyleń, przyjmując jako miarę średni błąd próbkowania, powiększony o t razy.

Czynnik t nazywany jest współczynnikiem ufności. Określa się go w zależności od poziomu ufności, z jakim konieczne jest zagwarantowanie wyników badania.

Matematyk A.M. Lyapushev obliczył różne wartości t, które zwykle podaje się w gotowych tabelach.

Najnowsze artykuły w sekcji:

Największe operacje przeprowadzone podczas ruchu partyzanckiego
Największe operacje przeprowadzone podczas ruchu partyzanckiego

Partyzancka operacja „Koncert” Partyzanci to ludzie, którzy ochotniczo walczą w ramach zbrojnych zorganizowanych sił partyzanckich na ...

Meteoryty i asteroidy.  Asteroidy.  komety.  meteory.  meteoryty.  Geograf to asteroida w pobliżu Ziemi, która jest albo podwójnym obiektem, albo ma bardzo nieregularny kształt.  Wynika to z zależności jego jasności od fazy obrotu wokół własnej osi
Meteoryty i asteroidy. Asteroidy. komety. meteory. meteoryty. Geograf to asteroida w pobliżu Ziemi, która jest albo podwójnym obiektem, albo ma bardzo nieregularny kształt. Wynika to z zależności jego jasności od fazy obrotu wokół własnej osi

Meteoryty to małe kamienne ciała pochodzenia kosmicznego, które wpadają w gęste warstwy atmosfery (na przykład jak planeta Ziemia) i ...

Słońce rodzi nowe planety (2 zdjęcia) Niezwykłe zjawiska w kosmosie
Słońce rodzi nowe planety (2 zdjęcia) Niezwykłe zjawiska w kosmosie

Na Słońcu od czasu do czasu dochodzi do potężnych eksplozji, ale to, co odkryli naukowcy, zaskoczy wszystkich. Amerykańska Agencja Kosmiczna...