Гранична грешка на формулата за средна стойност. Средни и пределни извадкови грешки

За да се характеризира надеждността на извадковите показатели, се прави разлика между средни и пределни извадкови грешки, които са характерни само за извадкови наблюдения. Тези показатели отразяват разликата между извадката и съответните общи показатели.

Средна грешка на извадкатасе определя основно от размера на извадката и зависи от структурата и степента на вариация на изследвания признак.

Значението на средната извадкова грешка е следното. Изчислените стойности на фракцията на пробата (w) и средната стойност на пробата () са по своята същност случайни променливи. Те могат да приемат различни стойности в зависимост от това кои конкретни единици от генералната съвкупност попадат в извадката. Например, ако при определяне на средната възраст на служителите на едно предприятие в една извадка са включени повече млади хора, а в друга по-възрастни работници, тогава средните стойности на извадката и грешките на извадката ще бъдат различни. Средна извадкова грешкасе определя по формулата:

(27) или - повторно вземане на проби. (28)

Където: μ е средната извадкова грешка;

σ е стандартното отклонение на признак в общата съвкупност;

n е размерът на извадката.

Стойността на грешката μ показва как средната стойност на признака, установена от извадката, се различава от истинската стойност на признака в генералната съвкупност.

От формулата следва, че грешката на извадката е право пропорционална на стандартното отклонение и обратно пропорционална на корен квадратен от броя на единиците в извадката. Това означава, например, че колкото по-голямо е разпространението на стойностите на дадена характеристика в общата съвкупност, тоест колкото по-голяма е дисперсията, толкова по-голям трябва да бъде размерът на извадката, ако искаме да се доверим на резултатите от извадково проучване . Обратно, при малка вариация човек може да се ограничи до малък брой извадкови популации. Тогава грешката на извадката ще бъде в приемливи граници.

Тъй като размерът на генералната съвкупност N по време на извадката намалява по време на неповтаряща се селекция, във формулата за изчисляване на средната грешка на извадката е включен допълнителен фактор

(едно-). Формулата за средната грешка на извадката приема следната форма:

Средната грешка е по-малка при неповтарящо се вземане на проби, което го прави по-широко използван.

Практическите заключения изискват характеризиране на генералната съвкупност въз основа на резултати от извадки. Извадковите средни и пропорции се прилагат към генералната съвкупност, като се отчита границата на тяхната възможна грешка и с ниво на вероятност, което го гарантира. При определено ниво на вероятност се избира стойността на нормализираното отклонение и се определя пределната грешка на извадката.

Надеждност (вероятност за доверие) на оценката X по X*наречена вероятност γ , с което неравенството

׀Х-Х*׀< δ, (30)

където δ е пределната извадкова грешка, характеризираща ширината на интервала, в който се намира стойността на изследвания параметър на генералната съвкупност с вероятност γ.

Доверенназовете интервала (X* - δ; X* + δ), който покрива изследвания параметър X (т.е. стойността на параметъра X е вътре в този интервал) с дадена надеждност γ.

Обикновено надеждността на оценката се задава предварително и число, близко до единица, се приема като γ: 0,95; 0,99 или 0,999.

Ограничителната грешка δ е свързана със средната грешка μ както следва: , (31)

където: t е коефициентът на доверие, зависещ от вероятността P, с който може да се твърди, че пределната грешка δ няма да надвишава t-кратната средна грешка μ (нарича се още критични точки или квантили на разпределението на Стюдънт).

Както следва от съотношението, пределната грешка е право пропорционална на средната грешка на извадката и коефициента на доверие, който зависи от даденото ниво на надеждност на оценката.

От формулата за средната извадкова грешка и съотношението на пределните и средните грешки получаваме:

Като се вземе предвид вероятността за доверие, тази формула ще приеме формата.

Както е известно, в статистиката има два начина за наблюдение на масовите явления в зависимост от пълнотата на обхващане на обекта: непрекъснат и прекъснат. Разновидност на прекъснатото наблюдение е селективното наблюдение.

Под селективно наблюдение се разбира като непродължително наблюдение, при което единици от изследваната съвкупност, избрани на случаен принцип, се подлагат на статистическо изследване (наблюдение).

Селективното наблюдение си поставя за задача да характеризира цялата съвкупност от единици за изследваната част, при спазване на всички правила и принципи на статистическото наблюдение и научно организирана работа по избора на единици.

Наборът от единици, избрани за проучването в статистиката, обикновено се нарича извадкова популация , и се извиква множеството единици, от които се прави изборът общо население . Основните характеристики на генералната и извадковата съвкупност са представени в таблица 1.

Маса 1 - Основните характеристики на генералната и извадковата съвкупност

Индекс	Обозначение или формула
Индекс	Население	Извадкова популация
Брой единици	н	н
Броят единици, които имат функция	М	м
Съотношение на единици с тази характеристика	p = M/N	ω = m/n
Пропорция на единици, които нямат тази функция	q = 1 - p	1 - w
*Средна стойност* знак
*дисперсия* знак
Разпръскване на алтернативен признак (разпръскване на дял)	pq	ω (1 - ω)

При провеждане на селективно наблюдение възникват систематични и случайни грешки. Систематичните грешки възникват поради нарушаване на правилата за избор на единици в извадката. Чрез промяна на правилата за избор такива грешки могат да бъдат елиминирани.

Случайните грешки възникват поради прекъснатия характер на изследването. В противен случай те се наричат грешки на представителността (представителността). Случайните грешки се делят на средни и пределни извадкови грешки, които се определят както при изчисляване на признака, така и при изчисляване на дела.

Средната и граничната грешка са свързани със следната връзка :Δ = tμ, където Δ е пределната извадкова грешка, μ е средната извадкова грешка, t е доверителният фактор, определен в зависимост от нивото на вероятност. Таблица 2 показва някои стойности на t, взети от теорията на вероятностите.

Стойността на средната грешка при вземане на проби се изчислява диференцирано в зависимост от метода на подбор и процедурата за вземане на проби. Основните формули за изчисляване на извадковите грешки са представени в таблица 3.

Таблица 3 - Основни формули за изчисляване на грешки при вземане на проби при повтаряща се и неповтаряща се селекция

Индекс	Обозначение и формула
Индекс	Население	Извадкова популация
Средна грешка на функцията за случайно повторно вземане на проби
Грешка на средния дял за случайно повторно вземане на проби
Ограничете грешката на функция в случай на произволен повторен избор
Гранична грешка при споделяне при произволен повторен избор
Средна грешка на функция за случаен неповтарящ се избор
Грешка на средния дял при случаен неповтарящ се избор
Гранична грешка на функция с произволен неповтарящ се избор
Грешка в пределния дял за случаен неповтарящ се избор

Изчисляването на средните и пределните грешки на извадката ви позволява да определите възможните граници, в които ще бъдат характеристиките на генералната съвкупност .

Например, за примерна средна стойност, такива граници се определят въз основа на следните отношения:

Граници на дела на признака в генералната съвкупност Стр.

Примери за решаване на проблеми по темата "Наблюдение на извадката в статистиката"

Задача 1 . Има информация за производството на продукти (работи, услуги), получена на базата на 10% извадково наблюдение на предприятията в региона:

Определете: 1) за предприятията, включени в извадката: а) средния размер на продукцията на предприятие; б) дисперсия на обема на производството; в) делът на предприятията с производствен обем над 400 хиляди рубли; 2) за региона като цяло, с вероятност 0,954, границите, в които може да се очаква: а) среден обем на производството на предприятие; б) делът на предприятията с производствен обем над 400 хиляди рубли; 3) общият обем на продукцията в региона.

Решение

За да разрешим проблема, разширяваме предложената таблица.

1) За предприятията, включени в извадката, средният размер на продукцията на предприятие

110800/400 = 277 хиляди рубли

Изчисляваме дисперсията на обема на производството по опростен начин σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Броят на предприятията, чийто обем на производство надвишава 400 хиляди рубли. е равно на 36+12 = 48, а делът им е равен на ω = 48:400 = 0,12 = 12%.

2) От теорията на вероятностите е известно, че с вероятност P=0,954 факторът на доверие t=2. Пределна извадкова грешка

2√12371:400 = 11,12 хиляди рубли

Да поставим границите на общата авария: 277-11.12 ≤Xav ≤ 277+11.12; 265,88 ≤Xav ≤ 288,12

Пределна извадкова грешка на дела на предприятията

2√0,12*0,88/400 = 0,03

Да определим границите на общия дял: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ p≤0,15

3) Тъй като разглежданата група предприятия е 10% от общия брой на предприятията в региона, общо в района има 4000 предприятия. Тогава общият обем на продукцията в региона е в рамките на 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Задача 2 . Според резултатите от контролна ревизия на данъчните власти на 400 бизнес структури, 140 от тях не посочват изцяло подлежащите на облагане доходи в данъчните си декларации. Определете в генералната съвкупност (за целия регион) дела на бизнес структурите, укрили част от данъчните си приходи с вероятност 0,954.

Решение

Съгласно условието на задачата броят на единиците в извадковата съвкупност е n=400, броят на единиците с разглеждания признак е m=140, вероятността е P=0,954.

От теорията на вероятностите е известно, че при вероятност P=0,954 факторът на доверие t=2.

Делът на единиците, които имат посочения атрибут, се определя по формулата: p=w+∆p, където w = m/n=140/400=0,35=35%,
и граничната грешка на характеристиката ∆p се получава от формулата: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Тогава p = 35±5%.

Отговор : Делът на бизнес структурите, укрили част от данъчните си приходи с вероятност 0,954 е 35±5%.

Концепцията за селективно наблюдение.

Селективенсе нарича такова наблюдение, при което характеристиката на цялото множество от единици е дадена според някои от техните части, избрани в произволен ред.

Причини за използване на селективно наблюдение:

1. Икономия на материални, трудови, финансови средства и време.

2. Избраното наблюдение често води до повишаване на точността на данните, тъй като намаляването на броя на единиците за наблюдение рязко намалява грешките при регистриране на стойностите на знака (печатни грешки, недостатъчно броене, двойно броене ...).

3. Селективното наблюдение е единственото възможно, ако наблюдението е придружено от пълно или частично увреждане на наблюдаваните обекти (качество на партидите яйца, здравина на тъканите и др.).

Тази част от единиците, които са избрани за наблюдение, обикновено се наричат извадкова популацияили просто вземане на проби, и целия набор от единици, от които се прави изборът - общо население.

Възприета е следната система за обозначаване на показателите за избраната и генералната съвкупност.

В зависимост от прилагането на техниката на подбор извадката се разделя на серийна (вложена) и типологична.

· Кога типологиченизвадка, генералната съвкупност се разделя на типове (групи, области), след което се прави случаен подбор на единици от всеки тип.

· При сериенизвадката се избира не по единици, а по определени серии, групи, области, в рамките на които се извършва непрекъснато наблюдение.

Има два начина за избор на единици в извадка:

- преизбиране

всяка единица в извадката се връща в общата съвкупност и има шанс да бъде повторно взета проба.

- неповтаряща се селекция

избраната единица не се връща към съвкупността и е по-вероятно останалите единици да бъдат включени в извадката. Неповтарящото се вземане на проби дава по-точни резултати, но понякога не може да се направи (изследване на потребителското търсене).

Качеството на резултатите от вземането на проби зависи от степента, в която съставът на извадката представя генералната съвкупност, с други думи, от това колко извадката Представител(Представител). За да се осигури представителност на извадката, е необходимо да се спазва принципът на случаен подбор на единици.

Грешка при вземане на проби

Концепцията и видовете извадкови грешки

Тъй като изследваната статистическа съвкупност се състои от единици с различни характеристики, съставът на извадката може да се различава до известна степен от състава на генералната съвкупност.

Несъответствието между характеристиките на извадката и генералната съвкупност е грешка при вземане на проби.

Видове извадкови грешки

Основната задача на извадковия метод е да изследва случайните грешки на представителността.

Средна извадкова грешка

Случайната грешка на представителност зависи от следните факти (приема се, че няма грешки при регистрация):

1. Колкото по-голям е размерът на извадката, при равни други условия, толкова по-малка е грешката на извадката, т.е. грешката на извадката е обратно пропорционална на нейния размер.

2. Колкото по-малка е вариацията на атрибута, толкова по-малка е грешката на извадката. Ако знакът изобщо не се променя и следователно дисперсията е нула, тогава няма да има извадкова грешка, тъй като всяка единица от съвкупността ще характеризира точно цялата популация на тази основа. По този начин грешката на извадката е право пропорционална на големината на дисперсията.

В математическата статистика е доказано, че стойността на средната грешка при произволна повторна извадка може да се определи по формулата

Трябва обаче да се има предвид, че величината на дисперсията в общата съвкупност s2не знаем, защото селективно наблюдение. Можем да изчислим дисперсията само в извадката S2. Съотношението между дисперсиите на генералната и извадковата съвкупност се изразява по формулата:

(6.2)

Ако нголеми, следователно

s2 = S2

И формулата за средната грешка при повторно вземане на проби (6.1.) ще приеме формата:

Но тук сме разгледали само грешката на извадката за средната стойност на интересуващата ни характеристика. Има и индикатор за съотношението на единиците с интересна характеристика. Изчисляването на грешката на този индикатор има свои собствени характеристики.

Дисперсията за показателя характерен дял се определя по формулата:

S 2 \u003d w (1-w) (6.4)

Тогава средната извадкова грешка за мярката на дела на характеристиката ще бъде равна на:

(6.5)

Доказателството на формули (6.3) и (6.5) започва от схемата за повторно вземане на проби. Обикновено извадката е организирана по неповтарящ се начин. защото с неповтаряща се селекция, размерът на генералната съвкупност нсе съкращава в кода за вземане на проби, тогава във формулите за грешка на вземане на проби се включва допълнителен фактор , и формулите приемат формата:

(6.6)

(6.7)

Пример 1. Да определим колко се различават извадката и общите показатели според данните от 10% неповторена извадка от представянето на учениците.

Изчисляване на грешката без повторно вземане на проби за средната стойност:

н= 100 н= 1000

Намерете дисперсията на примера, като използвате формулата:

Тук стойността не е известна, която може да се намери като обикновена среднопретеглена стойност:

По този начин,

Тези. можем да кажем, че средният резултат на всички ученици () е 3,65 ± 0,07

Сега нека изчислим дела на учениците в общата съвкупност, които учат за "4" и "5".

Въз основа на извадката ще намерим дела на учениците, получили оценки „4” и „5”.

(или 64%)

Изчисляването на грешката без повторна извадка за дела се извършва по формулата:

(или 4,5%)

Така делът на учениците, записани на "4" и "5" в общата съвкупност ( П) е 0,64±0,045 (или 64%±4,5%).

Пределна извадкова грешка

Фактът, че общата авария и общият дял няма да надхвърлят определени граници, може да се твърди не с абсолютна сигурност, а само с известна степен на вероятност.

В математическата статистика е доказано, че общите характеристики се отклоняват от извадковите с размера на извадковата грешка (± м), само с вероятност от 0,683. По отношение на извадковите изследвания това се разбира като означаващо, че стойностите на лимитите могат да бъдат гарантирани само в 683 случая от 1000. В останалите 317 случая стойностите на тези лимити ще бъдат различни.

Вероятността за преценка може да се увеличи чрез разширяване на границите на отклонение, като се вземе като мярка средната грешка на извадката, увеличена с Tведнъж.

Тези. с определена степен на вероятност можем да твърдим, че отклоненията на характеристиките на извадката от общите няма да надвишават определена стойност, която се нарича пределна грешка на извадката D (делта):

където T– коефициент на достоверност (коефициент на множественост на грешките), определен в зависимост от нивото на достоверност, с което е необходимо да се гарантират резултатите от извадково изследване.

На практика се използват таблици, в които се изчисляват вероятностите за различни стойности T. Нека да разгледаме някои от тях.

T	Вероятност	T	Вероятност
0,5	0,383	2,0	0,954
1,0	0,683	2,5	0,988
1,5	0,866	3,0	0,997

Например, ако в нашия пример искаме да увеличим вероятността за преценка до 0,954, тогава вземаме T= 2 и по този начин се променят границите на отклонения на средния резултат на всички ученици и дела на учениците, записани на "4" и "5".

Тоест (6.9)

Тоест (6.10)

По време на селективното наблюдение трябва да се гарантира злополукаизбор на единица. Всяка единица трябва да има равни възможности да бъде избрана с останалите. На това се основава произволната извадка.

Да се подходяща произволна извадка се отнася до подбора на единици от цялата генерална съвкупност (без предварителното й разделяне на каквито и да е групи) чрез теглене на жребий (основно) или друг подобен метод, например, като се използва таблица със случайни числа. Случаен изборТози избор не е случаен. Принципът на случайността предполага, че включването или изключването на обект от извадката не може да бъде повлияно от друг фактор освен случайността. Пример всъщност произволноселекцията може да служи като циркулация на печалбите: от общия брой издадени билети определена част от числата, които отчитат печалбите, се избират на случаен принцип. Освен това всички числа имат еднаква възможност да попаднат в извадката. В този случай броят на избраните единици в набора от извадки обикновено се определя въз основа на приетата част от извадката.

Примерен дял е съотношението на броя на единиците от извадката от съвкупността към броя на единиците от генералната съвкупност:

Така че, с 5% проба от партида части в 1000 единици. размер на извадката Пе 50 бр., а при 10% проба - 100 бр. и т.н. С правилната научна организация на вземането на проби грешките в представителността могат да бъдат намалени до минимални стойности, в резултат на което селективното наблюдение става достатъчно точно.

Правилният случаен подбор "в чист вид" рядко се използва в практиката на селективното наблюдение, но той е отправната точка сред всички останали видове подбор, той съдържа и прилага основните принципи на селективното наблюдение.

Нека разгледаме някои въпроси от теорията на метода на вземане на проби и формулата за грешка за проста случайна извадка.

При прилагането на извадковия метод в статистиката обикновено се използват два основни вида обобщаващи показатели: средната стойност на количествен признаки относителната стойност на алтернативния признак(частта или съотношението на единици в статистическата популация, които се различават от всички останали единици на тази популация само по наличието на изследваната черта).

Примерен дял (w),или честота, се определя от съотношението на броя на единиците, които имат изследваната характеристика T,към общия брой на пробните единици П:

Например, ако от 100 примерни подробности ( н=100), 95 части се оказаха стандартни (T=95), след това фракцията на пробата

w=95/100=0,95 .

За характеризиране на надеждността на примерните показатели има средатаи пределна извадкова грешка.

Грешка при вземане на проби ? или, с други думи, грешката в представителността е разликата между съответната извадка и общите характеристики:

Грешката на извадката е характерна само за селективни наблюдения. Колкото по-голяма е стойността на тази грешка, толкова повече извадковите показатели се различават от съответните общи показатели.

Извадковата средна стойност и извадковият дял са присъщи случайни променливи,които могат да приемат различни стойности в зависимост от това кои единици от съвкупността са включени в извадката. Следователно грешките на извадката също са случайни променливи и могат да приемат различни стойности. Следователно, определете средната стойност на възможните грешки - средната грешка на извадката.

От какво зависи средна грешка при вземане на проби?При спазване на принципа на случаен подбор се определя основно средната грешка на извадката размер на извадката:колкото по-голяма е съвкупността, при други равни условия, толкова по-малка е средната грешка на извадката. Покривайки извадково изследване с нарастващ брой единици от генералната съвкупност, ние все по-точно характеризираме цялата съвкупност.

Средната извадкова грешка също зависи от степен на вариацияизучавана черта. Степента на вариация, както знаете, се характеризира с дисперсия? 2 или w(1-w)-- за алтернативна функция. Колкото по-малка е вариацията на характеристиката, а оттам и дисперсията, толкова по-малка е средната извадкова грешка и обратно. При нулева дисперсия (атрибутът не се променя), средната извадкова грешка е нула, т.е. всяка единица от генералната съвкупност ще характеризира точно цялата съвкупност според този атрибут.

Зависимостта на средната извадкова грешка от нейния обем и степента на вариация на атрибута се отразява във формулите, които могат да се използват за изчисляване на средната извадкова грешка при условия на извадково наблюдение, когато общите характеристики ( x,p)са неизвестни и следователно не е възможно да се намери истинската извадкова грешка директно от формулите (форм. 1), (форм. 2).

У С случаен избор средни грешкитеоретично изчислено по следните формули:

* за средния количествен признак

* за дял (алтернативна характеристика)

Тъй като на практика вариацията на атрибута в генералната съвкупност? 2 не е точно известна, на практика те използват стойността на дисперсията S 2, изчислена за извадковата популация на базата на закона за големите числа, според който извадковата популация с достатъчно голям размер на извадката точно възпроизвежда характеристиките на общо население.

По този начин, формули за изчисление средата грешки при вземане на проби произволното повторно вземане на проби ще бъде както следва:

* за средния количествен признак

* за дял (алтернативна характеристика)

Дисперсията на извадковата съвкупност обаче не е равна на дисперсията на генералната съвкупност и следователно средните извадкови грешки, изчислени по формулите (формуляр 5) и (формуляр 6), ще бъдат приблизителни. Но в теорията на вероятностите е доказано, че общата дисперсия се изразява чрез избираемата чрез следната връзка:

защото П/(н-1) за достатъчно големи П --стойност, близка до единица, може да се приеме, че и следователно при практически изчисления на средните грешки на извадката могат да се използват формули (форм. 5) и (форм. 6). И само в случаите на малка извадка (когато размерът на извадката не надвишава 30) е необходимо да се вземе предвид коеф. П/(н-1) и изчислете средна грешка на малка извадкапо формулата:

W X С произволен неповтарящ се избор в горните формули за изчисляване на средните грешки при вземане на проби е необходимо коренният израз да се умножи по 1-(n / N), тъй като броят на единиците в генералната съвкупност се намалява в процеса на неповтарящо се вземане на проби. Следователно, за неповтаряща се селекция формули за изчисление средна извадкова грешка ще приеме следната форма:

* за средния количествен признак

* за дял (алтернативна характеристика)

. (форм. 10)

защото Пвинаги по-малко н, тогава допълнителният фактор 1-( n/N) винаги ще бъде по-малко от едно. От това следва, че средната грешка при неповтаряща се селекция винаги ще бъде по-малка, отколкото при повторна селекция. В същото време при относително малък процент от извадката този коефициент е близък до единица (например при 5% проба е 0,95; при 2% извадка е 0,98 и т.н.). Поради това понякога в практиката се използват формули (формуляри 5) и (формуляри 6) за определяне на средната извадкова грешка без посочения множител, въпреки че извадката е организирана като неповторна. Това се случва, когато броят на единиците от генералната съвкупност N е неизвестен или неограничен, или когато Пмного малко в сравнение с н, и по същество въвеждането на допълнителен фактор, близък по стойност до единица, практически няма да повлияе на стойността на средната извадкова грешка.

Механично вземане на проби се състои в това, че подборът на единици в извадката от генерала, разделен по неутрален критерий на равни интервали (групи), се извършва по такъв начин, че от всяка такава група в извадката се избира само една единица. За да се избегне систематична грешка, трябва да се избере единицата, която е в средата на всяка група.

Когато се организира механичен подбор, единиците от съвкупността са предварително подредени (обикновено в списък) в определен ред (например по азбучен ред, по местоположение, във възходящ или низходящ ред на стойностите на всеки индикатор, който не е свързан с изследваното имущество и др.) и т.н.), след което механично, през определен интервал, се избира даден брой единици. В този случай размерът на интервала в генералната съвкупност е равен на реципрочната стойност на извадковия дял. Така че, с 2% проба, всяка 50-та единица (1: 0,02) се избира и проверява, с 5% проба, всяка 20-та единица (1: 0,05), например, низходящ детайл от машината.

При достатъчно голяма популация механичният подбор по отношение на точността на резултатите е близък до правилния случаен. Следователно, за да се определи средната грешка на механична проба, се използват формулите за самослучайно неповтарящо се вземане на проби (форм. 9), (форм. 10).

За подбор на единици от разнородна съвкупност, т.нар типична проба , който се използва в случаите, когато всички единици от генералната съвкупност могат да бъдат разделени на няколко качествено хомогенни, сходни групи според характеристиките, които влияят върху изследваните показатели.

При изследването на предприятията такива групи могат да бъдат например отрасъл и подотрасъл, форми на собственост. След това от всяка типична група се прави индивидуален подбор на единици в извадката чрез произволна или механична извадка.

Типична извадка обикновено се използва при изследване на сложни статистически съвкупности. Например, при извадково изследване на семейните бюджети на работниците и служителите в определени сектори на икономиката, производителността на труда на работниците в предприятието, представена от отделни групи умения.

Типичната извадка дава по-точни резултати в сравнение с други методи за избор на единици в набор от проби. Типизацията на генералната съвкупност осигурява представителността на такава извадка, представянето на всяка типологична група в нея, което позволява да се изключи влиянието на междугруповата дисперсия върху средната грешка на извадката.

При определяне средна грешка на типична пробакато индикатор за вариация е средната стойност на вътрешногруповите дисперсии.

Средната грешка на извадката се намират по формулите:

* за средния количествен признак

(преизбор); (форм. 11)

(необратима селекция); (форм. 12)

* за дял (алтернативна характеристика)

(преизбор); (форм.13)

(неповтаряща се селекция), (форм. 14)

където е средната стойност на вътрешногруповите дисперсии за извадката от съвкупността;

Средната стойност на вътрешногруповите дисперсии на дела (алтернативен признак) в извадката от съвкупността.

серийно вземане на проби включва случаен подбор от общата съвкупност не на отделни единици, а на техните равни групи (гнезда, серии), за да бъдат подложени на наблюдение всички единици без изключение в такива групи.

Използването на серийно вземане на проби се дължи на факта, че много стоки за тяхното транспортиране, съхранение и продажба са опаковани в пакети, кутии и др. Следователно, когато контролирате качеството на опакованите стоки, е по-рационално да проверите няколко пакета (серии), отколкото да изберете необходимото количество стоки от всички пакети.

Тъй като в рамките на групи (серии) се изследват всички единици без изключение, средната грешка на извадката (при избиране на равни серии) зависи само от междугруповата (междусерийната) дисперсия.

У Средната извадкова грешка за средния резултат по време на сериен избор те се намират по формулите:

(преизбор); (форм.15)

(неповтаряща се селекция), (форм. 16)

където р-брой избрани серии; Р-общ брой епизоди.

Междугруповата дисперсия на серийната проба се изчислява, както следва:

къде е средното аз- та серия; - общата средна стойност за цялата извадка.

У Средна извадкова грешка за дял (алтернативна функция) в сериен избор:

(преизбор); (форм. 17)

(неповтаряща се селекция). (форм. 18)

Интергрупа(между серии) дисперсия на дела на серийната пробаопределя се по формулата:

, (форм. 19)

къде е делът на функцията в азта серия; - общият дял на признака в цялата извадка.

В практиката на статистическите изследвания, в допълнение към разгледаните по-горе методи за подбор, се използва тяхната комбинация (комбинирана селекция).

Концепцията за селективно наблюдение.

При статистическия метод на наблюдение е възможно да се използват два метода на наблюдение: непрекъснат, обхващащ всички единици от съвкупността, и селективен (непрекъснат).

Извадковият метод се разбира като метод на изследване, свързан с установяването на обобщаващи показатели на съвкупността за някои от нейните части въз основа на метода на случаен подбор.

При селективно наблюдение сравнително малка част от цялата популация (5-10%) се подлага на изследване.

Съвкупността, която трябва да се изследва, се нарича общо население.

Нарича се частта от единиците, избрани от генералната съвкупност, която подлежи на изследване извадкова популацияили проба.

Показатели, характеризиращи генералната и извадковата съвкупност:

1) дял на алтернативен знак;

AT населениеделът на единиците, които имат някаква алтернативна характеристика, се обозначава с буквата "P".

AT рамка за вземане на пробиделът на единиците, които имат някакъв алтернативен атрибут, се обозначава с буквата "w".

2) Средният размер на знака;

AT населениесредният размер на характеристика се обозначава с буква (обща средна).

AT рамка за вземане на пробисредният размер на характеристика се обозначава с буква (извадково средно).

Дефиниция на извадкова грешка.

Селективното наблюдение се основава на принципа на еднаква възможност за включване на единици от генералната съвкупност в извадката. Това избягва систематични грешки при наблюдение. Въпреки това, поради факта, че изследваната съвкупност се състои от единици с различни характеристики, съставът на извадката може да се различава от състава на генералната съвкупност, което води до несъответствия между общите и извадковите характеристики.

Такива несъответствия се наричат грешки на представителността или грешки на извадката.

Определянето на грешката на извадката е основната задача, която трябва да се реши по време на селективното наблюдение.

В математическата статистика е доказано, че средната грешка на извадката се определя по формулата:

Където m е грешката на извадката;

s 2 0 е дисперсията на генералната съвкупност;

n е броят на извадковите единици.

На практика дисперсията на извадковата съвкупност s 2 се използва за определяне на средната грешка на извадката.

Налице е равенство между генералните и извадковите дисперсии:

(2).

От формула (2) се вижда, че общата дисперсия е по-голяма от дисперсията на извадката със стойността (). Въпреки това, за достатъчно голям размер на извадката, това съотношение е близо до единица, така че можем да запишем това

Въпреки това, тази формула за определяне на средната грешка на извадката е приложима само за повторно вземане на проби.

На практика обикновено се използва неповтаряща се селекцияи средната извадкова грешка се изчислява малко по-различно, тъй като размерът на извадката се свива в хода на изследването:

(4)

където n е размерът на извадката;

N е размерът на генералната съвкупност;

s 2 - дисперсия на извадката.

За съотношението на алтернативна характеристика, средната извадкова грешка при без преизбиранесе определя по формулата:

(5), където

w (1-w) - средната грешка на извадковия дял на алтернативния признак;

w е делът на алтернативната характеристика на извадката.

При повторна селекциясредната грешка на дела на алтернативен атрибут се определя по опростена формула:

(6)

Ако размерът на извадката не надвишава 5%,средната грешка на извадковия дял и извадковата средна стойност се определят по опростени формули (3) и (6).

Определянето на средната грешка на извадковата средна стойност и извадковия дял е необходимо, за да се установят възможните стойности на общата средна (x) и общия дял (P) въз основа на извадковата средна (x) и извадковия дял (w).

Една от възможните стойности, в рамките на които се намира общата средна стойност, се определя по формулата:

За общия дял този интервал може да се запише като :

(8)

Получените по този начин характеристики на дела и средното в генералната съвкупност се различават от стойността на извадковия дял и извадковото средно по стойност м.Това обаче не може да се гарантира с пълна сигурност, а само с известна степен на вероятност.

В математическата статистика е доказано, че границите на стойностите на характеристиките на общата и извадкова средна се различават с мсамо с вероятност от 0,683. Следователно само в 683 случая от 1000 общата средна е в рамките x= x m x,в други случаи ще надхвърли тези граници.

Вероятността от преценки може да се увеличи чрез разширяване на границите на отклоненията, като се вземе като мярка средната грешка на извадката, увеличена с t пъти.

Факторът t се нарича фактор на доверие. Определя се в зависимост от нивото на достоверност, с което е необходимо да се гарантират резултатите от изследването.

Математикът А. М. Ляпушев изчислява различни стойности на t, които обикновено се дават в готови таблици.