Предельная ошибки средней величины формула. Средняя и предельная ошибки выборки

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки, которые свойственны только выборочным наблюдениям. Данные показа­тели отражают разность между выборочными и соответствую­щими генеральными показателями.

Средняя ошибкавыборки определяется прежде всего объе­мом выборки и зависит от структуры и степени варьирования изучаемого признака.

Смысл средней ошибки выборки заключается в следующем. Рассчитанные значения выборочной доли (w) и выборочной средней ()по своей природе случайные величины. Они могут принимать различные значения в зависимости от того, какие кон­кретные единицы генеральной совокупности попадут в выборку. Например, если при определении среднего возраста работников предприятия в одну выборку включить больше молодежи, а в другую - работников старшего возраста, то выборочные средние и ошибки выборки будут разными. Средняя ошибка выборки определяется по формуле:

(27) или - повторная выборка. (28)

Где: μ – средняя ошибка выборки;

σ – среднее квадратическое отклонение признака в генеральной совокупности;

n – объем выборки.

Величина ошибки μ показывает, насколько среднее значение признака, установленное по выборке, отличается от истинного значения признака в генеральной совокупности.

Из формулы следует, что ошибка выборки прямо пропорциональна среднему квадратическому отклонению и обратно пропорциональна корню квадратному из числа единиц, попавших в выборку. Это означает, например, что чем больше разброс значений признака в генеральной совокупности, то есть чем больше дисперсия, тем больше должен быть объем выборки, если мы хотим доверять результатам выборочного обследования. И, наоборот, при малой дисперсии можно ограничиться небольшим числом выборочной совокупности. Ошибка выборки при этом будет находиться в приемлемых пределах.

Поскольку при бесповторном отборе численность генеральной совокупности N в ходе выборки сокращается, то в формулу для расчета средней ошибки выборки включают дополнительный множитель

(1- ). Формула средней ошибки выборки принимает следующий вид:

Средняя ошибка меньше у бесповторной выборки, что и обусловливает ее более широкое применение.

Для практических выводов нужна характеристика генеральной совокупности на основе выборочных результатов. Выборочные средние и доли распространяются на генеральную совокупность с учетом предела их возможной ошибки, причем с гарантирующим ее уровнем вероятности. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения и определяют предельную ошибку выборки.

Надежностью (доверительной вероятностью) оценки Х по Х* называют вероятность γ , с которой осуществляется неравенство


׀Х-Х*׀< δ, (30)

где δ – предельная ошибка выборки, характеризующая ширину интервала, в котором с вероятностью γ находится значение исследуемого параметра генеральной совокупности.

Доверительным называют интервал (Х* - δ; Х* + δ), который покрывает исследуемый параметр Х (то есть значение параметра Х находится внутри этого интервала) с заданной надежностью γ.

Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице: 0,95; 0,99 или 0,999.

Предельная ошибка δ связана со средней ошибкой μ следующим соотношением: , (31)

где: t – коэффициент доверия, зависящий от вероятности P, с которой можно утверждать, что предельная ошибка δ не превысит t-кратную среднюю ошибку μ (его еще называют критическими точками или квантилями распределения Стьюдента).

Как следует из соотношения , предельная ошибка прямо пропорциональна средней ошибке выборки и коэффициенту доверия, зависящему от заданного уровня надежности оценки.

Из формулы средней ошибки выборки и соотношения предельной и средней ошибок получаем:

С учетом доверительной вероятности эта формула примет вид.

Как известно, в статистике существует два способа наблюдения массовых явлений в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное наблюдение.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным образом.

Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

Совокупность отобранных для обследования единиц в статистике принято называть выборочной совокупностью , а совокупность единиц, из которых производится отбор, называют генеральной совокупностью . Основные характеристики генеральной и выборочной совокупности представлены в таблице 1.

Таблица 1 - Основные характеристики генеральной и выборочной совокупности
Показатель Обозначение или формула
Генеральная совокупность Выборочная совокупность
Число единиц N n
Число единиц, обладающих каким-либо признаком M m
Доля единиц, обладающих этим признаком p = M/N ω = m/n
Доля единиц, не обладающих этим признаком q = 1 - p 1 - ω
Средняя величина признака
Дисперсия признака
Дисперсия альтернативного признака (дисперсия доли) pq ω (1 - ω)

При проведении выборочного наблюдения возникают систематические и случайные ошибки. Систематические ошибки возникают в силу нарушения правил отбора единиц в выборку. Изменив правила отбора, от таких ошибок можно избавиться.

Случайные ошибки возникают в силу несплошного характера обследования. Иначе их называют ошибками репрезентативности (представительности). Случайные ошибки разделяют на средние и предельные ошибки выборки, которые определяются как при расчете признака, так и при расчете доли.

Средние и предельные ошибки связаны следующим соотношением : Δ = tμ , где Δ - предельная ошибка выборки, μ - средняя ошибка выборки, t - коэффициент доверия, определяемый в зависимости от уровня вероятности. В таблице 2 приведены некоторые значения t, взятые из теории вероятностей.

Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Основные формулы для расчета ошибок выборки представлены в таблице 3.

Таблица 3 - Основные формулы для расчета ошибок выборки при повторном и бесповторном отборе
Показатель Обозначение и формула
Генеральная совокупность Выборочная совокупность
Средняя ошибка признака при случайном повторном отборе
Средняя ошибка доли при случайном повторном отборе
Предельная ошибка признака при случайном повторном отборе
Предельная ошибка доли при случайном повторном отборе
Средняя ошибка признака при случайном бесповторном отборе
Средняя ошибка доли при случайном бесповторном отборе
Предельная ошибка признака при случайном бесповторном отборе
Предельная ошибка доли при случайном бесповторном отборе

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности .

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

Пределы доли признака в генеральной совокупности р.

Примеры решения задач по теме «Выборочное наблюдение в статистике»

Задача 1 . Имеется информация о выпуске продукции (работ, услуг), полученной на основе 10% выборочного наблюдения по предприятиям области:

Определить: 1) по предприятиям, включенным в выборку: а) средний размер произведенной продукции на одно предприятие; б) дисперсию объема производства; в) долю предприятий с объемом производства продукции более 400 тыс. руб.; 2) в целом по области с вероятностью 0,954 пределы, в которых можно ожидать: а) средний объем производства продукции на одно предприятие; б) долю предприятий с объемом производства продукции более 400 тыс. руб.; 3) общий объем выпуска продукции по области.

Решение

Для решения задачи расширим предложенную таблицу.

1) По предприятиям, включенным в выборку, средний размер произведенной продукции на одно предприятие

110800/400 = 277 тыс. руб.

Дисперсию объема производства вычислим упрощенным способом σ 2 = 35640000/400 – 277 2 = 89100 - 76229 = 12371.

Число предприятий, объем производства продукции которых превышает 400 тыс. руб. равно 36+12 = 48, а их доля равна ω = 48:400 = 0,12 = 12%.

2) Из теории вероятности известно, что при вероятности Р=0,954 коэффициент доверия t=2. Предельная ошибка выборки

2√12371:400 = 11,12 тыс. руб.

Установим границы генеральной средней: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12

Предельная ошибка выборки доли предприятий

2√0,12*0,88/400 = 0,03

Определим границы генеральной доли: 0,12-0,03≤ р ≤0,12+0,03; 0,09≤ р ≤0,15

3) Поскольку рассматриваемая группа предприятий составляет 10% от общего числа предприятий области, то в целом по области насчитывается 4000 предприятий. Тогда общий объем выпуска продукции по области лежит в пределах 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Задача 2 . По результатам контрольной проверки налоговыми службами 400 бизнес-структур, у 140 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению. Определите в генеральной совокупности (по всему району) долю бизнес-структур, скрывших часть доходов от уплаты налогов, с вероятностью 0,954.

Решение

По условию задачи число единиц в выборочной совокупности n=400, число единиц, обладающих рассматриваемым признаком m=140, вероятность Р=0,954.

Из теории вероятностей известно, что при вероятности Р=0,954 коэффициент доверия t=2.

Долю единиц, обладающих указанным признаком, определим по формуле: p=w+∆p, где w = m/n=140/400=0,35=35%,
а предельную ошибку признака ∆p получим из формулы: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Тогда р = 35±5%.

Ответ : Доля бизнес-структур, скрывших часть доходов от уплаты налогов с вероятностью 0,954 равна 35±5%.

Понятие о выборочном наблюдении.

Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой их части, отобранной в случайном порядке.

Причины применения выборочного наблюдения:

1. Экономия материальных, трудовых, финансовых ресурсов и времени.

2. Выбранное наблюдение часто приводит к повышению точности данных, т.к. уменьшение числа единиц наблюдения резко снижает ошибки регистрации величин признака (описки, недоучет, двойной счет…).

3. Выборочное наблюдение является единственно возможным, если наблюдение сопровождается полной или частичной порчей наблюдаемых объектов (качество партий яиц, прочность тканей и т.д.).

Ту часть единиц, которые отобраны для наблюдения, принято называть выборочной совокупностью или просто выборкой , а всю совокупность единиц, из которых производится отбор, - генеральной совокупностью .

Принята следующая система обозначения показателей для выбранной и генеральной совокупности.

В зависимости от применения техники отбора разделяют выборку серийную (гнездовую) и типологическую.

· В случае типологической выборки генеральная совокупность разделяется на типы (группы, районы), а затем производится случайный отбор единиц из каждого типа.

· При серийной выборке выбирают не единицы, а определенные серии, группы, районы, внутри которых производится сплошное наблюдение.

Существуют два способа отбора единиц в выборочную совокупность:

- повторный отбор

каждая попавшая в выборку единица возвращается в генеральную совокупность и имеет шанс вторично попасть в выборку.

- бесповторный отбор

отобранная единица не возвращается в генеральную совокупность, а для оставшихся единиц вероятность попасть в выборку увеличивается. Бесповторный отбор дает более точные результаты, но иногда его провести нельзя (исследование потребительского спроса).

Качество результатов выборочного наблюдения зависит от того, насколько состав выборки представляет генеральную совокупность, иначе говоря, от того, на сколько выборка репрезентативна (представительна). Для обеспечения репрезентативности выборки необходимо соблюдение принципа случайности отбора единиц.

Ошибка выборки

Понятие и виды ошибок выборки

Поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности.

Расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки .

Виды ошибок выборки

Основная задача выборочного метода – изучение случайных ошибок репрезентативности.

Средняя ошибка выборки

Случайная ошибка репрезентативности зависит от следующих фактов (при этом считается, что ошибок регистрации нет):

1. Чем больше численность выборки при прочих равных условиях, тем меньше величина ошибки выборки, т.е. ошибка выборки обратно пропорциональна ее численности.

2. Чем меньше варьирование признака, тем меньше ошибка выборки. Если признак совсем не варьирует, а, следовательно, величина дисперсии равна нулю, то ошибки выборки не будет, т.к. любая единица совокупности будет совершенно точно характеризовать всю совокупность по этому признаку. Таким образом, ошибка выборки прямо пропорциональна величине дисперсии.

В математической статистике доказывается, что величина средней ошибки случайной повторной выборки может быть определена по формуле

Однако следует иметь в виду, что величина дисперсии в генеральной совокупности s 2 нам не известна, т.к. наблюдение выборочное. Мы можем рассчитать лишь дисперсию в выборочной совокупности S 2 . Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой:

(6.2)

Если n велико, следовательно

s 2 = S 2

И формула средней ошибки повторной выборки (6.1.) примет вид:

Но здесь мы рассмотрели только ошибку выборки для средней величины интересующего признака. Существует также показатель доли единиц с интересующим признаком. Расчет ошибки этого показателя имеет свои особенности.

Дисперсия для показателя доли признака определяется по формуле:

S 2 =w(1-w) (6.4)

Тогда средняя ошибка повтора выборки для показателя доли признака будет равна:

(6.5)

Доказательство формул (6.3) и (6.5) исходит из схемы повторной выборки. Обычно же выборку организуют бесповторным способом. Т.к. при бесповторном отборе численность генеральной совокупности N в коде выборки сокращается, то в формулы ошибки выборки включают дополнительный множитель , и формулы принимают вид:

(6.6)

(6.7)

Пример 1. Определим, на сколько отличаются выборочные и генеральные показатели по данным 10%-ной бесповторной выборки успеваемости студентов.

Расчет ошибки бесповторной выборки для средней величины:

n = 100 N = 1000

Найдем выборочную дисперсию по формуле:

Здесь не известна величина , которую можно найти как обычную среднюю взвешенную величину:

Таким образом,

Т.е. можно сказать, что средний балл всех студентов () равен 3,65±0,07

Теперь рассчитаем долю студентов в генеральной совокупности, обучающихся на «4» и «5».

Найдем по выборке долю студентов, получивших оценки «4» и «5».

(или 64%)

Расчет ошибки бесповторной выборки для доли производится по формуле:

(или 4,5%)

Таким образом, доля студентов, обучающихся на «4» и «5» по генеральной совокупности (P )составляет 0,64±0,045 (или 64%±4,5%).

Предельная ошибка выборки

То, что генеральная средняя и генеральная доля не выйдут за определенные пределы можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности.

В математической статистике доказано, что генеральные характеристики отклоняются от выборочных на величину ошибки выборки (±m) , лишь с вероятностью 0,683. Применительно к выборочным исследованиям это понимается так, что значения пределов можно гарантировать лишь в 683 случаях из 1000. В остальных же 317 случаях значения этих пределов будут иными.

Вероятность суждения можно повысить, если расширить пределы отклонений, приняв в качестве меры среднюю ошибку выборки, увеличенную в t раз.

Т.е. с определенной степенью вероятности мы можем утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки D (дельта):

где t – коэффициент доверия (коэффициент кратности ошибки), определяемый в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты выборочного исследования.

На практике пользуются таблицами, где вычислены вероятности для различных значений t . Приведем некоторые из них.

t Вероятность t Вероятность
0,5 0,383 2,0 0,954
1,0 0,683 2,5 0,988
1,5 0,866 3,0 0,997

Например, если в нашем примере мы хотим увеличить вероятность суждения до 0,954, то мы берем t = 2 и таким образом изменяем пределы отклонений среднего балла всех студентов и доли студентов, обучающихся на «4» и «5».

То есть, (6.9)

То есть, (6.10)

При выборочном наблюдении должна быть обеспечена слу-чайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно-случайная выборка.

К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного рас-членения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного спосо-ба, например, с помощью таблицы случайных чисел. Случай-ный отбор -- это отбор не беспорядочный. Принцип случай-ности предполагает, что на включение или исключение объ-екта из выборки не может повлиять какой-либо фактор, кро-ме случая. Примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущен-ных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля выборки есть отношение числа единиц выборочной со-вокупности к числу единиц генеральной совокупности:

Так, при 5%-ной выборке из партии деталей в 1000 ед. объ-ём выборки п составляет 50 ед., а при 10%-ной выборке -- 100 ед. и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальным значениям, в результате -- выборочное наблюдение становится достаточно точным.

Собственно-случайный отбор «в чистом виде» применяет-ся в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину ко-личественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой сово-купности только наличием изучаемого признака).

Выборочная доля (w), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п:

Например, если из 100 деталей выборки (n =100), 95 деталей оказались стандартными =95), то выборочная доля

w =95/100=0,95 .

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки ? или, иначе говоря, ошибка репрезента-тивности представляет собой разность соответствующих выбо-рочных и генеральных характеристик:

*

*

Ошибка выборки свойственна только выборочным наблюде-ниям. Чем больше значение этой ошибки, тем в большей степе-ни выборочные показатели отличаются от соответствующих генеральных показателей.

Выборочная средняя и выборочная доля по своей сути яв-ляются случайными величинами, которые могут принимать раз-личные значения в зависимости от того, какие единицы сово-купности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возмож-ных ошибок -- среднюю ошибку выборки.

От чего зависит средняя ошибка выборки? При соблюдении принципа случайного отбора средняя ошибка выборки определя-ется прежде всего объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки также зависит от степени варьи-рования изучаемого признака. Степень варьирования, как из-вестно, характеризуется дисперсией? 2 или w(1-w) -- для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка вы-борки, и наоборот. При нулевой дисперсии (признак не варь-ирует) средняя ошибка выборки равна нулю, т. е. любая еди-ница генеральной совокупности будет совершенно точно ха-рактеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степе-ни варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (х,p) неизвестны, и следовательно, не представляется возмож-ным нахождение реальной ошибки выборки непосредственно по формулам (форм. 1), (форм. 2).

Ш При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

* для средней количественного признака

* для доли (альтернативного признака)

Поскольку практически дисперсия признака в генеральной совокупности? 2 точно неизвестна, на практике пользуются значением дисперсии S 2 , рассчитанным для выборочной сово-купности на основании закона больших чисел, согласно кото-рому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики гене-ральной совокупности.

Таким образом, расчетные формулы средней ошиб-ки выборки при случайном повторном отборе будут следующие:

* для средней количественного признака

* для доли (альтернативного признака)

Однако дисперсия выборочной совокупности не равна диспер-сии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (форм. 5) и (форм. 6), будут прибли-женными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением:

Так как п/ (n -1) при достаточно больших п -- величина, близкая к единице, то можно принять, что, а следова-тельно, в практических расчетах средних ошибок выборки мож-но использовать формулы (форм. 5) и (форм. 6). И только в случаях ма-лой выборки (когда объем выборки не превышает 30) необхо-димо учитывать коэффициент п /(n -1) и исчислять среднюю ошибку малой выборки по формуле:

Ш X При случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подко-ренное выражение умножить на 1-(n/N), поскольку в процес-се бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной вы-борки расчетные формулы средней ошибки выборки примут такой вид:

* для средней количественного признака

* для доли (альтернативного признака)

. (форм. 10)

Так как п всегда меньше N , то дополнительный множи-тель 1-(n/N ) всегда будет меньше единицы. Отсюда следу-ет, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к еди-нице (например, при 5%-ной выборке он равен 0,95; при 2%-ной -- 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (форм. 5) и (форм. 6) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N неизвестно или безгра-нично, или когда п очень мало по сравнению с N , и по су-ществу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по ней-тральному признаку на равные интервалы (группы), произво-дится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематиче-ской ошибки, отбираться должна единица, которая находится в середине каждой группы.

При организации механического отбора единицы совокуп-ности предварительно располагают (обычно в списке) в опре-деленном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого-либо по-казателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через оп-ределенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2%-ной выборке отбирается и проверяется каждая 50-я единица (1: 0,02), при 5%-ной выборке -- каждая 20-я едини-ца (1: 0,05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. По-этому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной вы-борки (форм. 9), (форм. 10).

Для отбора единиц из неоднородной совокупности применя-ется, так называемая типическая выборка , которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении слож-ных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдель-ных отраслях экономики, производительности труда рабочих пред-приятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выбороч-ную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представи-тельство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки.

При определении средней ошибки типической выборки в ка-честве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам:

* для средней количественного признака

(повторный отбор); (форм. 11)

(бесповоротный отбор); (форм. 12)

* для доли (альтернативного признака)

(повторный отбор); (форм.13)

(бесповторный отбор), (форм. 14)

где - средняя из внутригрупповых дисперсий по вы-борочной совокупности;

Средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.

Серийная выборка предполагает случайный отбор из генераль-ной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюде-нию все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить не-сколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.

Поскольку внутри групп (серий) обследуются все без исключе-ния единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Ш Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:

(повторный отбор); (форм.15)

(бесповторный отбор), (форм. 16)

где r - число отобранных серий; R - общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют сле-дующим образом:

где - средняя i - й серии; - общая средняя по всей выбо-рочной совокупности.

Ш Средняя ошибка выборки для доли (альтернативного при-знака) при серийном отборе:

(повторный отбор); (форм. 17)

(бесповторный отбор). (форм. 18)

Межгрупповую (межсерийную) дисперсию доли серийной вы-борки определяют по формуле:

, (форм. 19)

где - доля признака в i -й серии; - общая доля признака во всей выборочной совокупности.

В практике статистических обследований помимо рассмот-ренных ранее способов отбора применяется их комбинация (комбинированный отбор).

Понятие о выборочном наблюдении.

При статистическом методе наблюдения возможно применение двух методов наблюдения: сплошного, охватывающего все единицы совокупности, и выборочного (несплошного).

Под выборочным понимается метод исследования, связанный с установлением обобщающих показателей совокупности по некоторой ее части на основе метода случайного отбора.

При выборочном наблюдении обследованию подвергается сравнительно небольшая часть всей совокупности (5-10%).

Вся совокупность, подлежащая обследованию, называется генеральной совокупностью .

Отобранная из генеральной совокупности часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой.

Показатели, характеризующие генеральную и выборочную совокупность:

1) Доля альтернативного признака;

В генеральной совокупности доля единиц, обладающих каким-либо альтернативным признаком, обозначается буквой «Р».

В выборочной совокупности доля единиц, обладающих каким-либо альтернативным признаком, обозначается буквой «w».

2) Средний размер признака;

В генеральной совокупности средний размер признака обозначается буквой (генеральная средняя).

В выборочной совокупности средний размер признака обозначается буквой (выборочная средняя).

Определение ошибки выборки.

Выборочное наблюдение основано на принципе равной возможности попадания единиц генеральной совокупности в выборочную. Это позволяет избежать систематических ошибок наблюдения. Однако, в связи с тем, что исследуемая совокупность состоит из единиц с варьирующими признаками, состав выборки может отличаться от состава генеральной совокупности, вызывая расхождения между генеральными и выборочными характеристиками.

Такие расхождения называются ошибками репрезентативности или ошибками выборки.

Определение ошибки выборки – основная задача, решаемая при выборочном наблюдении.

В математической статистике доказывается, что средняя ошибка выборки определяется по формуле:

Где m - ошибка выборки;

s 2 0 – дисперсия генеральной совокупности;

n – количество единиц выборочной совокупности.

На практике для определения средней ошибки выборки используется дисперсия выборочной совокупности s 2 .

Между генеральной и выборочной дисперсиями существует равенство:

(2).

Из формулы (2) видно, что генеральная дисперсия больше выборочной на величину (). Однако при достаточно большой величине выборки это соотношение близко к единице, поэтому можно записать, что

Однако такая формула для определения средней ошибки выборки применяется только при повторном отборе.

На практике обычно применяется бесповторный отбор и средняя ошибка выборки рассчитывается несколько иначе, так как численность выборки в ходе исследования сокращается:

(4)

где n – численность выборочной совокупности;

N – численность генеральной совокупности;

s 2 - выборочная дисперсия.

Для доли альтернативного признака средняя ошибка выборки при бесповторном отборе определяется по формуле:

(5), где

w (1-w) - средняя ошибка выборочной доли альтернативного признака;

w – доля альтернативного признака выборочной совокупности.

При повторном отборе средняя ошибка доли альтернативного признака определяется по упрощенной формуле:

(6)

Если численность выборки не превышает 5%, средняя ошибка выборочной доли и выборочной средней определяется по упрощенным формулам (3) и (6).

Определение средней ошибки выборочной средней и выборочной доли необходимо для установления возможных значений генеральной средней (х) и генеральной доли (Р) на основе выборочной средней (х) и выборочной доли (w).

Одно из возможных значений, в пределах которого находится генеральная средняя, определяется по формуле:

Для генеральной доли этот интервал можно записать в виде:

(8)

Полученные таким образом характеристики доли и средней в генеральной совокупности отличаются от величины выборочной доли и выборочной средней на величину m. Однако гарантировать это можно не с полной уверенностью, а лишь с определенной степенью вероятности.

В математической статистике доказывается, что пределы значений характеристик генеральной и выборочной средней отличаются на величину m лишь с вероятностью 0,683. Следовательно, только в 683 случаях из 1000 генеральная средняя находится в пределах х= х m х, в остальных случаях она выйдет за эти пределы.

Вероятность суждений можно повысить, если расширить пределы отклонений, приняв в качестве меры среднюю ошибку выборки, увеличенную в t раз.

Множитель t называют коэффициентом доверия. Он определяется в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты исследования.

Математик А.М.Ляпушев рассчитал различные значения t , которые обычно приводятся в готовых таблицах.

Последние материалы раздела:

Презентация на тему
Презентация на тему "квадратный корень из произведения" Разложение на простые множители

Ученики всегда спрашивают: «Почему нельзя пользоваться калькулятором на экзамене по математике? Как извлечь корень квадратный из числа без...

Буденный Семён Михайлович (), советский военачальник, маршал Советского Союза (1935 г
Буденный Семён Михайлович (), советский военачальник, маршал Советского Союза (1935 г

история создания песни "Марш Буденного", презентация,фонограмма и текст песни. Скачать:Предварительный просмотр:Конкурс «Военная песня» «Марш...

Бактерии- древние организмы
Бактерии- древние организмы

Археология и история – это две науки, тесно переплетенные между собой. Археологические исследования дают возможность узнать о прошлом планеты,...