Что больше генеральная совокупность или выборочная. Генеральная совокупность и выборка

Генеральная совокупность – совокупность элементов, удовлетворяющих неким заданным условиям; именуется также изучаемой совокупностью. Генеральная совокупность (Universe) - все множество объектов (субъектов) исследования, из которого выбираются (могут выбираться) объекты (субъекты) для обследования (опроса).

ВЫБОРКА или выборочная совокупность (Sample) - это множество объектов (субъектов), отобранных специальным образом для обследования (опроса). Любые данные, полученные на основании выборочного обследования (опроса), имеют вероятностный характер. На практике это означает, что в ходе исследования определяется не конкретное значение, а интервал, в котором определяемое значение находится.

Характеристики выборки:

Качественная характеристика выборки – что именно мы выбираем и какие способы построения выборки мы для этого используем.

Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки:

Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

Существует необходимость в сборе первичной информации.

Объём выборки - число случаев, включённых в выборочную совокупность.

Зависимые и независимые выборки.

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми .

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми.

Типы выборки.

Выборки делятся на два типа:

Вероятностные;

Не вероятностные;

Репрезентативная выборка - выборочная совокупность, в которой основные характеристики совпадают с характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки - наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

17. Дискретный вариационный ряд, ранжирование, частота, частность.

Вариационным рядом (статистическим рядом) – называется последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд может быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

Наблюдаемые значения случайной величины х1, х2, …, хk называются вариантами, а изменение этих значений называются варьированием.

Выборка (выборочная совокупность) – совокупность наблюдений, отобранных случайным образом из генеральной совокупности.

Число наблюдений в совокупности называется ее объемом.

N – объем генеральной совокупности.

n – объем выборки(сумма всех частот ряда).

Частотой варианты хi называется число ni (i=1,…,k), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты хi (i=1,…,k) называется отношение ее частоты ni к объему выборки n.
wi =ni /n

Ранжирование опытных данных - операция, заключающаяся в том, что результаты наблюдений над случайной величиной, т. е. наблюдаемые значения случайной величины, располагают в порядке неубывания.

Дискретным вариационным рядом распределения называется ранжированная совокупность вариантов хi с соответствующими им частотами или частностями.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm – очень полезный сайт!

Выборочный метод исследования является основным статистическим методом. Это естественно, так как объем изучаемых объектов как правило бесконечен (и даже, если конечен, то весьма затруднительно перебрать все объекты, приходится довольствоваться лишь их частью, выборкой).

Генеральная и выборочная совокупности

Генеральной совокупностью называется совокупность всех исследуемых в данном эксперименте элементов.

Выборочной совокупностью (или выборкой) называется конечная совокупность объектов, случайно отобранных из генеральной совокупности.

Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности.

Пример генеральной и выборочной совокупностей

Допустим, исследуется психологическая предрасположенность человека к делению данного отрезка в отношении золотого сечения. Так как происхождение самого понятия золотого сечения продиктовано антропометрией человеческого тела, то понятно, что в данном случае генеральной совокупностью является любое антропогенное существо достигшее физической зрелости и приобретшее окончательные пропорции, то есть - вся взрослая часть человечества. Объем этой совокупности практически бесконечен.

Если же эта предрасположенность исследуется исключительно в художественной среде, то генеральная совокупность - это люди, имеющие непосредственное отношение к дизайну: художники, архитекторы, дизайнеры. Таких людей тоже очень много, и можно считать, что объем генеральной совокупности в данном случае тоже бесконечен.

И в том, и в другом случае для исследования мы вынуждены ограничиться разумными объемами выборок, выбирая в качестве представителей той и другой совокупностей студентов технических специальностей (как людей, далеких от художественного мира) или студентов специальности дизайн (как людей, имеющих непосредственное отношение к миру художественных образов).

Репрезентативность

Основной проблемой выборочного метода является вопрос о том, насколько точно объекты, отобранные из генеральной совокупности для исследования, представляют изучаемые характеристики генеральной совокупности, то есть - вопрос о репрезентативности выборки.

Итак, выборка называется репрезентативной (представительной), если она достаточно точно представляет количественные соотношения генеральной совокупности.

Разумеется, трудно сказать, что именно скрывается за расплывчатой формулировкой достаточно точно . Вопросы репрезентативности вообще являются наиболее спорными в любом экспериментальном исследовании. Имеется масса ставших уже классическими примеров, когда недостаточная представительность выборки приводила экспериментаторов к абсурдным результатам.

Как правило, вопросы репрезентативности решаются при помощи экспертной оценки, когда научное сообщество принимает точку зрения группы авторитетных специалистов по поводу корректности проведенного исследования.

Пример репрезентативности

Вернемся к примеру с делением отрезка. Вопросы репрезентативности выборок лежат здесь в самой основе исследования: мы ни в коем случае не должны смешивать группы испытуемых по признаку принадлежности их к художественной среде.

Статистическое распределение наблюдаемого признака

Частота наблюдаемого значения

Пусть в результате испытания в выборке объема наблюдаемый признакпринял значения,, …, причем значениенаблюдалосьраз, значение-раз, и т. д., значениенаблюдалосьраз. Тогда частотой наблюдаемого значенияназывается число, значения- числои т. д.

Относительная частота наблюдаемого значения

Относительной частотой наблюдаемого значенияпризнаканазывается отношение частотык объемувыборки:

Понятно, что сумма частот наблюдаемого признака должна давать объем выборки

а сумма относительных частот должна давать единицу:

Эти соображения можно использовать для контроля при составлении статистических таблиц. Если равенства не соблюдаются, то при протоколировании результатов эксперимента была допущена ошибка.

Статистическое распределение наблюдаемого значения

Статистическим распределением наблюдаемого признака называется соответствие между наблюдаемыми значениями признака и отвечающими им частотами (или относительными частотами).

Как правило, статистическое распределение записывается в виде двухстрочной таблицы, в которой в первой строке указываются наблюдаемые значения признака, а во второй - соответствующие им частоты (или относительные частоты):

Если наблюдаемый признак характеризуется непрерывной случайной величиной , принимающей значения из интервала, то его статистическое распределение описывается частотами попадания в частичные интервалы:

Это наука, которая, основываясь на методах теории вероятностей, занимается систематизацией и обработкой статистических данных для получения научных и практических выводов.

Статистическими данными называются сведения о числе объектов, обладающих теми или иными признаками.

Группа объектов, объединенных по некоторому качественному или количественному признаку, называется статистической совокупностью . Объекты, входящие в совокупность, называются её элементами, а их общее число - ее объемом.

Генеральной совокупностью называется множество всех мыслимо возможных наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий или более строго: генеральной совокупностью называется случайная величина x и связанное с ней вероятностное пространство {W,Á,Р}.

Распределение случайной величины x называют распределением генеральной совокупности (говорят, например, о нормально распределенной или просто нормальной генеральной совокупности).

Например, если производится ряд независимых измерений случайной величины x, то генеральная совокупность теоретически бесконечна (т.е. генеральная совокупность - абстрактное, условно - математическое понятие); если же проверяется число дефектных изделий в партии из N изделий, то эту партию рассматривают как конечную генеральную совокупность объема N.

В случае социально-экономических исследований генеральной совокупностью объема N может быть население какого-то города, региона или страны, а измеряемыми признаками - доходы, расходы или объем сбережений отдельно взятого человека. Если какой-то признак имеет качественный характер (например, пол, национальность, социальное положение, род деятельности и т.п.), но принадлежит к конечному множеству вариантов, то он может быть также закодирован числом (как это часто делают в анкетах).

Если число объектов N достаточно велико, то провести сплошное обследование затруднительно, а иногда физически невозможно (например, проверить качество всех патронов). Тогда случайным образом отбирают из всей генеральной совокупности ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью или просто выборкой объема n называется последовательность х 1 , х 2 , …, х n независимых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением случайной величины x.

Например, результаты n первых измерений случайной величины x принято рассматривать как выборку объема n из бесконечной генеральной совокупности. Полученные данные называют наблюдениями случайной величины x, а также говорят, что случайная величина x "принимает значения" х 1 , х 2 , …, х n .


Основная задача математической статистики - сделать научно обоснованные выводы о распределении одной или более неизвестных случайных величин или их взаимосвязи между собой. Метод, состоящий в том, что на основании свойств и характеристик выборки делаются заключения о числовых характеристиках и законе распределения случайной величины (генеральной совокупности) называется выборочным методом.

Для того, чтобы характеристики случайной величины, полученные выборочным методом, были объективны, необходимо, чтобы выборка была репрезентативной, т.е. достаточно хорошо представляла исследуемую величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно, т.е. все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку. Для этого существуют различные виды отбора выборки.

1. Простым случайным отбором называется отбор, при котором объекты извлекаются по одному из всей генеральной совокупности.

2. Стратифицированный (расслоенный ) отбор заключается в том, что исходная генеральная совокупность объема N подразделяется на подмножества (страты) N 1 , N 2 ,…,N k , так что N 1 + N 2 +…+ N k = N. Когда страты определены, из каждого из них извлекается простая случайная выборка объема n 1 , n 2 , …, n k . Частным случаем стратифицированного отбора является типический отбор, при котором объекты отбирают не из всей генеральной совокупности, а из каждой типической ее части.

Комбинированный отбор сочетает в себе сразу несколько видов отбора, образующих различные фазы выборочного обследования. Существуют и другие методы организации выборки.

Выборка называется повторной , если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной , если отобранный объект в генеральную совокупность не возвращается. Для конечной генеральной совокупности случайный отбор без возвращения приводит на каждом шаге к зависимости отдельных наблюдений, случайный равновозможный выбор с возвращением - к независимости наблюдений. На практике обычно имеют дело с бесповторными выборками. Тем не менее, когда объем генеральной совокупности N во много раз больше, чем объем выборки n (например, в сотни или тысячи раз), зависимостью наблюдений можно пренебречь.

Таким образом, случайная выборка х 1 , х 2 , …, х n - это результат последовательных и независимых наблюдений над случайной величиной ξ, представляющую генеральную совокупность, и все элементы выборки имеют тоже распределении, что исходная случайная величина x.

Функцию распределения F x (х) и другие числовые характеристики случайной величины x будем называть теоретическими, в отличие от выборочных характеристик , которые определяются по результатам наблюдений.

Пусть выборка х 1 , х 2 , …, х к есть результат независимых наблюдений случайной величины x, причем х 1 наблюдалось n 1 раз, х 2 - n 2 раза, …, х к - n к раз, так что n i = n - объем выборки. Число n i , показывающее, сколько раз появилось значение х i в n наблюдениях, называется частотой данного значения, а отношение n i /n = w i - относительной частотой . Очевидно, что числа w i рациональны и .

Статистическая совокупность, расположенная в порядке возрастания признака, называется вариационным рядом . Его члены обозначают x (1) , x (2), … x (n) и называют вариантами . Вариационный ряд называется дискретным , если его члены принимают конкретные изолированные значения. Статистическим распределением выборки дискретной случайной величины x называется перечень вариант и соответствующих им относительных частот w i . Полученная таблица называется статистическим рядом.

X (1) x (2) ... x k(k)
ω 1 ω 2 ... ω k

Наибольшее и наименьшее значения вариационного ряда обозначают x min и x max и называют крайними членами вариационного ряда.

Если изучается непрерывная случайная величина, то группировка заключается в разбиении интервала наблюдаемых значений на k частичных интервалов равной длины h, и подсчете числа попаданий наблюдений в эти интервалы. Полученные числа принимают за частоты n i (для некоторой новой, уже дискретной случайной величины). В качестве новых значений вариант x i обычно берутся середины интервалов (либо в таблице указываются сами интервалы). Согласно формуле Стерждеса рекомендуемое число интервалов разбиения k » 1 + log 2 n , а длины частичных интервалов равны h = (x max - x min)/k. Предполагается, что весь интервал имеет вид .

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или графика накопленных частот.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки (x 1 , n 1), (x 2 , n 2), …, (x k , n k). Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1), (x 2 , w 2), …, (x k , w k). Полигоны обычно служат для изображения выборки в случае дискретных случайных величин (рис. 7.1.1).

Рис. 7.1
.1.

Гистограммой относительных частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиною h , а высоты

равны w i /h.

Гистограмма обычно служит для изображения выборки в случае непрерывных случайных величин. Площадь гистограммы равна единице (рис. 7.1.2). Если на гистограмме относительных частот соединить середины верхних сторон прямоугольников, то полученная ломанная образует полигон относительных частот. Поэтому гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения f n (x). Если у теоретического распределения существует конечная плотность, то эмпирическая плотность является некоторым приближением теоретической.

Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные относительные частоты , т.е. величины . Эти величины не убывают, и график накопленных частот имеет вид ступенчатой "лестницы" (от 0 до 1).

График накопленных частот на практике используются для приближения теоретической функции распределения.

Задача. Анализируется выборка из 100 малых предприятий региона. Цель обследования - измерение коэффициента соотношения заемных и собственных средств (х i) на каждом i-ом предприятии. Результаты представлены в таблице 7.1.1.

Таблица Коэффициенты соотношений заемных и собственных средств предприятий.

5,56 5,45 5,48 5,45 5,39 5,37 5,46 5,59 5,61 5,31
5,46 5,61 5,11 5,41 5.31 5,57 5,33 5,11 5,54 5,43
5,34 5,53 5,46 5,41 5,48 5,39 5,11 5,42 5,48 5,49
5,36 5,40 5,45 5,49 5,68 5,51 5,50 5,68 5,21 5,38
5,58 5,47 5,46 5,19 5,60 5,63 5,48 5,27 5,22 5,37
5,33 5,49 5,50 5,54 5,40 5.58 5,42 5,29 5,05 5,79
5,79 5,65 5,70 5,71 5,85 5,44 5,47 5,48 5,47 5,55
5,67 5,71 5,73 5,05 5,35 5,72 5,49 5,61 5,57 5,69
5,54 5,39 5,32 5,21 5,73 5,59 5,38 5,25 5,26 5,81
5,27 5,64 5,20 5,23 5,33 5,37 5,24 5,55 5,60 5,51

Построить гистограмму и график накопленных частот.

Решение . Построим группированный ряд наблюдений:

1. Определим в выборке х min = 5,05 и x max = 5,85;

2. Разобьем весь диапазон на k равных интервалов: k » 1 + log 2 100 = 7,62; k = 8, отсюда длина интервала

Таблица 7.1.2. Сгруппированный ряд наблюдений

Номер Интервала Интервалы Середины интервалов х i w i f n (x)
5,05-5,15 5,1 0,05 0,05 0,5
5,15-5,25 5,2 0,08 0,13 0,8
5,25-5,35 5,3 0,12 0,25 1,2
5,35-5,45 5,4 0,20 0,45 2,0
5,45-5,55 5,5 0,26 0,71 2,6
5,55-5,65 5,6 0,15 0,86 1,5
5,65-5,75 5,7 0,10 0,96 1,0
5,75-5,85 5,8 0,04 1,00 0,4

На рис. 7.1.3 и 7.1.4, построенных по данным таблицы 7.1.2, представлены гистограмма и график накопленных частот. Кривые соответствуют плотности и функции нормального распределения, "подобранного" к данным.

Таким образом, распределение выборки является некоторым приближением распределения генеральной совокупности.

Необходимость проводить выборочные исследования, может быть вызвана различными причинами:

    часто полное исследование изучаемого явления слишком дорого стоящее и длительное;

    иногда возможность использовать полученную информацию при полном исследовании может исчерпаться раньше, чем завершится процесс его подготовки;

    в некоторых случаях в результате проверки качества изделия происходит уничтожение исследуемого объекта.

Пример:

    предположим, совокупность — это все учащиеся школы (600 человек из 20 классов, по 30 человек в каждом классе). Предмет изучения — отношение к курению.

Генеральная совокупность — это набор объектов, о которых необходимо получить информацию.

Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства, интересующие исследователя. Иногда генеральная совокупность — это все взрослое население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объекты исследования. Например, женщины 10-89 лет, использующие крем для рук определённой марки не реже одного раза в неделю, и имеющие доход не ниже 5 тысяч рублей на одного члена семьи.

Выборка — это небольшой набор объектов, извлеченных из генеральной совокупности.

Выборочная совокупность — это необходимый для исследования минимум результатов (случаев, испытуемых, объектов, событий, образцов) отобранных с помощью определённой процедуры из генеральной совокупности.

Примеры:

    выявление реакции клиентов фирмы на нововведения, все клиенты фирмы представляют собой генеральную совокупность. Те клиенты, которых обзвонили, образуют выборку.

    При аудиторской проверке фирм с большим числом сделок приходится довольствоваться изучением отобранного числа сделок. Все сделки фирмы образуют генеральную совокупность, отобранные — выборку.

    генеральную совокупность образуют все призывники определенного года.

    все лампы, изготовленные за определенное время на некотором предприятии, образуют генеральную совокупность. Те лампы, которые отобраны для контроля, — выбору.

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной. Выборка будет репрезентативной при обследовании большой группы людей, если внутри этой группы есть представители разных подгрупп, только так можно сделать верные выводы. .

Репрезентати́вность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана.

Также репрезентативность можно определить, как свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования.

Пример: выборка, состоящая из 60 учеников старших классов, гораздо хуже представляет совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого класса. Главной причиной тому — неравное возрастное распределение в классах. Следовательно, в первом случае репрезентативность выборки низкая, а во втором случае репрезентативность высокая (при прочих равных условиях).

Задача 1. В городе, насчитывающем 253 000 жителей, имеющих право голосовать, исследуйте политические симпатии будущих избирателей.

Решение

    Выборку можно построить, опрашивая каждого 15-о покупателя, выходящего из крупного торгового центра. Такая выборка будет отражать мнение посетителей торгового центра, но вряд ли будет представлять точку зрения всех жителей города.

    Другой метод построения выборки — провести опрос по телефону каждого 100-го жителя города, взяв номера из телефонного справочника. Такая систематическая выборка даст информацию о точке зрения группы людей, имеющих телефон, находящихся дома и отвечающих на телефонные звони. Но она не отражает мнения всех жителей города.

    Еще один метод построить выборку может заключаться в том, чтобы опросить участников митинга, организованного несколькими политическими партиями. Такая выборкка даст информацию о жителях, активно участвующих в политической жизни города.

Итак, нужны такие способы образования выборки, которые представляли бы всю генеральную совокупность, т. е. выборка должна быть репрезентативной (представительной).

Задача 2. Определить, является ли репрезентативной выборка:

1) число автомобильных аварий в июне, если необходимо составить статистический отчет по авариям в городе за год;

2) городские жители при подсчете числа автомобилей на душу населения в стране;

3) люди в возрасте от 40 до 50 лет при выяснении рейтинга молодежной телепрограммы.

Решение

1) Выборка не является репрезентативной. Летом нет снега и наледи на дорогах, а это одна из основных причин аварий.

2) Выборка не является репрезентативной. Понятно, что в городе машин намного больше, чем в сельских районах. Это необходимо учитывать.

3) Выборка не является репрезентативной. Люди в возрасте от 40 до 50 лет едва ли проявят интерес к программе, ориентированной на молодежную аудиторию. При использовании такой выборки рейтинг может сильно упасть, но это не отразит реального положения вещей. Для формирования выборочной совокупности применяются различные способы отбора. Статистические данные должны быть представлены так, чтобы ими можно было пользоваться.

Параметры генеральной совокупности и выборки

N - генеральная совокупность, которая подразделяется на страты N 1 , N 2 и так далее.

Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия — по отраслям). В этом случае выборки называются стратифицированными.

N - объем выборки.

В основе статистических выводов проведенного исследования лежит распределение случайной величины Х, наблюдаемые же значения х 1 , х 2 , х 3 называются реализациями случайной величины x.

Распределение случайной величины X в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением

Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение. При этом предположение о виде распределения может быть как статистически верным, так и ошибочным.

Но в любом случае восстановленное по выборке эмпирическое распределение лишь грубо характеризует истинное.

Важнейшими параметрами распределений являются математическое ожидание а и дисперсия σ 2 - мера разброса данных.

Стандартное отклонение σ - степень отклонения данных наблюдений или множеств от среднего значения.

Задача 3. Михаил вместе со своими друзьями решил измерить рост своих собак (по холке). Найдите: среднее значение; отклонение роста.

Решение

    Математическое ожидание или среднее значение можно найти по формуле:


    Теперь посчитаем отклонение роста каждой собаки от среднего или математического ожидания, то есть посчитаем дисперсию.


Стандартное отклонение это всего лишь квадратный корень из дисперсии.

σ \ = 147,32

Таким образом, зная стандартное отклонение мы знаем, что значит «нормальный рост», и что является очень высокой и очень маленькой собакой.

Ответ: 394, 21,704; 147,32.

Задача 4. Наблюдение в контрольной лаборатории за сроком годности 50 электроламп одинаковой мощности, взятых наудачу из большой партии выпущенных заводом ламп этой же мощности, привело к следующим данным о нарушении установленного гарантийного срока горения:

Отклонение в Ч

10 мального распределения, которое отражает отклонение фактического срока горения лампочек от гарантийного.

Решение.

Среднее отклонение

Таким образом, искомое нормальное распределение характеризуется следующими значениями параметров: а = 0,4; σ 2 = 318; σ = 17,8.

Отсюда плотность вероятности:

Соответствующая этой плотности функция распределения будет выглядеть:

Генеральная совокупность (в англ. - population ) - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.

Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность - это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, мужчины 30-50 лет, использующие бритву определённой марки не реже раза в неделю, и имеющие доход не ниже $100 на одного члена семьи.

Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Характеристики выборки:

· Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.

· Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки

· Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

· Существует необходимость в сборе первичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30 – 35.

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми . Примеры зависимых выборок:

· пары близнецов,

· два измерения какого-либо признака до и после экспериментального воздействия,

· мужья и жёны

· и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми , например:

· мужчины и женщины,

· психологи и математики.

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев:

· t-критерий Стьюдента

· Критерий Уилкоксона

· U-критерий Манна-Уитни

· Критерий знаков

· и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.

Пример нерепрезентативной выборки

В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 году . Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, а также людям, выбранным по телефонным книгам всей страны и людям из регистрационных списков автомобилей. В 25 % вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом:

· 57 % отдавали предпочтение кандидату-республиканцу Альфу Лэндону

· 40 % выбрали действующего в то время президента-демократа Франклина Рузвельта

На действительных же выборах, как известно, победил Рузвельт, набрав более 60 % голосов. Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, - так как им было известно, что большинство их подписчиков считают себя республиканцами, - они расширили выборку за счёт людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали ещё больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и высшего класса (то есть большинство республиканцев, а не демократов).

Виды плана построения групп из выборок

Выделяют несколько основных видов плана построения групп :

1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия.

2. Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора

3. Исследование с использованием только одной группы - экспериментальной.

4. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Типы выборки

Выборки делятся на два типа:

· вероятностные

· невероятностные

Вероятностные выборки

1. Простая вероятностная выборка:

o Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Процедура построения простой случайной выборки включает в себя следующие шаги:

1. необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;

2. определить предполагаемый объем выборки, то есть ожидаемое число опрошенных;

3. извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.

4. выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам

· Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:

1. зачастую сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.

2. результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

3. результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

4. в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки.

· Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.

1. Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.

2. Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.

3. Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.

4. «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.

Невероятностные выборки

Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.

1. Квотная выборка – выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих. Минусы: обычно такие выборки нерепрезентативны, т.к. нельзя учесть сразу несколько социальных параметров. Плюсы: легкодоступный материал.

2. Метод снежного кома. Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)

3. Стихийная выборка – выборка так называемого «первого встречного». Часто используется в теле- и радиоопросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов. Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.

4. Маршрутный опрос – часто используется, если единицей изучения является семья. На карте населённого пункта, в котором будет производиться опрос, нумеруются все улицы. С помощью таблицы (генератора) случайных чисел отбираются большие числа. Каждое большое число рассматривается как состоящее из 3-х компонентов: номер улицы (2-3 первых числа), номер дома, номер квартиры. Например, число 14832: 14 – это номер улицы на карте, 8 – номер дома, 32 – номер квартиры.

5. Районированная выборка с отбором типичных объектов. Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности .

· Рандомизация (случайный отбор)

· Попарный отбор

· Стратометрический отбор

· Приближённое моделирование

· Привлечение реальных групп

Рандомизация , или случайный отбор , используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором (Гудвин Дж., с. 147).

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать...

Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол, возраст, политические предпочтения, образование, уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.

Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.

Приближенное моделирование – формирование модели, которая для четко оговоренного класса систем (процессов) описывает его поведение (или нужные явления) с приемлемой точностью.

Последние материалы раздела:

Николай Некрасов — Дедушка: Стих
Николай Некрасов — Дедушка: Стих

Николай Алексеевич НекрасовГод написания: 1870Жанр произведения: поэмаГлавные герои: мальчик Саша и его дед-декабрист Очень коротко основную...

Практические и графические работы по черчению б) Простые разрезы
Практические и графические работы по черчению б) Простые разрезы

Рис. 99. Задания к графической работе № 4 3) Есть ли отверстия в детали? Если есть, какую геометрическую форму отверстие имеет? 4) Найдите на...

Третичное образование Третичное образование
Третичное образование Третичное образование

Чешская система образования развивалась на протяжении длительного периода. Обязательное образование было введено с 1774 года. На сегодняшний день в...