Виды статистических рядов кратко. Понятие статистических рядов распределения и их виды

Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, психолог провел тестирование интеллекта по тесту Векслера у 25 школьников, и сырые баллы по второму субтесту оказались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита.f i и имеют индекс “i”, соответствующий номеру переменной в вариационном ряду.

Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человека соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.

Приведенный выше ряд (3.1) можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Подобная форма представления (3.3) более предпочтительна, чем (3.1), поскольку лучше иллюстрирует закономерность варьирования признака.

Частоты, характеризующие ранжированный вариационный ряд, можно складывать, или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.

В качестве примера вновь обратимся к ряду 3.3. Преобразуем его в ряд 3.4 в котором введем дополнительную строчку и назовем ее «кумуляты частот»:

Рассмотрим подробно как получилась последняя строчка. В начале ряда частот стоит 1. В кумулятивном ряду на втором месте стоит 2 - это сумма первой и второй частоты, т.е. 1 + 1, на третьем месте стоит 4 это сумма второй (уже накопленной частоты) и третьей частоты, т.е. 2 + 2, на четвертом 8 = 4 + 4 и т.д.


Размах (иногда эту величину называют разбросом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Таблицы и графики распределения частот

Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот. Нередко они являются основой для получения ценных содержательных выводов исследования.

Если признак принимает всего лишь несколько возможных значений (до 10-15), то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это - таблица абсолютных частот распределения, если указывается доля наблюдений, приходящихся на то или иное значение признака, то говорят об относительных частотах распределения.

Во многих случаях признак может принимать множество различных значений, например, если мы измеряем время решения тестовой задачи. В этом случае о распределении признака позволяет судить таблица сгруппированных частот, в которых частоты группируются по разрядам или интервалам значений признака.

Еще одной разновидностью таблиц распределения являются таблицы распределения накопленных частот. Они показывают, как накапливаются частоты по мере возрастания значений признака. Напротив каждого значения (интервала) указывается сумма частот встречаемости всех тех наблюдений, величина признака у которых не превышает данного значения (меньше верхней границы данного интервала). Накопленные частоты содержатся в правых столбцах табл. 3.2 и 3.3.

Для более наглядного представления строится график распределения частот или график накопленных частот - гистограмма или сглаженная кривая распределения.

Гистограмма распределения частот - это столбиковая диаграмма, каждый столбец которой опирается на конкретное значение признака или разрядный интервал (для сгруппированных частот). Высота столбика пропорциональна частоте встречаемости соответствующего значения. На рис. 3.1 изображена гистограмма распределения частот для примера из табл. 3.2.

Гистограмма накошенных частот отличается от гистограммы распределения тем, что высота каждого столбика пропорциональна частоте, накопленной к данному значению (интервалу). На рис. 3.2 изображена гистограмма накопленных частот для данных табл. 3.2.

Построение полигона распределения частот напоминает построение гистограммы. В гистограмме вершина каждого столбца, соответствующая частоте встречаемости данного значения (интервала) признака, - отрезок прямой. А для полигона отмечается точка, соответствующая середине этого отрезка. Далее все точки соединяются ломаной линией (рис. 3.3). Вместо гистограммы или полигона часто изображают сглаженную кривую распределения частот. На рис. 3.4 изображена гистограмма распределения для примера из табл. 3.3 (столбики) и сглаженная кривая того же распределения частот.

Таблицы и графики распределения частот дают важную предварительную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Обычно выделяют следующие типичные формы распределения. Равномерное распределение – когда все значения встречаются одинаково (или почти одинаково) часто. Симметричное распределение - когда одинаково часто встречаются крайние значения. Нормальное распределение - симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям признака. Асимметричные распределения - левосторонние (с преобладанием частот малых значений), правосторонние (с преобладанием частот больших значений).

Уже сами по себе таблицы и графики распределения признака позволяют делать некоторые содержательные выводы при сравнении групп испытуемых между собой. Сравнивая распределения, мы можем не только судить о том, какие значения встречаются чаще в той или иной группе, но и сравнивать группы по степени выраженности индивидуальных различий - изменчивости по данному признаку.

Таблицы и графики накопленных частот позволяют быстро получить дополнительную информацию о том, сколько испытуемых (или какая их доля) имеют выраженность признака не выше определенного значения.

Раздел 4. Описательные статистики
(Статистическое распределение и его числовые характеристики)

Переменная может принимать много значений. На начальном этапе обработки данных вместо того, чтобы рассматривать все значения переменной, рекомендуется проанализировать т. к. описательные статистики. Они дают общее представление о значениях или разбросе значений, которые принимает переменная.

К первичным описательным статистикам (Descriptive Statistics) обычно относят числовые характеристики распределения измеренного на выборке признака. Каждая такая характеристика отражает в одном числовом значении свойство распределения множества результатов измерения: с точки зрения их расположения на числовой оси либо с точки зрения их изменчивости. Основное назначение каждой из первичных описательных статистик - замена множества значений признака, измеренного на выборке, одним числом (например, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений, в частности, путем сравнения первичных статистик разных групп.

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на:

Атрибутивные (качественные);

Вариационные (количественные)

а) дискретные;

б) интервальные.

Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д.

Таблица 1 - Распределение работников предприятия по образованию.

В данном примере группировочным признаком выступает образование работников предприятия (высшее, среднее). Данные ряды распределения являются атрибутивными, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число составляют работники со средним образованием (порядка 40%); остальные работники распределяются на группы по данному качественному признаку: со средним специальным образованием - 25%; с неполным высшим - 20%; с высшим - 15%.

Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями . Сумма частот называется объемом совокупности и определяет число элементов всей совокупности.

Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Вариационные ряды в зависимости от характера вариации подразделяются на: дискретные (прерывные) и интервальные (непрерывные). Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).

Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование - расположение всех вариантов в возрастающем (убывающем) порядке.

Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака Х i , а затем подсчитывается частота повторения варианта f i . Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.

Статистический ряд распределения - упорядоченное распределение единиц совокупности на группы по определенному признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивным (качественным) признакам, называются атрибутивными (распределение населения по полу, занятости, национальности, профессии и т.д.).

Ряды распределения, построенные по количественному признаку, называются вариационными (распределение населения по возрасту, рабочих – по стажу работы, зарплате и т.д.). Вариационные ряды распределения состоят из двух элементов: вариантов и частот. Варианты – отдельные значения признака, которые он принимает в ряду. Частоты – это численность отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности. Частости – это частоты, выраженные в долях единиц или в % к итогу.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения, на дискретных признаках, представленных в виде интервалов. Интервальные вариационные ряды основаны на непрерывных признаках (имеющих любые значения, даже дробные).

7. Табличное и графическое представление статистических данных.

Результаты сводки и группировки излагаются в виде таблиц. Таблица – рациональная, наглядная и компактная форма стат.материала.

Статистическая таблица – таблица, содержащая результаты подсчета практических данных и является итогом сводки первоначальной информации.

Таблица характеризует совокупность по одному или нескольким признакам, взаимосвязанным логикой.

Статистическая таблица имеет свое подлежащее и сказуемое. Подлежащее – объект, характеризующийся цифрами. Сказуемое таблицы - система показателей.

Таблицы бывают простые и сложные. В простой таблице дается простой перечень объектов. Сложная таблица содержит группировку единиц совокупности одновременно по 2-м и более признакам. Таблица д/б компактной, заголовки краткими, информация в столбцах и графах должна завершаться итоговой строкой. Графы и строки должны иметь единицы измерения, затем необходимо провести четную и логическую проверку таблицы.

Статистический график – чертеж, на котором стат.совокупности, характеризуемые определенными показателями описываются с помощью условных геометрических образов или знаков. При построении графика необходимо соблюдать требования: наглядность, выразительность, понятность. Поле графика – часть плоскости, где расположены графические образы. Виды графиков: линейные, столбиковые, полосовые, круговые, секторные, фигурные, точечные, объемные, применяются диаграммы и стат.карты. Картограмма – схематическая географическая карта, на которой выделены отрасли промышленности или структура состава населения.

Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется только одним признаком .

В таблице 2 (только число банков) – малая выборка – простейший ряд.

Пример: с детьми, которых в разное время во дворе было: 9 10 11 8 8 9 9 11 11. Ранжируем от min к max и получаем:

Пример 2. : со студентами в аудитории.

Таблица 0

Распределение числа студентов группы 302

Число студентов (чел.)

Итого:

Статистический ряд распределения – это упорядоченный ряд распределения единиц совокупности на группы по определенному варьирующему признаку.

Выделяются 2 вида рядов:

1. атрибутивный

Например: таблица 0 Распределения числа студентов группы 302 по полу (женский, мужской), число, % (нумерация столбцов обязательна).

Строится по качественному признаку, которые не имеет числового выражения. Такие ряды характеризуют совокупность по изучаемому признаку.

2. вариационный

Построен по количественному признаку, причем признак располагается в порядке возрастания или убывания значения признака, т.е. ряд должен быть проранжирован.

Характеристики ряда распределения:

1. x – вариант(а) – это значение признака в вариационном ряду, т.е. те значения, которые принимает группировочный признак;

2. f – частота – показывает сколько раз в совокупности встречается данное значение признака.

Пример 3. : Дети гуляли во дворе. В определенное время их было: 9 10 11 8 8 9 9 11 11. Ранжируем ряд от меньшего к большему и увидим сколько раз встречается тот или иной вариант.

Сумма всех частот равна сумме элементов ряда

Иногда для характеристики ряда используют частости – частоты, выраженные в % или долях 1,0 .

В любом случае Wi – частоты = 100% или Wi – частоты = 1 доле.

(см. табл. 0: 83,3+16,7 = 100,0%)

(см. табл. 0: 0,83+0,17 = 1,00).

В зависимости от характера вариационного признака вариационные ряды подразделяются на дискретные и интервальные .

В дискретных рядах варианты представлены в виде целых чисел и их значения можно пересчитать.

Пример 4:

Таблица 4

Распределение семей по числу детей

Число детей в семье (чел.)

Количество семей (ед.)

S (накопленные частоты)

Итого:

Интервальный ряд – это ряд, в кот. значение признака выражен в виде интервалов.

В интервальных рядах признак может меняться непрерывно (от min к max), причем отличаются друг от друга на сколь угодно малую величину .

Интервальные ряды применяются в тех случаях, если значение признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов достаточно велико.

Правила построения рядов, выбор количества групп и величин интервалов также как и при группировке.

Таблица 5

Распределение сотрудников предприятия по размерам месячной заработной платы, руб.

Зарплата (руб.)

Число сотрудников (чел.)

Накопленные частоты

Итого:

Кроме частот используются накопленные частоты или накопленные частости.

Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S.

Накопительные частоты называются аккумулированными частотами , они показывают сколько элементов ряда имеют значение до определенного ряда.

Ряд в статистике-цифровые данные, показывающие изменение явления во времени и простанстве и дающие возможность производить стат сравнение явлений как в процессе их развития во времени, так и по различным формам и видам процессов.

Результаты сводки и группировки материалов статнаблюдения оформляются в виде статрядов распределения и таблиц. Рядами распределения называются ряды числовых показателей, характеризующие распределение единиц изучаемой совокупности в зависимости с группировочного признака. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.

В зависимости от группировочного признака ряды распределения могут быть: 1) атрибутивными, если они образованы по качественному признаку (специальность, национальность, пол и т.п.); 2) вариационными, если они образованы по количественному признаку (срок лишения свободы, размер штраф сумма иска и т.п.).

Вариационные ряды подразделяются на два вида: дискретные и интервальные. В дискретных рядах распределение признака дается только в виде целых чисел. Например, количество обвиняемых, приходящихся на одно уголовное дело. В интервальных рядах вариация исследуемого признака дается в виде непрерывно изменяющейся величины, т.е. значение признака может быть выражено любым дробным числом. Например, сроки лишения свободы, варьирующие в пределах года (6 месяцев, 9 месяцев и пр.). Для интервальных вариационных рядов характерно, что они строятся на основе количественного признака, выражающегося в виде интервала «от... до».

Процесс развития, движения соц явлений во времени в стат принято называть динамикой. Для отображения динамики строят ряды динамики (хронологические, временные), кот представляют собой ряды изменяющихся во времени значений стат показателя, располож в хронологич порядке. Их сост элементами явл цифровые значения данного показателя или моменты времени, к кот они относятся. Разл виды рд:1.ряды абсолютных и производных показателей;2.Моментные и интервальные.

При проведении стат анализа исп метод параллельных рядов –сопоставление 2х или неск рядов, находящихся во взаимной связи друг с другом, в рез-те чего появл зависимость между ними. \\ряды дают возможность не только сравнивать изменение явления в целом, но и улавливать и выражать в цифрах направление, тенденцию такого изменения для неск видов данного явления сразу.

6. Преобразование динамических рядов (укрупнение интервалов, сглаживание, смыкание динамического ряда).

Преобразование динамических рядов осуществляется с целью выявления обшей тенденции ряда и, следовательно, общей тенденции, закономерности развития изучаемого явления.

Дело в том, что не всякий динамический ряд сразу позволяет нам обнаружить ту или иную тенденцию, поскольку часто динамические ряды получаются колеблющимися, "прыгающими", в которых показатели то растут, то снижаются.

Для выявления скрытых закономерностей, тенденций применяют различные приемы преобразования динамических рядов. Среди различных приемов преобразования динамических рядов наиболее часто применяют такие, как сглаживание, укрупнение периодов, смыкание рядов динамики.

Сглаживание (метод скользящей среднем) динамического ряда заключается в том, что конкретные показатели ряда заменяются сглаженными (скользящими средними), в результате чего обнаруживается та или иная тенденция ряда.

Укрупнение периодов динамического ряда заключается в суммировании показателей ряда за более продолжительные отрезки времени. Если, например, динамика преступности по району, городу или области представлена по месяцам, то месячные показатели можно сгруппировать (укрупнить) в квартальные, и получить новый преобразованный динамический ряд, в котором случайные "перепады" в месячных показателях нейтрализуются и выявляется та или иная тенденция ряда. Таким же образом можно квартальные показатели укрупнять (группировать) в годовые, а годовые - в показатели за 3 года, 5 лет и т.д.

Смыкание динамических рядов. К этому методу прибегают тогда, когда имеет место несопоставимость показателей ряда вследствие территориальных или иных организационных изменений.

Суть этого метода заключается в следующем. За тот период (интервал), в течение которого произошла реорганизация, определяются уровни изучаемого показателя как до, так и после реорганизации (в нашем примере это 60 и 35), которые принимаются за базу сравнения (обычно за 100%). На основе этого исчисляются относительные величины динамики до реорганизации района (показатель 60, принятый за базу 100%) и после его реорганизации (показатель 35, принятый за базу 100%).

Показатели сомкнутого динамического ряда позволяют сделать вывод о динамике разводов за весь период 1991-1997 г.г.:

тенденция роста разводов сохранилась, хотя в абсолютных цифрах, число разводов до реорганизации резко отличается от аналогичных показателей после его реорганизации.

Более простой способ решения подобного рода проблем предлагает Ю.Ф. Кардополов, который справедливо считает, что при несопоставимости показателей динамического ряда вследствие территориальных изменений следует перейти от абсолютных показателей к относительным величинам интенсивности, которые рассчитываются на один и тот же "объем" населения (на 10 тыс. человек или на 100 тыс. человек).

Последние материалы раздела:

Чудеса Космоса: интересные факты о планетах Солнечной системы
Чудеса Космоса: интересные факты о планетах Солнечной системы

ПЛАНЕТЫ В древние времена люди знали только пять планет: Меркурий, Венера, Марс, Юпитер и Сатурн, только их можно увидеть невооруженным глазом....

Реферат: Школьный тур олимпиады по литературе Задания
Реферат: Школьный тур олимпиады по литературе Задания

Посвящается Я. П. Полонскому У широкой степной дороги, называемой большим шляхом, ночевала отара овец. Стерегли ее два пастуха. Один, старик лет...

Самые длинные романы в истории литературы Самое длинное литературное произведение в мире
Самые длинные романы в истории литературы Самое длинное литературное произведение в мире

Книга длинной в 1856 метровЗадаваясь вопросом, какая книга самая длинная, мы подразумеваем в первую очередь длину слова, а не физическую длину....