Вторичные группировки. Сводка и группировка статистических данных

Сложные группировки. Группировки по одному признаку называются простыми . Для того же, чтобы полнее и глубже изучить сложное общественное явление, необходимо сгруппировать данные по двум или более признакам. Такие группировки называют сложными .

Наиболее распространенным видом сложных группировок являются комбинированные группировки , когда группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам. Обычно в основание группировки кладется от 2 до 4 признаков.

Одновременное использование нескольких группировочных признаков позволяет выявить и сравнить такие различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков.

При изучении влияния большого числа признаков применение комбинированных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей и тем самым не позволяет выявить одновременное влияние всего комплекса факторных признаков на исследуемый показатель.

Вторичная группировка. Особым видом группировок в статистике является вторичная группировка , под которой понимается образование новых групп на основе ранее выделенной (первичной) группировки .

Обычно новые группы получают путем укрупнения первоначальных интервалов. Вторым способом образования новых групп является долевая перегруппировка единиц совокупностей.

К вторичной группировке прибегают в целях решения ряда задач, в частности для: 1) создания более укрупненных групп, в которых яснее проступает характер распределения; 2) образования качественно однородных групп (типов); 3) приведения двух (или более) группировок с различными интервалами к единому виду в целях сравнимости.

Предприятие 1 Предприятие 2
группы рабочих по размеру зарплаты, тенге удельный вес рабочих по группам, % к итогу
12000–14000
14000–16000 13000–16000
16000–18000 16000–19000
18000–20000 19000–22000
20000–22000 22000–25000
22000–24000 25000–28000
24000–26000 28000–31000
26000–28000
Итого Итого

Поскольку распределение рабочих на этих двух предприятиях имеет различные интервалы, то сравнить их непосредственно невозможно. Однако с помощью вторичной группировки можно привести их к сравнимому виду. Возьмем, к примеру, интервал в 4000 тенге:

Распределение рабочих по размеру месячной заработной платы

(группировка единая)

Группы рабочих по размеру зарплаты, тенге Удельный вес рабочих по группам, % к итогу
предприятие 1 предприятие 2
12000–16000 17 (5+12)
16000–20000 44 (18+26) 37 (30+1/3×21)
20000–24000 32 (25+7) 24 (2/3×21+2/3×15)
24000–28000 7 (4+3) 21 (1/3×15+16)
28000–32000
Всего

Ряды распределения.

Определение ряда распределения. В результате сводки статистических материалов образуются ряды статистических данных, раскрывающих либо изменение объемов совокупностей в динамике (будут рассмотрены в отдельной главе), либо распределение совокупностей по тем или иным признакам в статике.

Распределение может быть по признакам, не имеющим количественной меры (атрибутивным), и по признакам, в которых изменяется их количественная мера (вариационные ряды).

Атрибутивные ряды распределения. Примерами подобных распределений служат распределение населения на городское и сельское, мужское и женское, товарооборота на продовольственные и непродовольственные товары, занятого населения по отраслям и профессиям, взрослого населения по уровню образования.

Вариационные ряды. Например, к таким рядам относятся распределения рабочих по размеру среднемесячной заработной платы и предприятий по объемам производства или численности работающих.

В вариационном ряду различают два элемента: варианты и частоты. Варианты это отдельные значения группировочного признака, которые он принимает в вариационном ряду. Частотами называют числа, показывающие, как часто встречаются те или иные варианты.

Сумма всех частот образует объем ряда распределения, или его численность . Частоты, выраженные в виде относительных величин (долях единицах, процентах), называют частостями .

Вариационные ряды по способу построения бывают интервальными и дискретными. Интервальные вариационные ряды – ряды, в которых значения вариант даны в виде интервалов (например, численность населения по группам возрастов). Дискретные вариационные ряды – ряды, в которых значения вариант имеют значения целых или фиксированных чисел (например, общее число семей по числу человек).

Характер вариационного ряда (интервальный или дискретный) определяется характером вариации. Вариация может быть непрерывной (интервальный ряд) и прерывной (дискретный ряд).

Примерами непрерывной вариации служат урожайность сельскохозяйственных культур, заработная плата, объемы производства.

К дискретной вариации могут относиться число членов семьи, тарифный разряд рабочего, число комнат в квартире, число рабочих на предприятии.

Если дискретная вариация проявляется в широких пределах (например, численность рабочих на предприятии), то строятся интервальные вариационные ряды.

Примеры построения и графического изображения рядов распределения (Тарифный разряд и стаж работы рабочих-слесарей). Построим первоначальный дискретный ряд распределения рабочих по тарифным разрядам. Характер вариации признака здесь определен шестью группами – по числу разрядов. Подсчет числа рабочих в каждом разряде легко провести непосредственно по первичным данным. В результате получим таблицу.

Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию доступно для восприятия.

Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.

Результаты группировки оформляются в виде группировочных таблиц , делающих информацию обозримой. Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.

Пример 5.2. Основа группировочной таблицы

Название таблицы (общий заголовок)

Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.

Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т.е. подлежащее. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки.

Пример 5.3. Пример группировочной таблицы

Отношение студентов факультета ГиСЭО к понижению размера стипендии (по результатам исследования в январе 1999 г.)

Таким образом, группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают по:

Задачам систематизации данных;

Числу группировочных признаков;

Используемой информации.

По задачам систематизации данных различают: типологические, структурные и аналитические.

Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.

Структурные группировки— это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные группировки — результат объединения или расщепления первичных группировок, они позволяют преодолевать несопоставимость исходных данных в первичных группировках и тем самым объединять их в одну общую и выполнять сравнение, сопоставление данных, представленных в них после проведения вторичной группировки.

При разработке первичной группировки существенное значение имеет выбор числа групп . Число групп зависит от типа признака, положенного в основу группировки (основания группировки), от объема совокупности, степени вариации признака.

При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможно два подхода: группировка с равными и неравными интервалами.

Для определения этих параметров в первом случае рекомендуется формула Стерджесса:

n = 1 + (3,322× lgN) , (5.1)

где N — количество наблюдений.

В этом случае величина интервала:

I = (Хmax - Xmin)/n . (5.2)

Основные этапы построения статистических группировок включают:

Выбор группировочного признака;

Определение необходимого числа групп, на которые следует разбить изучаемую совокупность;

Установление границ интервалов группировки;

Установление для каждой группировки показателей или их системы, которыми должны характеризоваться выделенные группы.

Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует, по мере возможности, избегать таких группировок.

Вопросы для самопроверки:

Что такое сводка?

Что представляет собой группировка данных?

Какие вы знаете виды группировок?

В чем особенности каждого вида группировки?

Какова связь между группировкой, таблицей и сводкой?

В чем особенность сложных многомерных группировок?

Что означает вторичная группировка?

Для чего нужна вторичная группировка?

Группировки различают:

  1. Первичные , составленные на основе первичного материала собранного при наблюдениях.
  2. Вторичные , составленные на основе первичных, используется в двух случаях:
    • когда необходимо мелкие формальные группы, переформировать, в более крупные;
    • когда надо дать сравнительную оценку материалов собранных в разных местах и по различным методикам.
Группировка, составленная по двум или более признакам, называется – комбинационной .
Признак, по которому происходит выделение групп или типов явлений, называется группировочным или основанием группировки . Основание может быть количественным или атрибутивным. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).

Пример №1 . Имеются следующие данные о распределении торговых фирм по численности работников двух регионов.


Постройте вторичную группировку данных о распределении фирм, пересчитав данные региона 1 в соответствии с группировкой региона 2. В каком регионе средняя численность работников больше?

Решение:
В первую группу «Менее 5» войдет 4/5 от группы «1-5». Тогда число фирм составит: 6*4/5 = 4,8 ≈ 5.
В группу «5-10» полностью входит группа «6-10» и часть группы «1-5», т.е. число фирма будет равно 4 + (6-5) = 5
В группу «11-20» полностью войдет группа «11-15» и часть группы «16-20», а именно ¼*50 = 12,5 ≈ 13.
В группу «21 -30» полностью входит группа «16-20» и группа «21-25», а группа «более 25». Получаем: (50-13) + 20 + 15 = 72


Находим среднюю численность работников:
Для первого региона.

Средняя взвешенная: x ср = 1960/105 = 18,67

Для второго региона.


Средняя взвешенная: x ср = 3502,5/117 = 29,94
Таким образом, во втором регионе средняя численность работников больше.

Пример №2 .
Распределение рабочих по стажу работы

№ группы Группы рабочих по стажу, лет Число рабочих, чел. Число рабочих в процентах к итогу
I 2-6 6 30,0
II 6-10 6 30,0
III 10-14 5 25,0
IV 14-18 3 15,0
ИТОГО 20 100,0

В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2-6 лет – 30% и от 6-10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.
Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в таблице 2.

Таблица 2 - Группировка рабочих по стажу работы

№ группы Группы рабочих по стажу лет Число рабочих, чел. Средний стаж работы, лет Выработка продукции, руб.
Всего На одного раб.
I 2-6 6 3,25 1335,0 222,5
II 6-10 6 7,26 1613,0 268,8
III 10-14 5 11,95 1351,0 270,2
IV 14-18 3 16,5 965,0 321,6
ИТОГО: 20 8,62 5264 236

Для заполнения таблицы 2. необходимо составить рабочею таблицу 3.

Таблица 3.

№ п/п Группы рабочих по стажу, лет Номер рабочего Стаж Выработка в руб.
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Итого по группе: 6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Итого по группе 6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Итого по группе 5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Итого по группе 3 49,5 965
Всего 20 172.4 5264,0

Разделив графы (4:3); (5:3) табл. 3 получим соответствующие данные для заполнения таблицы 2. Итак далее по всем группам. Заполнив таблицу 2. получим аналитическую таблицу.
Рассчитав рабочую таблицу сверяем итоговые результаты таблицы с данными условия задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проверим еще арифметический контроль.
Анализируя аналитическую таблицу 2, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5 % мы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач такая группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, т.е. к комбинационной. Произведем вторичную группировку данных по средней выработке продукции.
Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего расчеты представлены в таблице 4.

Таблица 4 - Группировка рабочих по стажу и средней выработке продукции

№ п/п Группы рабочих Число раб., чел. Сред. стаж работы, лет Средняя выработка прод., руб.
по стажу по средней выраб. прод. в руб. всего на одного раб.
1 2-6 200,0-250,0 4 2,5 835,0 208,75
Итого по группе 6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
Итого по группе 5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
Итого по группе 3 16,5 965,0 321,6
Итого по группам 200,0-250,0 5 3,0 1065,0 213,0
Всего 20 8,62 5264 263,2

Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп, определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше чем в первоначальной группировке.
Тогда, i=(350-200)/3 = 50 руб.
Больше групп брать нет смысла, будет очень маленький интервал, меньше можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, направить по первой 19, 5 лет делится на число рабочих – 6 человек, получим 3,25 года.
Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.

Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп, с тем чтобы сделать группировку сопоставимой с другими.

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.

Задачи сводки и ее содержание

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.

Статистические сводки различаются по ряду признаков:

    По сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка .Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц.

    По способу разработки сводки делятся нацентрализованные , когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). Придецентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности).

    По технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.

Метод группировки

Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.

Особым видом группировки является классификация . Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).

Отличительные черты классификации:

    В основу кладется качественный признак.

    Они стандартны.

    Они устойчивы.

То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.

    Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные - по качественному признаку и количественные.

Классификация группировочных признаков

По форме выражения

атрибутивные , не имеющие количественного выражения (профессия, образование);

количественные : 1)дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2)непрерывные, значения, которые могут быть как целые, так и дробные.

По характеру колеблемости

альтернативные , которыми одни единицы обладают, а другие нет (качество);

имеющие множество количественных значений

По роли признака во взаимосвязи изучаемых явлений

факторные, воздействуют на другие признаки;

результативные, испытывающие на себе влияние других

Для нахождения числа групп служит формула Стерджесса

п = 1 + 3,322 lgN,

где N-количество элементов совокупности.

Согласно этой формуле, выбор числа групп зависит от объема совокупности.

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (). Он рассчитывается

где - среднее значение признака по совокупности, которое определяется по формуле;

    Е значение варьирующего признака;

    среднее квадратическое отклонение.

Если величина интервала равна 0,5 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если делится на 6 групп, то получаются следующие интервалы:

Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.

После определения числа групп следует определить интервалы группировки.

Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами .

Хмах - Хmin

h= ---------------- ;

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. (0,7; 1,4; 5,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до

Например, Х max = 180, Х min= 80, п= 5.

h= (Хмах - Хmin) / п;

h= (180 - 80) / 5 = 20;

Следовательно получили следующие интервалы

80-100; 100-120; 120-140; 140-160; 160-180.

б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.

в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

г) закрытые , когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).

При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».

Применение зависит от формы написания интервалов, особенно первой и последней групп.

    180 и более - исключительно - 180 входит в последний

    свыше 180 - включительно - 180 входит в предыдущий.

В практике встречаются оба, но предпочтение отдается принципу «исключительно».

Серединное значение интервалов определяется несколькими приемами.

    Суммируем верхнюю и нижнюю границу интервала и делим на 2.

    Середина 2-го интервала плюс величина интервала.

    Середина 2-го интервала минус величина интервала (для открытого).

    К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок

    Типологическая группировка. Суть: Выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Еслиатрибутивный признак , то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основеколичественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0-2; дошкольный 3-6; школьный 7-17; трудоспособный 16-54 для женщин и 16-59 для мужчин.

Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.

Группировка по формам собственности в 1998 г.

    Структурная группировка. Это группировки, используемые для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов.

Группировка населения России по месту проживания

за 1959-1994 гг.

    Аналитическая группировка(факторная). Она используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенности аналитической группировки: во-первых, в основу кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Группировка коммерческих банков России по сумме активов баланса

Группа банков по сумме активов баланса, млн. руб.

Количество банков, единиц

В среднем на один банк

численность занятых, чел.

Балансовая прибыль, млрд.руб.

50000 и более

    Комбинированная группировка. Это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа положенных в их основание признаков делят на:

Простая - это группировка, выполненная по одному признаку.

Сложная группировка производится по двум и более признакам

Вторичная группировка

Вторичной группировкой называется перегруппировка уже сгруппированного материала.

К ней прибегают:

    Когда из большого числа первоначально образованных групп надо получить меньшее число более крупных.

    Когда в целях сравнения нужно привести в сопоставимый вид по-разному сгруппированный материал.

Статистические ряды распределения

Среди простых группировок особо выделяют ряды распределения.

Ряды распределения представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Ряды распределения, образованные по качественным признакам называют атрибутивными.

При группировке ряда по количественному признаку получаются вариационные ряды.

Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота это численность отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.

Например, по атрибутивному признаку.

Например, дискретный ряд.

Количество студентов

В % к итогу

Характер распределения в дискретных рядах изображается графически в виде полигона распределения.

Пример интервального ряда.

Распределение рабочих по выработке

Выработка, т.р.

Число рабочих

Кумулятивная(накопленная) численность

Интервальный ряд распределения графически изображается в виде гистограммы.

В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве . Вариационные ряды с равными интервалами обеспечивают это условие.

Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения , т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

Группы магазинов по размеру товарооборота, т.р.

Число магазинов

Величина интервала, т.р.

Плотность распределения, ед. (1:2)

Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250-450 т.р.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Статистические таблицы

Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными.

К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.

В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми.

При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят и корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называетсясложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»

Применение комбинационных таблиц относятся к более позднему периоду (1882).

К техническим моментам при составлении таблиц относятся:

    Четкость заголовков.

    Указываются единицы измерения в отдельных графах.

    Повторяющиеся термины выносятся в общие заголовки.

    Графы и строки необходимо нумеровать.

    В групповых и комбинационных таблицах всегда надо давать итоговые графы и строки.

    Округление чисел проводится с одинаковой точностью. Когда одна величина превосходит другую многократно, то полученные показатели динамики лучше выражать не в % , а в разах. Например, вместо 586%, следует в 5,9 раз больше.

    В аналитических таблицах значимость абсолютных цифр должна быть наименьшей. Когда интересами исследования предусмотрены многозначные числа, то начиная справа следует выделять миллионы, тыс.ед. Например, 1458946 р., 1 458 946 р. или можно округлять до 2-3 знаков 1,46 млн.р.

    Когда в таблице наряду с отчетными данными приводятся сведения расчетного порядка, то делаются оговорки в виде сносок.

    При неполном объеме изучаемой совокупности или отсутствии исходных данных все слагаемые сначала показывают в строке « общие итоги», а потом после пояснения в строке «в том числе» перечисляются наиболее важные их составные части.

    Отдельные клетки могут быть не заполнены по следующим причинам:

а) «х» - клетка вообще не подлежит заполнению;

б) «...» - отсутствуют сведения;

в) «-» - отсутствует само явление;

г) 0,0 - то при округлении с большей точностью может появиться значащая цифра.

Статистические графики

Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).

Основные элементы графика включают в себя:

    Поле графика - это место, на котором он выполняется. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5 (правило «золотого сечения»). Иногда используется и поле в виде квадрата.

    Графический образ - это символические знаки, с помощью которых изображаются статистические данные.

    Пространственные и масштабные ориентиры. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями. Масштабные ориентиры - придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.

    Экспликация графика - это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.

Вопрос 10. Вторичная группировка, методы ее проведения.

Группировка - это расчленение изучаемой статистической совокупности на части по одному или нескольким группировочным признакам. Правильно проведенная группировка в значительной мере обеспечивает достоверность всего статистического исследования.

Первичная группировка производится на основе сортировки первичных исходных данных.

Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. В таком случае необходима перегруппировка данных с помощью вторичной группировки.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп.

1. наиболее простой и распространенный способ - изменение (чаще укрупнение) первоначальных интервалов.

2. Д олевая перегруппировка - способ состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.

Пример. Необходимо провести перегруппировку данных, образовав новые группы с интервалами до 500, 500 - 1000,1000 - 2000, 2000 - 3000, свыше 3000 руб. по данным о распределении контрактов строительной фирмы по величине прибыли.

Таблица. Распределение контрактов строительной фирмы по величине прибыли¹

В первую новую группу войдет полностью 1-я группа контрактов и часть 2-й группы. Чтобы образовать группу до 500 тыс. руб., необходимо от интервала 2-й группы взять 100 тыс. руб. Величина интервала этой группы составит 600 тыс. руб. Следовательно, необходимо взять от нее 1/6 (100: 600).Аналогичную же часть во вновь образуемую новую группу надо взять и от числа контрактов, т. е. 20 1/6 - 3 контракта. Тогда в 1-й группе будет контрактов 16 + 3 = 19 контрактов. Вторую новую группу образуют контракты 2-й группы за вычетом отнесенных к 1-й, т. е, 20 - 3 = 17 ед. Во вновь образованную третью группу войдут все контракты 3-й группы и часть контрактов 4-й. Для определения этой части от интервала 1800 -3000 (ширина интервала равна 1200 тыс. руб.) нужно добавить к предыдущему 200 тыс. руб. (чтобы верхняя граница интервала была равна 2000 руб.). Следовательно, необходимо взять часть интервала, равную 200:1200, т. е. 1/6. В этой группе 74 контракта, значит, надо взять 74 ¦ (1: 6) = 12 ед. В третью новую группу войдет: 44 Н-12 - 56 контрактов. Во вновь образованную четвертую группу войдет: 74 - 12 =62 контракта, оставшихся от прежней 4-й группы. Пятую, вновь образованную группу составят контракты 5-й и б-й прежних групп: 37 + 9 = 46 контрактов. Техника перегруппировки показана в таблице.

Последние материалы раздела:

Чудеса Космоса: интересные факты о планетах Солнечной системы
Чудеса Космоса: интересные факты о планетах Солнечной системы

ПЛАНЕТЫ В древние времена люди знали только пять планет: Меркурий, Венера, Марс, Юпитер и Сатурн, только их можно увидеть невооруженным глазом....

Реферат: Школьный тур олимпиады по литературе Задания
Реферат: Школьный тур олимпиады по литературе Задания

Посвящается Я. П. Полонскому У широкой степной дороги, называемой большим шляхом, ночевала отара овец. Стерегли ее два пастуха. Один, старик лет...

Самые длинные романы в истории литературы Самое длинное литературное произведение в мире
Самые длинные романы в истории литературы Самое длинное литературное произведение в мире

Книга длинной в 1856 метровЗадаваясь вопросом, какая книга самая длинная, мы подразумеваем в первую очередь длину слова, а не физическую длину....