Дисперсия альтернативного признака принимать значение. Показатели вариации

Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую (табл. 11).

Таблица 11

Виды дисперсий и правило сложения дисперсий

Наименование дисперсии

Формула расчета

простая (незвешенная)

взвешенная

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов

Межгрупповая дисперсия измеряет систематическую вариацию, возникшую под влиянием группировочного признака

Средняя по -той группе; - средняя по всей совокупности; - число единиц совокупности- число единиц в -той группе

Внутригрупповая (частная) дисперсия, рассчитывается отдельно для каждой группы

Индивидуальные значения признака в -той группе; - средняя -той группы; - число единиц в совокупности; - число единиц в -той группе

Средняя внутригрупповая дисперсия измеряет случайную вариацию, возникающую под влиянием всех факторов, кроме группировочного признака

Правило сложения дисперсий

На основании правила сложения дисперсий рассчитывают:

1) эмпирический коэффициент детерминации показывает долю вариации результативного признака, обусловленную вариацией группировочного признака:

2) эмпирическое корреляционное отношение показывает тесноту связи между группировочным и результативным признаками:

Эмпирическое корреляционное отношение варьирует от 0 до 1. При связи нет, при - связь полная.

Промежуточные значения оцениваются по шкале Чэддока:

Дисперсия альтернативного признака

Альтернативный признак - качественный признак, который может принимать только одно значение из двух. Например, пол - мужской или женский; семейное положение - состоит в браке или нет; продукция - годная или бракованная. Одна часть совокупности обладает альтернативным признаком, другая нет. Доля единиц обладающих альтернативным (изучаемым) признаком обозначается - р, необладающих - q. Наличие альтернативного признака у единиц совокупности обозначается 1, отсутствие - 0.

23.Дисперсия альтернат. Признака

Дисперсия альтернативного признака (если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:

Подставляя в данную формулу дисперсии q =1- р, получаем:


Коэффициент роста K i определяется как отношение данного уровня к предыдущему или базисному, показывает относительную скорость изменения ряда. Если коэффициент роста выражается в процентах, то его называют темпом роста.

Коэффициент роста базисный

Коэффициент роста цепной

24.Изучение основной тенденции развития

Одной из важнейших задач статистики является определение в рядах динамики общей тенденции развития явления. На развитие явления во времени оказывают влияние различные факторы. Поэтому при анализе динами речь идет об основной тенденции, достаточно стабильной (устойчивой) на протяжении изученного этапа развития. Основной тенденцией развития (ТРЕНДОМ) называется плавное и устойчивое изменение уровня явления во времени, свободное от случайных колебаний. С этой целью ряды динамики подвергаются обработке методами укрупнения интервалов, скользящей средней и аналитического выравнивания. Наиболее простым методом изучения основной тенденции в рядах динамики является укрупнение интервалов. Данный метод основан на укрупнении периодов времени, к которым относятся уровни ряда динамики (одновременно уменьшается количество интервалов). Выявление основной тенденции может осуществляться также методом скользящей (подвижной) средней. Сущность его заключается в том, что исчисляется средний уровень из определенного числа, обычно нечетного (3, 5, 7 и т.д.), первых по счету уровней ряда, затем – из такого же числа уровней, но начиная со второго по счету, далее – начиная со среднего и т.д. Таким образом, средняя как бы «скользит» по ряду динамики, передвигаясь на один срок. Недостатком сглаживания ряда является «укорачивание» сглаженного ряда по сравнению с фактическим, а следовательно, происходит потеря информации. Для того, чтобы дать количественную модель, выражающую основную тенденцию изменения уровней динамического ряда во времени, используется аналитическое выравнивание ряда динамики. Основным содержанием метода аналитического выравнивания в рядах динамики является то, что общая тенденция развития рассчитывается как функция времени:, где уровни динамического ряда, вычисленные по соответствующему аналитическому уравнению на момент времени.

^ Выравнивание ряда динамики по прямой:
. Параметры а 0 , а 1 согласно методу наименьших квадратов находятся решением следующей системы нормальных уравнений:
, где у – фактические (эмпирические) уровни ряда; t – время (порядковый номер периода или момента времени). Расчет параметров значительно упрощается, если за начало отсчета времени (t = 0) принять центральный интервал (момент). Т.о., система принимает вид
. Таким образом, получаем:
;
.
25.Аналит.выравн. по способу наимен. Квадрата

Метод наименьших квадратов применяется для более точной количественной оценки динамики изучаемого явления. Наиболее простой и часто встречающейся в практике является линейная зависимость, описываемая уравнением:

У х = а + вХ, либо У теоретич. = У среднее + вХ,

где У х - теоретические (расчетные) уровни ряда за каждый период;
а - среднеарифметический показатель уровня ряда, рассчитывается по формуле:
а=ΣУ факт. /n;
в - параметр прямой, коэффициент, показывающий различие между теоретическими уровнями ряда за смежные периоды, определяется путем расчета по формуле: в = Σ(ХУ факт)/ΣХ 2
где n-число уровней динамического ряда;
X - временные точки, натуральные числа, проставляемые от середины (центра) ряда в оба конца.

При наличии нечетного ряда уровень, занимающий срединное положение, принимается за 0. Например, при 9 уровнях ряда: -4, -3, -2, -1, 0, +1, +2, +3, +4.

При четном числе уровней ряда две величины, занимающие срединное положение, обозначаются через -1 и +1, а все остальные - через 2 интервала. Например, при 6 уровнях ряда: -5, -3, -1, +1, +3, +5.

Расчеты проводят в следующей последовательности:


  1. Представляют фактические уровни динамического ряда (У ф) (см. табл.).

  2. Суммируют фактические уровни ряда и получают сумму У факт.

  3. Находят условные (теоретические) временные точки ряда X, чтобы их сумма (ΣХ) была равна 0.

  4. Возводят теоретические временные точки в квадрат и суммируют их, получая ЕX 2 .

  5. Рассчитывают произведение Х на У и суммируют, получая ΣХУ.

  6. Рассчитывают параметры прямой:
    а = ΣУ факт / n в = Σ(Х У факт) / ΣX 2

  7. Подставляя последовательно в уравнение У х = а + аУ значения X, находят выровненные уровни У х.

26.Анализ сезонных колебаний

При сравнении квартальных и месячных данных многих социально-экономических явлений часто обнаруживаются периодические колебания, возникающие под влиянием смены времён года. В статистике периодические колебания, которые имеют определённый и постоянный период, равный годовому промежутку, называются сезонные колебания или сезонные волны, динамический ряд называют сезонным рядом динамики. В статистике существуют методы изучения и измерения сезонных колебаний. Самый простой – построение специальных показателей, которые называются индексами сезонности (Is). Совокупность этих показателей отражает сезонную волну. Индексы сезонности - % отношения фактических (эмпирических) внутригрупповых уровней к теоретическим (расчётным) уровням, выступающим в качестве базы сравнения. Для того, чтобы выявить устойчивую сезонную волну их вычисляют по данным за несколько лет (не менее 3), распределенным по месяцам. Для каждого месяца рассчитывается средняя величина уровня (), затем вычисляется среднемесячный уровень для всего ряда y¯. После чего определяется показатель сезонной волны – индекс сезонности Is как процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда, %. Средний индекс сезонности для 12 месяцев должен быть равен 100%, тогда сумма индексов должна составлять 1200. Когда уровень проявляет тенденцию к росту или снижению, то отклонение от постоянного среднего уровня могут исказить сезонные колебания. В этом случае фактические данные сопоставляют с выравнеными, т. е. полученные аналитическим выравниванием. Формула:
.

27.И. нтерполяция и экстраполяция

При изучении длительной динамики иногда возникает необходимость определения неизвестных уровней внутри ряда динамики.

Интерполяцией называется приблизительный расчет недостающих уровней внутри однородного периода, когда известны прилегающие по обе стороны уровни.

Экстраполяцией называется расчет недостающего уровня, когда известен уровень только по одну сторону. Если рассчитывается уровень в сторону будущего, это называется перспективной экстраполяцией, в сторону прошлого - ретроспективной экстраполяцией.

Как интерполяция, так и экстраполяция должны производиться в период действия одной закономерности. Предполагается, что закономерность развития, найденная внутри ряда, сохраняется.

Приемы расчета неизвестного уровня зависят от характера изменения исследуемого явления. При плавном характере изменения уровня можно недостающий уровень определить: полусуммой двух прилегающих уровней, по среднему абсолютному приросту, по среднему темпу роста.

При сохранении пост-х абсолютных приростов недостающих ур-ней динамич.ряда рассчитыв-ся: =+

Начальный уровень

Если предполагаются постоянные темпы роста недостающий ур-нь ряда вычисляется по ф-ле:

Если в ряду динамики отмечаются резкие колебания, то лучше применять средний абсолютный прирост или средний темп роста за весь период исследования, как указано в формулах.

Индексами называют сравнительные относительные величины, которые характеризуют изменение сложных социально-экономических показателей (показатели, состоящие из несуммируемых элементов) во времени, в пространстве, по сравнению с планом.

Индекс - это результат сравнения двух одноименных показателей, при исчислении которого следует различать числитель индексного отношения (сравниваемый или отчетный уровень) и знаменатель индексного отношения (базисный уровень, с которым производится сравнение). Выбор базы зависит от цели исследования. Если изучается динамика, то за базисную величину может быть взят размер показателя в периоде, предшествующем отчетному. Если необходимо осуществить территориальное сравнение, то за базу можно принять данные другой территории. За базу сравнения могут приниматься плановые показатели, если необходимо использовать индексы как показатели выполнения плана.

Индексы формируют важнейшие экономические показатели национальной экономики и ее отдельных отраслей. Индексные показатели позволяют осуществить анализ результатов деятельности предприятий и организаций, выпускающих самую разнообразную продукцию или занимающихся различными видами деятельности. С помощью индексов можно проследить роль отдельных факторов при формировании важнейших экономических показателей, выявить основные резервы производства. Индексы широко используются в сопоставлении международных экономических показателей при определении уровня жизни, деловой активности, ценовой политики и т.д.

Существует два подхода в интерпретации возможностей индексных показателей: обобщающий (синтетический) и аналитический, которые в свою очередь определяются разными задачами.

29.Агрегатные индексы

Общий индекс отражает изменение всех элементов сложного явления. Если индексы охватывают не все элементы, то их называют групповыми или субиндексами. Различают индексы агрегатные и средние, исчисление которых и составляет особый прием исследования, именуемый индексным методом. При построении общих индексов: 1. необходимо выбрать элементы, которые следует объединить в одном индексе; 2. правильно выбрать соизмеритель или вес, т.е. постоянный признак.Выбор веса зависит от того, какой индексируется признак – количественный или качественный. Основной формой общих индексов является агрегатная форма. Индекс агрегатной формы строится по методу сумм. Агрегатная форма применяется, если мы имеем данные поэлементные в отчетном и базисном периоде. Индекс товарооб:
; ин-с физ объем прод
; ^ Индекс потребительских цен является общим измерителем инфляции. Индексируемой величиной в нем будет цена товара. При построении индекса цен в качестве весов индекса обычно берут количество товаров, проданных в текущем (отчетном) периоде. Агрегатный индекс цен с отчетными весами впервые предложен Пааше и носит его имя: формула агрегатного индекса цен Пааше
, где
- фактическая стоимость продукции (товарооборот) отчетного периода;
- условная стоимость товаров, реализованных в отчетном периоде по базисным ценам.

формулу агрегатного индекса цен Ласпейреса:

30.Ср.арифм. и гармон.инд.,связь с агрег.

Основной формой общих индексов является агрегатная форма. Индекс агрегатной формы строится по методу сумм. Агрегатная форма применяется, если мы имеем данные поэлементные в отчетном и базисном периоде. Многие статистические показатели, характеризующие различные стороны общественных явлений, находятся между собой в определенной связи (часто в виде произведения). Статистика характеризует эти взаимосвязи количественно. Многие экономические показатели тесно связаны между собой и образуют индексные системы . Принята следующая практика факторного анализа : если результативный показатель = произведению объемного и качественного факторов, то качественный фактор фиксируется на уровне базисного периода; если же определяется влияние качественного показателя, то объемный фактор фиксируется на уровне отчетного периода. Рассмотрим построение взаимосвязанных индексов на примере индексов цен, физического объема продукции (если речь идет об отпускных ценах) или физического объема товарооборота (если речь идет о розничных ценах) и индекса стоимости продукции (товарооборота в фактических ценах). Индексы физического объема и цен являются факторными по отношению к индексу стоимости продукции (товарооборота в фактических ценах):
, или
. Таким образом, произведение индекса цен на индекс физического объема продукции дает индекс стоимости продукции (товарооборота в фактических ценах). Индексная система позволяет по двум известным значениям индексов найти значение третьего неизвестного. Индекс физического объема продукции: ;Помимо агрегатного способа расчета общих индексов существует и другой способ, который состоит в расчете общих индексов как средних из соответствующих индивидуальных индексов. К исчислению таких средневзвешенных индексов прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать агрегатный индекс. Так, если неизвестны количества произведенных отдельных продуктов в натуральных измерителях, но известны индивидуальные индексы
и стоимость продукции базисного периода (p 0 q 0 ), можно определить средний арифметический индекс физического объема продукции. Исходной базой построения служит агрегатная форма. Из имеющихся данных можно получить только знаменатель этой формулы. Для нахождения числителя используется формула индивидуального индекса объема продукции, из которой следует, что q 1 = q 0 i q . Подставляя данное выражение в числитель агрегатной формы, получаем общий индекс физического объема в форме среднего арифметического индекса физического объема продукции , где весами служит стоимость отдельных видов продукции в базисном периоде (q 0 p 0 ):
.

Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными . Примером таких признаков являются наличие бракованной продукции, ученая степень преподавателя вуза, учеба по определенной специальности и т. д.

Предположим, что вся статистическая совокупность имеет n единиц. Из нихm единиц обладают выделенным признаком, тогда оставшиесяn m единиц не обладают этим признаком.

Долю единиц, обладающих признаком, обозначим: , тогда пусть
доля единиц, не обладающих данным признаком.

р + q = 1

Единицам х, обладающим данным признаком, присвоим значениех = 1, а не обладающим –х = 0.

Среднее значение альтернативного признака :

=р.

То есть среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.

Дисперсия альтернативного признака :

То есть дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.

Пример: 5% изготовленных изделий – брак, тогда 95% изделий годных. Дисперсия доли брака равна: σ 2 = 0,050,95 = 0,0475, а среднее квадратическое отклонение доли брака составляет σ =
или 22%.

Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при р =q = 0,5.

3. Дисперсионный анализ

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий:общей , межгрупповой и внутригрупповой .

Общая дисперсия σ 2 общ измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей по совокупности средней и может быть вычислена по формуле простой или взвешен ной дисперсии.

Межгрупповая дисперсия σ 2 межгр характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:

σ 2 межгр =
,

где f - численность единиц в группе.

Внутригрупповая (частная) дисперсия σ 2 i отражает случайную вариацию, т. е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы (групповой средней) и может быть исчислена по формуле простой или взвешенной дисперсии :

σ 2 i =
(простая формула);

σ 2 i =
(взвешенная).

На основании внутригрупповой дисперсии по каждой группе (σ 2 i ) можно определить общую средн юю из внутригрупповых дисперсий :

=
.

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

σ 2 общ = σ 2 межгр + .

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью - неизвестную, а также судить о силе влияния группировочного признака.

Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак.

В статистическом анализе широко используется эмпирический коэффициент детерминации (η 2) - показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

η 2 =
.

Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обусловливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации η 2 равен нулю, а при функциональной связи - единице. Если, например η 2 = 0,666, это значит, что на 66,6% вариация исследуемого показателя обусловлена различиями в значениях признака-фактора, положенного в основание группировки, и на 33,4% - влиянием прочих факторов.

Эмпирическое корреляционное отношение - это корень квадратный из эмпирического коэффициента детерминации:

η =
.

Оно показывает тесноту связи между группировочным и результативным признаками.

Эмпирическое корреляционное отношение η, как и η 2 , может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение η = 0, т. е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение η = 1. В этом случае межгрупповая дисперсия равна общей дисперсии (σ 2 межгр = σ 2), т. е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Подст-в в формулу дисперсии q = 1 - р, получим

Среднее квад-ое отклонение альтерн-ого признака

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:: V= σ / X‾ *100

Общая дисперсия σ 2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдель­ных значений признака х от общей средней х и может быть вычислена как простая дисперсия

Межгрупповая дисперсия δ 2 характеризует систематиче­скую вариацию результативного признака, обусловленную влия­нием признака-фактора, положенного в основание группиров­ки. Она равна среднему квадрату отклонений групповых (част­ных) средних X‾iот общей средней X‾:

Внутригрупповая (частная) дисперсия σ 2 i отражает случай­ную вариацию, т.е. часть вариации, обусловленную влиянием не­учтенных факторов и не зависящую от признака-фактора, поло­женного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы х) (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:

На основании внутригрупповой дисперсии по каждой груп­пе, т.е. на основании σ 2 i можно определить общую среднюю извнутригрупповых дисперсий:

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Внутригрупповые дисперсии показывают вариации выработ­ки в каждой группе, вызванные всеми возможными фактора­ми (техническое состояние оборудования, обеспеченность ин­струментами и материалами, возраст рабочих, интенсивность труда и т.д.) , кроме различий в квалификационном разряд. Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалифика­ции рабочих, но в среднем по всей совокупности. Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квали­фикационному разряду. Общая дисперсия отражает суммарное влияние всех возмож­ных факторов на общую вариацию среднечасовой выработки изделий всеми рабочими цеха.

Поэтому в статистическом анализе широко используется эм­пирический коэффициент детерминации (ή 2) - показатель, пред­ставляющий собой долю межгрупповой дисперсии в общей дис­персии результативного признака и характеризующий силу влия­ния группировочного признака на образование общей вариации:

ή 2 =δ 2 / σ 2 Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэф равен 0, а при функциональной связи – единице.Эмпирическое корреляционное отношение - это корень квад­ратный из эмпирического коэффициента детерминации: v

ή=√ δ 2 / σ 2 оно показывает тесноту связи между группировочным и ре­зультативным признаками.

Эмпирическое корреляционное отношение ή , как и ή 2 , может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный при­знак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком оп­ределяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к еди­нице, тем теснее, ближе к функциональной зависимости связь между признаками.

Ряды динамики

Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика . Эта задача решается при помощи анализа рядов динамики (временных рядов).

Ряд динамики (или временной ряд) – это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).

Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают буквой y . Первый член ряда y 1 называют начальным или базисным уровнем , а последний y n конечным . Моменты или периоды времени, к которым относятся уровни, обозначают через t .

Ряды динамики, как правило, представляют в виде таблицы или графика, причем по оси абсцисс строится шкала времени t , а по оси ординат – шкала уровней ряда y .

Показатели вариации

Показатели вариации характеризует колеблемость индивидуальных значений признака по отношению к среднему значению, что не менее важно, чем определение самой средней. Средняя не показывает строения совокупности, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом эти отличия велики, т.е. в одном случае вариация признака мала, а в другом велика.
Это можно показать на таком примере. Предположим, что две бригады из 3-х человек каждая выполняют одинаковую работу. Количество деталей, изготовленных за смену отдельными рабочими, составило:
в первой бригаде- 95, 100, 105;
во второй бригаде- 75, 100, 125.
Средняя выработка на одного рабочего в бригадах составила

, .
Средняя выработка одинакова, но колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.
Следовательно, чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот – варианты, мало отличающиеся друг от друга, более близки по значению к средней, которая в таком случае будет более реально представлять всю совокупность.

Поэтому для характеристики и измерения вариации признака в совокупности кроме средней используют следующие показатели:

  • абсолютные - вариационный размах, среднее линейное и среднее квадратическое отклонение, дисперсию;
  • относительные - коэффициенты вариации.

Вариационный размах (или размах вариации) - это разница между максимальным и минимальным значениями признака:

В нашем примере размах вариации сменной выработки рабочих составляет: в первой бригаде R=105-95=10 дет., во второй бригаде R=125-75=50 дет. (в 5 раз больше). Это говорит о том, что выработка 1-й бригады более «устойчива», но резервов роста выработки больше у второй бригады, т.к. в случае достижения всеми рабочими максимальной для этой бригады выработки, ею может быть изготовлено 3*125=375 деталей, а в 1-й бригаде только 105*3=315 деталей.
Недостатком показателя вариационного размаха является то, что его величина не отражает все колебания признака.
Простейшим обобщающим показателем, отражающим все колебания признака, является среднее линейное отклонение , представляющее собой среднюю арифметическую абсолютных отклонений отдельных вариант от их средней величины:
для несгруппированных данных
,
для сгруппированных данных
,
где хi – значение признака в дискретном ряду или середина интервала в интервальном распределении.
В вышеприведенных формулах разности в числителе взяты по модулю, иначе, согласно свойству средней арифметической, числитель всегда будет равен нулю. Поэтому среднее линейное отклонение в статистической практике применяют редко, только в тех случаях, когда суммирование показателей без учета знака имеет экономический смысл. С его помощью, например, анализируется состав работающих, рентабельность производства, оборот внешней торговли.
Дисперсия признака – это средний квадрат отклонений вариант от их средней величины:
простая дисперсия
,
взвешенная дисперсия
.
Формулу для расчета дисперсии можно упростить:

Таким образом, дисперсия равна разности средней из квадратов вариант и квадрата средней из вариант совокупности:
.
Однако, вследствие суммирования квадратов отклонений дисперсия дает искаженное представление об отклонениях, поэтому ее на основе рассчитывают среднее квадратическое отклонение , которое показывает, на сколько в среднем отклоняются конкретные варианты признака от их среднего значения. Вычисляется путем извлечения квадратного корня из дисперсии:
для несгруппированных данных
,
для вариационного ряда

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность, тем более надежной (типичной) будет средняя величина.
Среднее линейное и среднее квадратичное отклонение - именованные числа, т. е. выражаются в единицах измерения признака, идентичны по содержанию и близки по значению.
Рассчитывать абсолютные показатели вариации рекомендуется с помощью таблиц.
Таблица 3 – Расчет характеристик вариации (на примере срока данных о сменной выработке рабочих бригады)

Группы рабочих по выработке, шт.

Число рабочих,

Середина интервала,

Расчетные значения

170-190 10 180 1800 -36 360 1296 12960
190-210 20 200 4000 -16 320 256 5120
210-230 50 220 11000 4 200 16 800
230-250 20 240 4800 24 480 576 11520
Итого: 100 - 21600 - 1360 - 30400

Среднесменная выработка рабочих:

Среднее линейное отклонение:

Дисперсия выработки:

Среднее квадратическое отклонение выработки отдельных рабочих от средней выработки:
.

Вычисление дисперсий связано с громоздкими расчетами (особенно если средняя величина выражена большим числом с несколькими десятичными знаками). Расчеты можно упростить, если использовать упрощенную формулу и свойства дисперсии.
Дисперсия обладает следующими свойствами (доказываемые в математической статистике):

1. если все значения признака уменьшить или увеличить на одну и ту же величину А, то дисперсия от этого не уменьшится,


Расчет дисперсии альтернативного признака

Среди признаков, изучаемых статистикой, есть и такие, которым свойственны лишь два взаимно исключающих значения. Это альтернативные признаки. Им придается соответственно два количественных значения: варианты 1 и 0. Частостью варианты 1, которая обозначается p, является доля единиц, обладающих данным признаком. Разность 1-р=q является частостью варианты 0. Таким образом,

хi wi
1 p
0 q

Средняя арифметическая альтернативного признака
, т. к. p+q=1.

Дисперсия альтернативного признака
, т.к. 1-р=q
Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.
Если значения 1 и 0 встречаются одинаково часто, т. е. p=q, дисперсия достигает своего максимума pq=0,25.
Дисперсия альтернативного признака используется в выборочных обследованиях, например, качества продукции.

Последние материалы раздела:

Страна с трагической судьбой
Страна с трагической судьбой

Апофеозом гражданской войны в Анголе и Войны за независимость Намибии стала оборона ангольскими правительственными войсками, кубинскими...

Все, что нужно знать о бактериях
Все, что нужно знать о бактериях

Бактерии представляют собой одноклеточные безъядерные микроорганизмы, относящиеся к классу прокариотов. На сегодняшний день существует более 10...

Кислотные свойства аминокислот
Кислотные свойства аминокислот

Cвойства аминокислот можно разделить на две группы: химические и физические.Химические свойства аминокислотВ зависимости от соединений,...