Что такое автокорреляция остатков. Автокорреляция регрессионных остатков

Задание . Приведены данные за 15 лет по темпам прироста заработной платы Y(%), производительности труда X 1 (%), а также по уровню инфляции X 1 (%).
Постройте уравнение линейной регрессии прироста заработной платы от производительности труда и уровня инфляции. Проверьте качество построенного уравнения регрессии с надежностью 0,95. Проведите проверку наличия в модели автокорреляции на уровне значимости 0,05.

Решение находим с помощью калькулятора .
Уравнение множественной регрессии может быть представлено в виде:
Y = f(β , X) + ε
где X = X(X 1 , X 2 , ..., X m) - вектор независимых (объясняющих) переменных; β - вектор параметров (подлежащих определению); ε - случайная ошибка (отклонение); Y - зависимая (объясняемая) переменная.
теоретическое линейное уравнение множественной регрессии имеет вид:
Y = β 0 + β 1 X 1 + β 2 X 2 + ... + β m X m + ε
β 0 - свободный член, определяющий значение Y, в случае, когда все объясняющие переменные X j равны 0.

Прежде чем перейти к определению нахождения оценок коэффициентов регрессии, необходимо проверить ряд предпосылок МНК.
Предпосылки МНК.
1. Математическое ожидание случайного отклонения ε i равно 0 для всех наблюдений (M(ε i) = 0).
2. Гомоскедастичность (постоянство дисперсий отклонений). Дисперсия случайных отклонений ε i постоянна: D(ε i) = D(ε j) = S 2 для любых i и j.
3. отсутствие автокорреляции.
4. Случайное отклонение должно быть независимо от объясняющих переменных: Y eixi = 0.
5. Модель является линейное относительно параметров.
6. отсутствие мультиколлинеарности. Между объясняющими переменными отсутствует строгая (сильная) линейная зависимость.
7. Ошибки ε i имеют нормальное распределение. Выполнимость данной предпосылки важна для проверки статистических гипотез и построения доверительных интервалов.

Эмпирическое уравнение множественной регрессии представим в виде:
Y = b 0 + b 1 X 1 + b 1 X 1 + ... + b m X m + e
Здесь b 0 , b 1 , ..., b m - оценки теоретических значений β 0 , β 1 , β 2 , ..., β m коэффициентов регрессии (эмпирические коэффициенты регрессии); e - оценка отклонения ε.
При выполнении предпосылок МНК относительно ошибок ε i , оценки b 0 , b 1 , ..., b m параметров β 0 , β 1 , β 2 , ..., β m множественной линейной регрессии по МНК являются несмещенными, эффективными и состоятельными (т.е. BLUE-оценками).

Для оценки параметров уравнения множественной регрессии применяют МНК.
1. Оценка уравнения регрессии .
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения:
s = (X T X) -1 X T Y
Матрица X

1 3.5 4.5
1 2.8 3
1 6.3 3.1
1 4.5 3.8
1 3.1 3.8
1 1.5 1.1
1 7.6 2.3
1 6.7 3.6
1 4.2 7.5
1 2.7 8
1 4.5 3.9
1 3.5 4.7
1 5 6.1
1 2.3 6.9
1 2.8 3.5

Матрица Y

9
6
8.9
9
7.1
3.2
6.5
9.1
14.6
11.9
9.2
8.8
12
12.5
5.7

Матрица X T

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
3.5 2.8 6.3 4.5 3.1 1.5 7.6 6.7 4.2 2.7 4.5 3.5 5 2.3 2.8
4.5 3 3.1 3.8 3.8 1.1 2.3 3.6 7.5 8 3.9 4.7 6.1 6.9 3.5

Умножаем матрицы, (X T X)


Находим обратную матрицу (X T X) -1
0.99 -0.12 -0.1
-0.12 0.0246 0.00393
-0.1 0.00393 0.0194

Вектор оценок коэффициентов регрессии равен
s = (X T X) -1 X T Y =

y(x) =
0,99 -0,12 -0,1
-0,12 0,0246 0,00393
-0,1 0,00393 0,0194
*
133,5
552,41
659,84
=
0,27
0,53
1,48

Уравнение регрессии (оценка уравнения регрессии)
Y = 0.27 + 0.53X 1 + 1.48X 2
Проверка на наличие автокорреляции остатков .
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В экономических задачах значительно чаще встречается положительная автокорреляция , нежели отрицательная автокорреляция . В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
Среди основных причин, вызывающих автокорреляцию , можно выделить следующие:
1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
Последствия автокорреляции схожи с последствиями гетероскедастичности : выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.
Обнаружение автокорреляции
1. Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения ε i с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения ε i (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости ε i от ε i-1
2. Коэффициент автокорреляции .

Если коэффициент автокорреляции r ei 3. Критерий Дарбина-Уотсона .
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин e i .

y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
9 8.77 0.23 0.053 0
6 6.18 -0.18 0.0332 0.17
8.9 8.17 0.73 0.53 0.83
9 8.26 0.74 0.55 0.000109
7.1 7.52 -0.42 0.18 1.35
3.2 2.69 0.51 0.26 0.88
6.5 7.67 -1.17 1.37 2.83
9.1 9.12 -0.0203 0.000412 1.32
14.6 13.58 1.02 1.05 1.09
11.9 13.53 -1.63 2.65 7.03
9.2 8.41 0.79 0.63 5.86
8.8 9.07 -0.27 0.0706 1.12
12 11.93 0.0739 0.00546 0.12
12.5 11.69 0.81 0.66 0.54
5.7 6.92 -1.22 1.49 4.13
9.53 27.27

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона :

DW = 27.27/9.53 = 2.86
Критические значения d 1 и d 2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 15 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d 1 Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 2.5, то автокорреляция остатков присутствует .
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=15 и k=1 (уровень значимости 5%) находим: d 1 = 1.08; d 2 = 1.36.
Поскольку 1.08 присутствует.




Определение автокорреляции Автокорреляция (последовательная корреляция) – это корреляция между наблюдаемыми показателями во времени (временные ряды) или в пространстве (перекрестные данные). Автокорреляция остатков характеризуется тем, что не выполняется предпосылка 3 0 использования МНК:




Причины чистой автокорреляции 1. Инерция. Трансформация, изменение многих экономических показателей обладает инерционностью. 2. Эффект паутины. Многие экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом) 3. Сглаживание данных. Усреднение данных по некоторому продолжительному интервалу времени.














Пример влияния автокорреляции на случайную выборку Рассмотрим выборку из 50 независимых нормально распределенных с нулевым средним значений i. С целью ознакомления с влиянием автокорреляции будем вводить в нее положительную, а затем отрицательную автокорреляцию.


















Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ АВТОКОРРЕЛЯЦИЯ ПРИМЕР Зависимость расходов на жилье от располагаемого дохода и индекса цен на жилье











Последствия автокорреляции 1. Истинная автокорреляция не приводит к смещению оценок регрессии, но оценки перестают быть эффективными. 2. Автокорреляция (особенно положительная) часто приводит к уменьшению стандартных ошибок коэффициентов, что влечет за собой увеличение t-статистик. 3. Оценка дисперсии остатков S e 2 является смещенной оценкой истинного значения e 2, во многих случаях занижая его. 4. В силу вышесказанного выводы по оценке качества коэффициентов и модели в целом, возможно, будут неверными. Это приводит к ухудшению прогнозных качеств модели.






Автокорреляционная функция AutocorrelationPartial CorrelationAC PAC Q-Stat Prob. |*******. |******* |******|. |. | |******|. |. | |***** |. |. | |***** |. |. | |**** |. |. | |**** |. |. | |*** |. |. | |*** |. |. | |*** |. |. | |** |. |. | |** |. |. | |*. |. |. | |*. |. |. | |. |. |. | |. |. |. | |. |. |. | *|. |. |. | *|. |. |. | *|. |. |. |





Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ 3 Расходы на жилье в зависимости от доходов и реальных цен














14 Противоположный эффект в 1960 to Расходы на жилье в зависимости от доходов и реальных цен




Критерий знаков Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Приписать каждому остатку знак (+/-) 3.Построить ряд знаков При истинности гипотезы ряд должен носить случайный характер распределения 4.Подсчитать общее количество серий (последовательностей постоянного знака) - (n) 5.Подсчитать длину самой длинной серии - (n) 6.Сравнить полученные значения с критическими


Критерий знаков Проверяемая гипотеза: H0: автокорреляция отсутствует Приблизительный критерий проверки гипотезы на уровне значимости 2,5% 5,0% : При истинности гипотезы должна выполняться система неравенств: подробности см. в учебнике Айвазян, Мхитарян «Прикладная статистика и основы эконометрики»




Критерий восходящих и нисходящих серий Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить разницу между соседними остатками, t =e t+1 -e t 3.Приписать каждой разнице у знак (+/-) 4.Построить ряд знаков При отсутствии автокорреляции ряд должен носить случайный характер 5.Подсчитать общее количество серий (последовательностей постоянного знака) - (n) 6.Подсчитать длину самой длинной серии - (n) 7.Сравнить полученные значения с критическими






Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n> * При n>60 кр"> * При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> * При n>60 кр" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n>60 кр"> title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n>60 кр">


60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" class="link_thumb"> 56 Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона): 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):">




Тест Дарбина-Уотсона. Ограничения Ограничения: 1. Тест не предназначен для обнаружения других видов автокорреляции (более чем первого) и не обнаруживает ее. 2. В модели должен присутствовать свободный член. 3. Данные должны иметь одинаковую периодичность (недолжно быть пропусков в наблюдениях). 4. Тест не применим к авторегрессионным моделям, содержащих в качестве объясняющей переменной зависимую переменную с единичным лагом:






Критические точки распределения Дарбина-Уотсона Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое – о ее наличии, построена таблица критических точек распределения Дарбина-Уотсона. По этой таблице для заданного уровня значимости, числа наблюдений n и количества объясняющих переменных m определяются два значения: d l – нижняя граница, d u – верхняя граница




Расположение критических точек распределения Дарбина-Уотсона При положительной корреляции: При отрицательной корреляции: При отсутствии корреляции: 24 0 dLdL dUdU d crit Положительная автокорреляция Отрицательная автокорреляция Отсутствие автокорреляции d crit 4-d L 4-d U






Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ Как и следовало ожидать- имеем положительную автокорреляцию остатков ТЕСТ ДАРБИНА-УОТСОНА ДЛЯ ПРОЦЕССА AR(1) dLdL dUdU (n = 45, k = 3, 1% level)




Устранение автокорреляции первого порядка. Обобщения Рассмотренное авторегрессионное преобразование может быть обобщено на: 1) Произвольное число объясняющих переменных 2) Преобразования более высоких порядков AR(2), AR(3) и т.д.: Однако на практике значения коэффициента автокорреляции обычно неизвестны и его необходимо оценить. Существует несколько методов оценивания.






Итеративная процедура Кохрейна-Оркатта (на примере парной регрессии) 1. Определение уравнения регрессии и вектора остатков: 2. В качестве приближенного значения берется его МНК-оценка: 3. Для найденного * оцениваются коэффициенты 0 1: 4. Подставляем в (*) и вычисляем Возвращаемся к этапу 2. Критерий остановки: разность между текущей и предыдущей оценками * стала меньще заданной точности.


Итеративная процедура Хилдрета-Лу (поиск по сетке) 1. Определение уравнения регрессии и вектора остатков: 2. Оцениваем регрессию для каждого возможного значения [ 1,1] с некоторым достаточно малым шагом, например 0,001; 0,01 и т.д. 3. Величина *, обеспечивающая минимум стандартной ошибки регрессии принимается в качестве оценки автокорреляции остатков.


Итеративные процедуры оценивания коэффициента. Выводы 1. Сходимость процедур достаточно хорошая. 2. Метод Кохрейна-Оркатта может «попасть» в локальный (а не глобальный) минимум. 3. Время работы процедуры Хилдрета-Лу значительно сокращается при наличии априорной информации об области возможных значений. Процедура Дарбина представляет собой традиционный МНК снелинейными ограничениями типа равенств: Способы решения: 1. Решать задачу нелинейного программирования. 2. Двухшаговый МНК Дарбина (полученный коэффициент автокорреляции используется в поправке Прайса-Винстена). 3. Итеративная процедура расчета. Процедура Дарбина (на примере парной регрессии)


Процедура Дарбина Ограничения на коэффициенты записываются в явном виде ============================================================ Dependent Variable: LGHOUS Method: Least Squares Sample(adjusted): LGHOUS=C(1)*(1-C(2))+C(2)*LGHOUS(-1)+C(3)*LGDPI-C(2)*C(3) *LGDPI(-1)+C(4)*LGPRHOUS-C(2)*C(4)*LGPRHOUS(-1) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) C(2) C(3) C(4) ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood Durbin-Watson stat ============================================================


Dependent Variable: LGHOUS Method: Least Squares Sample(adjusted): Included observations: 44 after adjusting endpoints Convergence achieved after 21 iterations ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS AR(1) ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ Либо в список регрессоров включается авторегриссионный член 1 порядка AR(1) Процедура Дарбина


Dependent Variable: LGHOUS LGHOUS=C(1)*(1-C(2))+C(2)*LGHOUS(-1)+C(3)*LGDPI-C(2)*C(3) *LGDPI(-1)+C(4)*LGPRHOUS-C(2)*C(4)*LGPRHOUS(-1) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) C(2) C(3) C(4) ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS AR(1) ============================================================ Процедура Дарбина


Итеративная процедура метода Дарбина 1. Считается регрессия и находятся остатки. 2. По остаткам находят оценку коэффициента автокорреляции остатков. 3. Оценка коэффициента автокорреляции используется для пересчета данных и цикл повторяется. Процесс останавливается, как только обеспечивается достаточная точность (результаты перестают существенно улучшаться).


Обобщенный метод наименьших квадратов. Замечания 1. Значимый коэффициент DW может указывать просто на ошибочную спецификацию. 2. Последствия автокорреляции остатков иногда бывают незначительными. 3. Качество оценок может снизиться из-за уменьшения числа степеней свободы (нужно оценивать дополнительный параметр). 4. Значительно возрастает трудоемкость расчетов. Не следует применять обобщенный МНК автоматически



Вернемся еще раз к предположению (3.3). Из него, в частности, следует, что ковариации случайной ошибки для разных наблюдений равны нулю. Если к тому же случайные ошибки распределены нормально, то это означает их попарную независимость.

Однако регрессионные модели в экономике часто содержат стохастические зависимости между значениями случайных ошибок – автокорреляцию ошибок . Ее причинами являются: во-первых, влияние некоторых случайных факторов или опущенных в уравнении регрессии важных объясняющих переменных, которое не является однократным, а действует в разные периоды времени; во-вторых, случайный член может содержать составляющую, учитывающую ошибку измерения объясняющей переменной.

Применение к модели с автокорреляцией остатков обыкновенного МНК приведет к следующим последствиям :

1. Выборочные дисперсии полученных оценок коэффициентов будут больше по сравнению с дисперсиями по альтернативным методам оценивания, т.е. оценки коэффициентов будут неэффективны.

2. Стандартные ошибки коэффициентов будут оценены неправильно, чаще всего занижены, иногда настолько, что нет возможности воспользоваться для проверки гипотез соответствующими точными критериями – мы будем чаще отвергать гипотезу о незначимости регрессии, чем это следовало бы делать в действительности.

3. Прогнозы по модели получаются неэффективными.

На практике исследователь в этом случае поставлен перед проблемой тестирования наличия в модели автокорреляции, а также выявления причины автокорреляции при ее обнаружении: или в модели опущена существенная переменная, или структура ошибок зависит от времени. То есть, исследование остатков позволяет судить о правильности модели и ее пригодности для прогнозирования.

Простейшим способом проверки наличия автокорреляции является графическое изображение остатков e i . Возможно построение:

· графика временной последовательности, если остатки получены в разные моменты времени;

· графика зависимости остатков от значений , полученных по регрессии;



· графиков зависимости остатков от объясняющих переменных.

Если изображение остатков представляет собой горизонтальную полосу, это указывает на отсутствие каких-либо проблем, связанных с моделью. В противном случае в зависимости от вида и типа графика можно получить информацию о: неадекватности модели, ошибочности расчетов, необходимости включения в модель линейного или квадратичного члена от времени; наконец о непостоянстве дисперсии.

Ясно, что ошибки могут коррелировать по-разному, однако без нарушения общности можно рассматривать так называемую сериальную корреляцию (автокорреляцию), когда зависимость между ошибками, отстоящими на некоторое количество шагов s , называемое порядком корреляции (в частности, на один шаг, s =1), остается одинаковой, что хорошо проявляется визуально на графике в системе координат (e i ; e i - s ). Например, для s =1 на рис. 4.2 показаны отрицательная (слева) и положительная (справа) автокорреляция остатков. В экономических исследованиях чаще всего встречается положительная автокорреляция.


Рис. 4.2. Автокорреляция остатков

Более достоверным способом проверки существования автокорреляции является применение статистических критериев. Хорошо известны два – критерий знаков (относится к непараметрическим критериям) и критерий Дарбина-Уотсона .

Для проведения проверки по критерию знаков необходимо расположить остатки e i во временной последовательности, выписать их знаки, подсчитать число образующихся при этом серий n u из одинаковых знаков, а также n 1 – число остатков со знаком плюс и n 2 – число остатков со знаком минус. Далее определяется вероятность Pr (n u ) появления n u групп при нулевой гипотезе – последовательность остатков полностью случайна (автокорреляция отсутствует). Если Pr (n u ) < 1–a , где a – уровень доверия, то нулевая гипотеза отвергается.

Для ускорения расчетов для выборок с n 1 , n 2 не больше 20 составлены таблицы с критическими значениями n u при уровне доверия a =0,05.

Для больших выборок истинное распределение ошибок достаточно точно аппроксимируется нормальным со средним m =2n 1 n 2 /(n 1 +n 2)+1 и дисперсией s 2 =2n 1 n 2 (2n 1 n 2 – n 1 – n 2)/(n 1 + n 2) 2 /(n 1 + n 2 – 1), а величина z =(u m + 0,5)/s подчиняется нормированному нормальному распределению, следовательно, критические значения n u могут быть вычислены по формулам (m + z a s ) и (m z a s ), где z a определяется из условия F 0 (z a )=(1–a )/2 (значения даны в справочниках).

Пример . Получены остатки 0,6; 1,9; –1,8; –2,7; –2,9; 1,4; 3,3; 0,3; 0,8; 2,3; –1,4; –1,1, которые обнаруживают следующую последовательность знаков + + – – – + + + + + – –. Имеем n u =4, n 1 =7, n 2 =5. По таблице находим критические значения для n u : 3 и 11. Так как 3 < n u < 11, то нулевая гипотеза принимается, то есть остатки независимы и автокорреляция отсутствует.Ñ

Критерий знаков достаточно прост и не использует информацию о величине e i , и поэтому недостаточно эффективен.

Для проверки гипотезы о существовании линейной автокорреляции первого порядка, которая чаще всего имеет место на практике, предпочтителен критерий Дарбина-Уотсона , основанный на статистике:

(4.9)

Значения первых разностей ошибки в (4.9) будут обнаруживать тенденцию к уменьшению по абсолютной величине по сравнению с абсолютными значениями e i при положительной автокорреляции и к увеличению при отрицательной автокорреляции.

Для статистики d имеются верхний d U и нижний d L пределы уровня значимости. Различные статистические решения для нулевой гипотезы H 0: автокорреляция равна нулю, даны в табл. 4.3. При этом появляются области неопределенности, так как величина e i зависит не только от значений u , но и от значений последовательных X .

Следует отметить, что критерий Дарбина-Уотсона предназначен для моделей с детерминированными (нестохастическими) регрессорами X и не применим, например, в случаях, когда среди объясняющих переменных есть лаговые значения переменной Y .

Таблица 4.3

Области статистических решений для критерия Дарбина-Уотсона

Пример . Для примера 1 из п. 3.2 n =20, k =2 имеем табл. 4.4.

Значения d L и d U при уровне значимости 5% получим из справочника при n =20 и k =2: d L =1,10, d U =1,54.

Так как d >2, то вычисляем 4–d U =2,46 и 4–d L =2,90 и 2<d <4–d U .

Согласно табл. 4.3 гипотеза о равенстве нулю автокорреляции принимается. Ñ

Какой бы тест на автокорреляцию не использовался, необходимо помнить, что рекомендуется в случаях неопределенности (см. табл. 4.3) принимать гипотезу о наличии автокорреляции, поскольку это гарантирует от отрицательных последствий автокорреляции. В случаях же некорректного принятия гипотезы о равенстве нулю автокорреляции получаем модель, которая не может иметь удовлетворительного применения, хотя формально проходит все проверки.

Таблица 4.4

Вычисление значения статистики d

Ошибка e i e i 2 e i-1 (e i -e i-1 ) 2 Ошибка e i e i 2 e i -1 (e i -e i -1) 2
-2,49 6,20 -0,68 0,46 -8,72 64,64
-1,86 3,46 -2,49 0,40 5,27 27,72 -0,68 35,40
31,93 1019,21 -1,86 1141,76 -5,29 27,93 5,27 111,51
-3,18 10,11 31,93 1232,71 -16,74 280,23 -5,29 131,10
-2,17 4,71 -3,18 1,02 8,94 79,87 -16,74 659,46
-18,38 337,64 -2,17 262,76 -3,57 12,74 8,94 156,50
-3,45 11,90 -18,38 222,90 5,18 26,79 -3,57 76,56
5,58 31,14 -3,45 81,54 7,72 59,60 5,18 6,45
-3,11 9,67 5,58 75,52 -0,85 0,72 7,72 73,44
-8,72 76,04 -3,11 31,47 4,85 23,47 -0,85 32,49
Сумма 2050,37 4397,66

Рассмотрим методы оценивания уравнения регрессии при наличии автокорреляции остатков.

Пусть имеем обобщенную линейную модель множественной регрессии в виде (4.3)-(4.7) с гомоскедастичными остатками .

Предположим, что остатки u i удовлетворяют следующему уравнению:

u i =ru i -1 +e i , i =2,...,n , (4.10)

E (e i )=0; (4.11)

Тогда несложно показать, что будет выполняться:

. (4.12)

Условие (4.12) является аналогом (4.5) и фактически означает гомоскедастичность дисперсии случайного члена (первая строчка) и автокорреляцию первого порядка (вторая строчка). Ясно, что если бы было известно значение r в (4.10) и затем в (4.12), то можно было бы применить ОМНК (элементы матрицы W в этом случае вычисляются согласно (4.12)) и получить эффективные оценки коэффициентов регрессии. Однако на практике значение r в большинстве случаев не известно, поэтому используются следующие методы оценивания регрессионной модели.

Метод 1 . Отказавшись от определения величины r , являющейся узким местом модели, статистически, можно положить r =0,5; 1 или -1. Однако даже грубая статистическая оценка будет, видимо, более эффективной, поэтому другой способ определения r с помощью статистики Дарбина-Уотсона r»1–0,5d . Применяя затем непосредственно ОМНК, получим оценки коэффициентов.

Метод 2 . Если значение r в (4.12) задано, то альтернативная схема отыскания оценок коэффициентов модели множественной регрессии суть (в целях упрощения, не нарушая общности, иллюстрация метода дана для случая парной регрессии):

а) Запишем уравнение модели для случая i и i –1:

Вычтем из обеих частей первого уравнения умноженное на r второе уравнение:

Метод 3 . Итеративная процедура Кохрейна-Оркатта.

а) Оценивается регрессия с исходными не преобразованными данными с помощью обыкновенного МНК.

б) Вычисляются остатки e i .

в) Оценивается регрессия e i =re i -1 +e i , и коэффициент при e i -1 дает оценку r .

г) С учетом полученной оценки r уравнение преобразовывается к виду (4.13), оценивание которого позволяет получить пересмотренные оценки коэффициентов b 0 и b 1 .

д) Вычисляются остатки регрессии (4.13) и процесс выполняется снова, начиная с этапа в).

Итерации заканчиваются, когда абсолютные разности последовательных значений оценок коэффициентов b 0 , b 1 и r будут меньше заданного числа (точности).

Подобная процедура оценивания порождает проблемы, касающиеся сходимости итерационного процесса и характера найденного минимума: локальный или глобальный.

Метод 4. Метод Хилдрета-Лу основан на тех же принципах, что и рассмотренный метод 3, но использует другой алгоритм вычислений. Здесь регрессия (4.13) оценивается МНК для каждого значения r из диапазона [-1, 1] с некоторым шагом внутри него. Значение, которое дает минимальную стандартную ошибку для преобразованного уравнения (4.13), принимается в качестве оценки r , а коэффициенты регрессии определяются при оценивании уравнения (4.13) с использованием этого значения.

Метод 5. Дарбиным была предложена простая схема, дающая эффективные оценки коэффициентов:

а). Подставляя (4.10) в модель Y i =b 0 +b 1 X i +u i , получим с учетом u i - 1 = Y i -1 - b 0 - b 1 X i -1:

Y i =b 0 (1-r )+rY i -1 +b 1 (X i - rX i -1) + e i ,

где ошибка e i удовлетворяет (4.11). Применяя обыкновенный МНК к последней модели, получаем оценку r как коэффициента при Y i -1 .

б). Вычисляем значения преобразованных переменных и применяем к ним обыкновенный МНК. Получаем искомые оценки коэффициентов регрессии.

Достоинством метода является простота его распространения на случай автокорреляции более высокого порядка.

Как показывают эксперименты, проведенные для малых выборок, лучшим является двухшаговый метод 2, использующий оценку r , полученную по методу, предложенному Дарбиным (метод 5 шаг а)).

Регрессионная модель МНК позволяет получить несмещенную оценку с минимальной дисперсией только тогда, когда остатки независимы друг от друга. Нарушение условия независимости остатков () называется автокорреляцией. Если имеет место автокорреляция остатков, то коэффициенты регрессии не смещены, но стандартные ошибки недооценены, а проверка статистической значимости коэффициентов ненадежна. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих наблюдений. Автокорреляция остатков обычно встречается в регрессионном анализе при использовании данных временных рядов. В силу этого в дальнейших выкладках вместо символа i порядкового номера наблюдения будем использовать символ t, отражающий момент наблюдения. Объем выборки при этом будем обозначать T.

Причины автокорреляции:

Ошибки спецификации – неучет в модели важной объясняющей переменной или неправильный выбор формы зависимости;

Эффект паутины – многие экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).

Методы обнаружения автокорреляции

В силу неизвестности значений параметров уравнения регрессии неизвестными будут также и истинные значения отклонений ,t= 1, 2, ..., Т. Поэтому выводы об их независимости осуществляются на основе оценок ε t ,t= 1, 2, ..., Т, полученных из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

Метод рядов.

Последовательно определяются знаки отклонений ,t= 1, 2, ..., Т.

Например, (- - - - -)(+++++++)(- - -)(++++)(-),

т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-».

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называетсядлиной ряда .

Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений п , то вполне вероятна положительная автокорреляция. (В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов). Если же рядов слишком много, то вероятна отрицательная автокорреляция. Для более детального анализа предлагается следующая процедура. Пусть

п - объем выборки;

п 1 - общее количество знаков «+» прип наблюдениях;

п 2 - общее количество знаков «-» прип наблюдениях; .

k- количество рядов.

Если при достаточно большом количестве наблюдений (n 1 >10,п 2 >10) количество рядовkлежит в пределах

то гипотеза об отсутствии автокорреляции не отклоняется.

Для небольшого числа наблюдений (n 1 <20,n 2 <20) Свед и Эйзенхарт разработали таблицы критических значенийk 1 ,k 2 отn 1 ,n 2 .

Если , то говорят об отсутствии автокорреляции;

если , говорят о положительной автокорреляции остатков;

если , говорят об отрицательной автокорреляции остатков.

В нашем примере: n=20,n 1 =11,n 2 =9,k=5. По таблицамk 1 =6,k 2 =16. Пронимается предположение о наличии положительной автокорреляции на уровне значимости 0,05.

Для проверки автокорреляции первого порядка (для регрессии временных рядов) необходимо рассчитать критерий Дарбина-Уотсона . Он определяется так:

.

Эмпирическое правило гласит, что если критерий Дарбина- Уотсона равен двум, то не существует положительной автокорреляции, если он равен нулю, то имеет место совершенная положительная автокорреляция, а если он равен четырем, то имеет место совершенная отрицательная автокорреляция. Критерий Дарбина-Уотсона имеет выборочное распределение, которое обладает двумя критическими значениями: d L – нижняя границаиd U – верхняя граница.

Существуют два наиболее распространенных метода определения автокорреляции остатков. Первый метод -- это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод - использование критерия Дарбина -- Уотсона и расчет величины

Согласно (4.1) величина d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Практически во всех статистических ППП значение критерия Дарбина - Уотсона указывается наряду с коэффициентом детерминации, значениями t- и F- критериев.

Коэффициент автокорреляции остатков первого порядка определяется как


Между критерием Дарбина-Уотсона и коэффициентом автокорреляции остатков первого порядка имеет место следующее соотношение:

Таким образом, если в остатках существует полная положительная автокорреляция и = 1, то d = 0. Если в остатках полная отрицательная автокорреляция, то = - 1 и, следовательно, d = 4. Если автокорреляция остатков отсутствует, то = 0 и d = 2. Следовательно, 0 ??d ??4.

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н1 и Н1* состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по таблице (приложение А) определяются критические значения критерия Дарбина-Уотсона dL и dU для заданного числа наблюдений n , числа независимых переменных модели k и уровня значимости a . По этим значениям числовой промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1-a ) рассматривается на рис. 4.1.


Рис. 4.1.

Если фактическое значение критерия Дарбина - Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу H0.

Пример 4.1. Проверка гипотезы о наличии автокорреляции в остатках.

Исходные данные, значения?t и результаты промежуточных расчетов

представлены в табл. 4.1.

Таблица 4.1 - Расчет критерия Дарбина-Уотсона для модели зависимости потребления от дохода


Фактическое значение критерия Дарбина-Уотсона для этой модели составляет d = 4,1233/1,6624 = 2,48. Сформулируем гипотезы:

Н0 - в остатках нет автокорреляции;

Н1 - в остатках есть положительная автокорреляция;

Н1* - в остатках есть отрицательная автокорреляция.

Зададим уровень значимости a = 0,05. По таблицам значений критерия Дарбина-Уотсона определим для числа наблюдений n = 7 и числа независимых переменных модели k " = 1 критические d L = 0,700 и d U = 1,356. Получим следующие промежутки внутри интервала

Рис. 4.2.

Фактическое значение d = 2,48 попадает в промежуток от d U до 4 - d U. Следовательно, нет оснований отклонять гипотезу H0 об отсутствии автокорреляции в остатках.

Есть несколько существенных ограничений на применение критерия Дарбина-Уотсона. Во-первых, он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака, т. е. к моделям авторегрессии. Во-вторых, методика расчета и использования критерия Дарбина - Уотсона направлена только на выявление автокорреляции остатков первого порядка. При проверке остатков на автокорреляцию более высоких порядков следует применять другие методы. В-третьих, критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок.

1. 0ценивание параметров уравнения регрессии при наличии автокорреляции в остатках

Обратимся к уравнению регрессии

Примем некоторые допущения относительно этого уравнения:

  • 1. пусть уt и хt не содержат тенденции, например, представляют собой отклонения выравненных по трендам значений от исходных уровней временных рядов;
  • 2. пусть оценки а и b параметров уравнения регрессии найдены обычным МНК;
  • 3. пусть критерий Дарбина - Уотсона показал наличие автокорреляции в остатках первого порядка.

Основной подход к оценке параметров модели регрессии в случае, когда имеет место автокорреляция остатков, заключается в следующем: исходная модель регрессии (5.1) с помощью замены переменных приводится к виду


Здесь - коэффициент автокорреляции первого порядка.

Поскольку ut, - случайная ошибка, то для оценки параметров преобразованного уравнения можно применять обычный МНК.

Итак, если остатки по исходному уравнению регрессии содержат автокорреляцию, то для оценки параметров уравнения используют обобщенный МНК.

Его реализация разбивается на следующие этапы:

  • 1. Перейти от исходных переменных уt и хt к переменным у"t их"t по формулам (5.3).
  • 2. Применив обычный МНК к уравнению (5.2), определить оценки параметров а " и b .
  • 3. Рассчитать параметр а исходного уравнения из соотношения (4.9) как

4. Выписать исходное уравнение (5.1).

Обобщенный метод наименьших квадратов аналогичен методу последовательных разностей. Однако мы вычитаем из уt (или хt) не все значение предыдущего уровня уt-1 (или x t-1), а некоторую его долю r ?1· уt-1 (или r ?1· x t-1). Если r ?1 = 1, то данный метод есть просто метод первых разностей, так как

Поэтому в случае, если значение критерия Дарбина - Уотсона близко к нулю, применение метода первых разностей вполне обоснованно.

Основная проблема, связанная с применением данного метода, заключается в том, как получить оценку r ?1. Основными способами являются оценка этого коэффициента непосредственно по остаткам, полученным по исходному уравнению регрессии, и получение его приближенного значения из соотношения между коэффициентом автокорреляции остатков первого порядка и критерием Дарбина-Уотсона

Последние материалы раздела:

Генрих Мореплаватель: биография и интересные факты
Генрих Мореплаватель: биография и интересные факты

Португальский принц Энрике Мореплаватель совершил множество географических открытий, хотя сам выходил в море всего три раза. Он положил начало...

Последнее восстание интеллектуалов Франция 1968 год волнения студентов
Последнее восстание интеллектуалов Франция 1968 год волнения студентов

Любой революции предшествует идеологическая аргументация и подготовка. «Майская революция» 1968 года, бесспорно, не является исключением. Почему к...

Другое название индейцев сиу сканворд
Другое название индейцев сиу сканворд

Равнинные сиу являлись самой западной частью племен группы сиу и, соответственно, принадлежали к сиуязычной семье. Их ранняя история ничем не...