Построение доверительного интервала для прогнозного значения. где n - число уровней временного ряда, для которых определялось прогнозное значение

Одной из центральных задач эконометрического моделирования является предсказание (прогнозирование) значений зависимой переменной при определенных значениях объясняющих переменных при определенных значениях объясняющих переменных. Здесь возможен двоякий подход: либо предсказать условное математическое ожидание зависимой переменной (предсказание среднего значения ), либо прогнозировать некоторое конкретное значение зависимой переменной (предсказание конкретного значения ).

Замечание. Некоторые авторы различают такие понятия, как прогнозирование и предсказание. Если значение объясняющей переменной X известно точно, то оценивание зависимой переменной Y называется предсказанием . Если же значение объясняющей переменной X неизвестно точно, то говорят, что делается прогноз значения Y . Такая ситуация характерна для временных рядов. В данном случае мы не будем различать предсказание и прогноз.

Различают точечное и интервальное прогнозирование. В первом случае оценка – некоторое число, во втором – интервал, в котором находится истинное значение зависимой переменной с заданным уровнем значимости.

а) Предсказание среднего значения . Пусть построено уравнение парной регрессии , на основе которого необходимо предсказать условное математическое ожидание . В данном случае значение является точечной оценкой . Тогда естественно возникает вопрос, как сильно может отклониться модельное значение , рассчитанное по эмпирическому уравнению, от соответствующего условного математического ожидания. Ответ на этот вопрос даётся на основе интервальных оценок, построенных с заданным уровнем значимости a при любом конкретном значении x p объясняющей переменной.

Запишем эмпирическое уравнение регрессии в виде

Здесь выделены две независимые составляющие: средняя и приращение . Отсюда вытекает, что дисперсия будет равна

Из теории выборки известно, что

Используя в качестве оценки s 2 остаточную дисперсию S 2 , получим



Дисперсия коэффициента регрессии, как уже было показано

Подставляя найденные дисперсии в (5.41), получим

. (5.56)

Таким образом, формула расчета стандартной ошибки предсказываемого по линии регрессии среднего значения Y имеет вид

. (5.57)

Величина стандартной ошибки , как видно из формулы, достигает минимума при , и возрастает по мере удаления от в любом направлении. Иными словами, больше разность между и , тем больше ошибка с которой предсказывается среднее значение y для заданного значения x p . Можно ожидать наилучшие результаты прогноза, если значения x p находятся в центре области наблюдений X и нельзя ожидать хороших результатов прогноза по мере удаления от .

Случайная величина

(5.58)

имеет распределение Стьюдента с числом степеней свободы n=n –2 (в рамках нормальной классической модели ). Следовательно, по таблице критических точек распределения Стьюдента по требуемому уровню значимости a и числу степеней свободы n=n –2 можно определить критическую точку , удовлетворяющую условию

.

С учетом (5.46) имеем:

.

Отсюда, после некоторых алгебраических преобразований, получим, что доверительный интервал для имеет вид:

, (5.59)

где предельная ошибка D p имеет вид

. (5.60)

Из формул (5.57) и (5.60) видно, что величина (длина) доверительного интервала зависит от значения объясняющей переменной x p : при она минимальна, а по мере удаления x p от величина доверительного интервала увеличивается (рис. 5.4). Таким образом, прогноз значений зависимой переменной Y по уравнению регрессии оправдан, если значение x p объясняющей переменной X не выходит за диапазон ее значений по выборке (причем более точный, чем ближе x p к ). Другими словами, экстраполяция кривой регрессии, т.е. её использование вне пределов обследованного диапазона значений объясняющей переменной (даже если она оправдана для рассматриваемой переменной исходя из смысла решаемой задачи) может привести к значительным погрешностям .

б) Предсказание индивидуальных значений зависимой переменной . На практике иногда более важно знать дисперсию Y , чем ее средние значения или доверительные интервалы для условных математических ожиданий. Это связано с тем, что фактические значения Y варьируют около среднего значения . Индивидуальные значения Y могут отклоняться от на величину случайной ошибки e, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S 2 . Поэтому ошибка предсказываемого индивидуального значения Y должны включать не только стандартную ошибку , но и случайную ошибку S . Это позволяет определять допустимые границы для конкретного значения Y .

Пусть нас интересует некоторое возможное значение y 0 переменной Y при определенном значении x p объясняющей переменной X . Предсказанное по уравнению регрессии значение Y при X =x p составляет y p . Если рассматривать значение y 0 как случайную величину Y 0 , а y p – как случайную величину Y p , то можно отметить, что

,

.

Случайные величины Y 0 и Y p являются независимыми, а следовательно, случайная величина U = Y 0 –Y p имеет нормальное распределение с

И . (5.61)

Используя в качестве s 2 остаточную дисперсию S 2 , получим формулу расчета стандартной ошибки предсказываемого по линии регрессии индивидуального значения Y :

. (5.63)

Случайная величина

(5.64)

имеет распределение Стьюдента с числом степеней свободы k =n –2. На основании этого можно построить доверительный интервал для индивидуальных значений Y p :

, (5.65)

где предельная ошибка D u имеет вид

. (5.66)

Заметим, что данный интервал шире доверительного интервала для условного математического ожидания (см. рис. 5.4).

Пример 5.5. По данным примеров 5.1-5.3 рассчитать 95%-ый доверительный интервал для условного математического ожидания и индивидуального значения при x p =160.

Решение. В примере 5.1 было найдено . Воспользовавшись формулой (5.48), найдем предельную ошибку для условного математического ожидания

Тогда доверительный интервал для среднего значения на уровне значимости a=0,05 будет иметь вид

Другими словами, среднее потребление при доходе 160 с вероятностью 0,95 будет находиться в интервале (149,8; 156,6).

Рассчитаем границы интервала, в котором будет сосредоточено не менее 95% возможных объёмов потребления при уровне дохода x p =160, т.е. доверительный интервал для индивидуального значения . Найдем предельную ошибку для индивидуального значения

Тогда интервал, в котором будут находиться, по крайней мере, 95% индивидуальных объёмов потребления при доходе x p =160, имеет вид

Нетрудно заметить, что он включает в себя доверительный интервал для условного среднего потребления. â

ПРИМЕРЫ

Пример 5.65. По территориям региона приводятся данные за 199X г. (таб. 1.1).

2. Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.

3. Оценить качество уравнения регрессии при помощи коэффициента детерминации. Проверить качество уравнения регрессии при помощи F -критерия Фишера.

4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости a=0,05. Сделать выводы.

Решение

1. Для определения степени тесноты связи обычно используют коэффициент корреляции :

где , – выборочные дисперсии переменных x и y . Для расчета коэффициента корреляции строим расчетную таблицу (табл. 5.4):

Таблица 5.4

x y xy x 2 y 2 e 2
148,77 -15,77 248,70
152,45 -4,45 19,82
157,05 -23,05 531,48
149,69 4,31 18,57
158,89 3,11 9,64
174,54 20,46 418,52
138,65 0,35 0,13
157,97 0,03 0,00
144,17 7,83 61,34
157,05 4,95 24,46
146,93 12,07 145,70
182,83 -9,83 96,55
Итого 1574,92
Среднее значение 85,58 155,75 13484,00 7492,25 24531,42

По данным таблицы находим:

, , , ,

, , , ,

, .

Таким образом, между заработной платой (y) и среднедушевым прожиточным минимумом (x) существует прямая достаточно сильная корреляционная зависимость .

Для оценки статистической значимости коэффициента корреляции рассчитаем двухсторонний t-критерий Стьюдента :

который имеет распределение Стьюдента с k =n –2 и уровнем значимости a. В нашем случае

и .

Поскольку , то коэффициент корреляции существенно отличается от нуля.

Для значимого коэффициента можно построить доверительный интервал , который с заданной вероятностью содержит неизвестный генеральный коэффициент корреляции. Для построения интервальной оценки (для малых выборок n <30), используют z-преобразование Фишера :

Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией . Поэтому вначале строят доверительный интервал для M[z ], а затем делают обратное z -преобразование. Применяя z -преобразование для найденного коэффициента корреляции, получим

Доверительный интервал для M(z ) будет иметь вид

,

где t g находится с помощью функции Лапласа F(t g)=g/2. Для g=0,95 имеем t g =1,96. Тогда

или . Обратное z -преобразование осуществляется по формуле

В результате находим

.

В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции r.

2. Таким образом, между переменными x и y имеет существенная корреляционная зависимость. Будем считать, что эта зависимость является линейной. Модель парной линейной регрессии имеет вид

,

где y – зависимая переменная (результативный признак), x – независимая (объясняющая) переменная, e – случайные отклонения, b 0 и b 1 – параметры регрессии. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:

где b 0 и b 1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК ). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной:

,

где отклонения y i от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных является равенство нулю ее частных производных по неизвестным параметрам b 0 и b 1 . В результате получаем систему нормальных уравнений:

Решая эту систему, найдем

, .

По данным таблицы находим

Получено уравнение регрессии:

Параметр b 1 называется коэффициентом регрессии . Его величина показывает среднее изменение результата с изменением фактора на одну единицу. В рассматриваемом случае, с увеличением среднедушевого минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб .

,

где F подчиняется распределению Фишера с уровнем значимости a и степенями свободы k 1 =1 и k 2 =n –2. В нашем случае

.

Поскольку критическое значение критерия равно

и , то признается статистическая значимость построенного уравнения регрессии. Отметим, что для линейной модели F - и t -критерии связаны равенством , что можно использовать для проверки расчётов.

4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Прогнозное значение y p определяется путем подстановки в уравнение регрессии (1.16) соответствующего (прогнозного) значения x p

ЛЕКЦИЯ 5 99

§5.2. Анализ точности оценок коэффициентов регрессии 99

5.2.1. Оценка дисперсии случайного отклонения 99

5.2.2. Проверка гипотез относительно коэффициентов регрессии 100

5.2.3. Интервальные оценка коэффициентов регрессии 103

§5.3. Показатели качества уравнения регрессии 104

5.3.1. Коэффициент детерминации 104

5.3.2. Проверка общего качества уравнения регрессии: F-тест 106

5.3.3. Проверка общего качества уравнения регрессии: t-тест 108

§5.4. Интервалы прогноза по уравнению регрессии 108

Расчеты и проверка достоверности полученных оценок коэффициентов регрессии не являются самоцелью, это лишь необходимый промежуточный этап. Основное – это использование модели для анализа и прогноза поведения изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в полученную формулу регрессии.

Используем полученное в примере 2.1 уравнение регрессии для прогноза объема товарооборота. Пусть намечается открытие магазина с численностью работников х =140 чел., тогда достаточно обоснованный объем товарооборота следует установить по уравнению ŷ (х )= –0,974 + 0,01924×140=1,72 млрд. руб.

Доверительный интервал для прогностического значения у (х )= a 0 +a 1 х определяется по формуле

где t p – критическая граница распределения Стьюдента с n – 2 степенями свободы, соответствующая уровню значимости р . Для получения доверительного интервала воспользуемся выражением (5.2).

Выберем уровень значимости 5%. Число степеней свободы у нас 8 – 2 = 6, тогда по таблице распределения Стьюдента (приложение 1) находим

t 0.05 (6)=2,447.s=Ö 0,008=0,089,

следовательно, с вероятностью 95% истинные значения объемов товарооборота будут лежать в пределах

1,72 – 2,447×0,048<y (x )<1,72+2,447×0,048, или 1,60<y (x )<1,84.

5.8. Практический блок

Пример. Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный и интервальный прогноз методом экстраполяции.

1 . Построить диаграмму рассеяния в EXCELи сделать предварительное заключение о наличии связи.

Таблица 5.6Диаграмма 5.1

x Y
2,1 29,5
2,9 34,2
3,3 30,6
3,8 35,2
4,2 40,7
3,9 44,5
5,0 47,2
4,9 55,2
6,3 51,8
5,8 56,7

Вывод: Из диаграммы 5.1 видно, что связь между факторами x и y

прямая сильная линейная связь .

2. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами х и у .

Таблица 5.7

xy
2,1 29,5 4,41 870,25 61,95 27,91 1,59 0,054
2,9 34,2 8,41 1169,64 99,18 33,46 0,74 0,022
3,3 30,6 10,89 936,36 100,98 36,23 -5,63 0,184
3,8 35,2 14,44 1239,04 133,76 39,69 -4,49 0,128
4,2 40,7 17,64 1656,49 170,94 42,47 -1,77 0,043
3,9 44,5 15,21 1980,25 173,55 40,39 4,11 0,092
5,0 47,2 2227,84 48,01 -0,81 0,017
4,9 55,2 24,01 3047,04 270,48 47,32 7,88 0,143
6,3 51,8 39,69 2683,24 326,34 57,02 -5,22 0,101
5,8 56,7 33,64 3214,89 328,86 53,55 3,15 0,056
ИТОГО: 42,2 193,34 19025,04 1902,04 0,840
Среднее зн. 4,22 42,56 19,334 1902,504 190,204

2.1.Проверим тесноту связи между факторами:

;

Вывод: связь сильная.

2.2.Проверим статистическую значимость по критерию Стьюдента:

1)Критерий Стьюдента: tвыб<=tкр

2)Н о: r=0 tкр=2,31

tвыб=rвыб*

Вывод: таким образом поскольку tвыб=5,84

90% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.

3. Полагая, что связь между факторами х и у может быть описана линейной функцией, используя процедуру метода наименьших квадратов, запишите систему нормальных уравнений относительно коэффициентов линейного уравнения регрессии. Любым способом рассчитайте эти коэффициенты.

Последовательно подставляя в уравнение регрессии из графы (2) табл.5.7, рассчитаем значения и заполним графу (7) табл.5.7.

4. Для полученной модели связи между факторами Х и У рассчитайте среднюю ошибку аппроксимации. Сделайте предварительное заключение приемлемости полученной модели.

Для расчета заполним 8-ую и 9-ую графу табл.5.7.

<Екр=12%

Вывод: модель следует признать удовлетворительной.

5 . Проверьте значимость коэффициента уравнения регрессии a 1 на основе t-критерия Стьюдента.

Решение: Таблица 5.8

2,1 29,5 27,91 2,5281 214,623 170,5636
2,9 34,2 33,46 0,5476 82,81 69,8896
3,3 30,6 36,23 31,6969 40,069 143,0416
3,8 35,2 39,69 20,1601 8,237 54,1696
4,2 40,7 42,47 3,1329 0,008 3,4596
3,9 44,5 40,39 16,8921 4,709 3,7636
47,2 48,01 0,6561 29,703 21,5296
4,9 55,2 47,32 62,0944 22,658 159,7696
6,3 51,8 57,02 27,2484 209,092 85,3776
5,8 56,7 53,55 9,9225 120,78 199,9396
ИТОГО: 42,2 425,6 426,1 174,8791 732,687 911,504
Среднее 4,22 42,56

Статистическая проверка:

Вывод: С доверительной вероятностью 90% коэффициент a 1 - статистически значим, т.е. нулевая гипотеза отвергается.

6. Проверьте адекватность модели (уравнения регрессии) в целом на основе F-критерия Фишера-Снедекора.

Процедура статистической проверки:

:модель не адекватна

Вывод: т.к. Fвыб.>Fкр., то с доверительной вероятностью 95% нулевая гипотеза отвергается (т.е. принимается альтернативная). Изучаемая модель адекватна и может быть использована для прогнозирования и принятия управленческих решений.

7. Рассчитайте эмпирический коэффициент детерминации.

(таб. 3)

Показывает долю вариации.

Вывод: т.е. 80% вариации объясняется фактором, включенным в модель, а 20% не включенными в модель факторами.

8. Рассчитайте корреляционное отношение. Сравните полученное значение с величиной линейного коэффициента корреляции.

Эмпирическое корреляционное отношение указывает на тесноту связи между двумя факторами для любой связи, если связь линейная, то , т.е. коэффициент корреляции совпадает с коэффициентом детерминации.

9 . Выполните точечный прогноз для .

10-12 . Рассчитайте доверительные интервалы для уравнения регрессии и для результирующего признака при доверительной вероятности =90%. Изобразите в одной системе координат:

а) исходные данные,

б) линию регрессии,

в) точечный прогноз,

г) 90% доверительные интервалы.

Сформулируйте общий вывод относительно полученной модели.

-математическое ожидание среднего.

Для выполнения интервального прогноза рассматриваем две области.

1) для y из области изменения фактора x доверительные границы для линейного уравнения регрессии рассчитывается по формуле:

2) для прогнозного значения доверительный интервал для рассчитывается по формуле:

Исходные данные:

2) t=2,31(таб.)

5) : 27,91 42,56 57,02 66,72

6) 19,334-4,22 2)=1,53.

Таблица 5.9

1 2,1 -2,12 4,49 3,03 1,74 2,31 4,68 18,81 27,91 9,10 46,72
4,22 0,00 0,00 0,1 0,32 2,31 4,68 3,46 42,56 39,10 46,02
6,3 2,08 4,33 2,93 1,71 2,31 4,68 18,49 57,02 38,53 75,51
7,7 3,48 12,11 9,02 2,31 4,68 32,43 66,72 34,29 99,15

Вывод: поскольку 90% точек наблюдения попало в 90% доверительный интервал, данная модель и ее доверительные границы могут использоваться для прогнозирования с 90% доверительной вероятностью.

Контрольные вопросы

1. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

2. Виды автокорреляции и их краткая характеристика.

3. Автокорреляция в остатках и порядок её обнаружения.

4. Виды автокорреляции в остатках.

5. Порядок использования критерия Дарбина-Уотсона.

6. Автокорреляция в исходных данных и порядок определения её наличия.

7. Методы устранения влияния автокорреляции на результаты прогнозирования.

8. Обобщенный метод наименьших квадратов (ОМНК).

9. Что понимается под гомоскедастичностью?

10. Как проверяется гипотеза о гомоскедастичности ряда остатков?

11. Оценка качества регрессии. Проверка адекватности и достоверности модели.

12. Значимость коэффициентов регрессии (критерий Стъюдента).

13. Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).

14. Коэффициенты и индексы корреляции. Мультиколлениарность.

15. Оценка значимости корреляции. Детерминация.

16. Средняя ошибка аппроксимации.

17. Принятие решений на основе уравнений регрессии.

18. В каких задачах эконометрики используется распределение Фишера?

19. Таблицы каких распределений используются при оценке качества линейной регрессии?

20. Каковы особенности практического применения регрессионных моделей?

21. Как осуществляется прогнозирование экономических показателей с использованием моделей линейной регрессии?

22. Как можно оценить «естественный» уровень безработицы с использованием модели линейной регрессии?

23. В каких случаях необходимо уточнение линейной регрессионной модели и как оно осуществляется?

24. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

Задания и задачи

1 . Имеются данные о деятельности крупнейших компаний США в 2006г.

№ п/п Чистый доход, млрд долл.США, у Оборот капитала, млрд долл. США, х 1 Использованный капитал, млрд долл. США, х 2 Числен­ность служа­щих, тыс.чел., х 3 Рыночная капитализация компании, млрд долл. США, х 4
0,9 31,3 18,9 43,0 40,9
1,7 13,4 13,7 64,7 40,5
0,7 4,5 18,5 24,0 38,9
1,7 10,0 4,8 50,2 38,5
2,6 20,0 21,8 106,0 37,3
1,3 15,0 5,8 96,6 26,5
4,1 137,1 99,0 347,0 37,0
1,6 17,9 20,1 85,6 36,8
6,9 165,4 60,6 745,0 36,3
0,4 2,0 1,4 4,1 35,3
1,3 6,8 8,0 26,8 35,3
1,9 27,1 18,9 42,7 35,0
1,9 13,4 13,2 61,8 26,2
1,4 9,8 12,6 212,0 33,1
0,4 19,5 12,2 105,0 32,7
0,8 6,8 3,2 33,5 32,1
1,8 27,0 13,0 142,0 30,5
0,9 12,4 6,9 96,0 29,8
1,1 17,7 15,0 140,0 25,4
1,9 12,7 11,9 59,3 29,3
-0,9 21,4 1,6 131,0 29,2
1,3 13,5 8,6 70,7 29,2
2,0 13,4 11,5 65,4 29,1
0,6 4,2 1,9 23,1 27,9
0,7 15,5 5.8 80,8 27,2

Рассчитайте матрицы парных коэффициентов корреляции и на их основе отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

Рассчитайте ошибки и доверительный интервал прогноза для
уровня значимости 5 или 10% (γ = 0,05; γ = 0,10).

2. Имеются данные о деятельности крупнейших компаний США в 2006г.

№ п/п Чистый доход, млрддолл. у Оборот капи­тала, млрддолл. США, х 1 Использованный капитал, млрддолл. х 2 Численность, тыс. чел., х 3
6,6 6,9 83,6 222,0
3,0 18.0 6,5 32,0
6,5 107,9 50,4 82,0
3,3 16,7 15,4 45,2
0,1 79,6 29,6 299,3
3,6 16,2 13,3 41,6
1,5 5,9 5,9 17,8
5,5 53,1 27,1 151,0
2,4 18,8 11,2 82,3
3,0 35,3 16,4 103,0
4,2 71,9 32,5 225,4
2,7 93,6 25,4 675,0
1,6 10,0 6,4 43,8
2,4 31,5 12,5 102,3
3,3 36,7 14,3 105,0
1,8 13,8 6,5 49,1
2,4 64,8 22,7 50,4
1,6 30,4 15,8 480,0
1,4 12,1 9,3 71,0
0,9 31,3 18,9 43,0

Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов.

Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности.

Рассчитайте матрицы парных и частных коэффициентов корреляции и на их основе отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (α = 0,05; α = 0,10).


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16

Идея экономического прогнозирования базируется на предположении, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится ив прогнозируемом будущем. В этом смысле прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называется перспективной, а в прошлое - ретроспективной.

Прогнозирование методом экстраполяции базируется на следующих предположениях:

  • а) развитие исследуемого явления в целом описывается плавной кривой;
  • б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем;
  • в) учет случайности позволяет оценить вероятность отклонения от закономерного развития.

Надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность.

На основе построенной модели рассчитываются точечные и интервальные прогнозы.

Точечный прогноз для временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t= п + 1, п + 2,..., п + к, где к - период упреждения.

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами:

  • 1) выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты;
  • 2) прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой; поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту;
  • 3) тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели (т.е. степени ее близости к фактическим данным), числа наблюдений, горизонта прогнозирования, выбранного пользователем уровня вероятности и других факторов.

При построении доверительного интервала прогноза рассчитывается величина U(k), которая для линейной модели имеет вид

где о е - стандартная ошибка (среднеквадратическое отклонение от линии тренда); п-р - число степеней свободы (для линейной модели у = a Q + a { t количество параметров р = 2).

Коэффициент / является табличным значением ^-статистики Стьюдента при заданном уровне значимости и числе наблюдений. (Примечание. Табличное значение t можно получить с помощью функции Excel стьюдраспобр.)

Для других моделей величина Щк) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы (3.5.21), величина U(k) зависит прямо пропорционально от точности модели коэффициента доверительной вероятности / , степени углубления в будущее на к шагов вперед, т.е. на момент t=п + к, и обратно пропорциональна объему наблюдений.

Доверительный интервал прогноза будет иметь следующие границы:

Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границами.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

Пример 3.5.4. Финансовый директор АО «Веста» рассматривает целесообразность ежемесячного финансирования инвестиционного проекта со следующими объемами нетто-платежей, тыс. руб.:

  • 1. Определить линейную модель зависимости объемов платежей от сроков (времени).
  • 2. Оценить качество (т.е. адекватность и точность) построенной модели на основе исследования:
    • а) случайности остаточной компоненты по критерию «пиков»;
    • б) независимости уровней ряда остатков по ^w-критерию (в качестве критических значений использовать уровни d x = 1,08 и d 2 = 1,36) и по первому коэффициенту автокорреляции, критический уровень которого г(1) = 0,36;
    • в) нормальности распределения остаточной компоненты по /^-критерию с критическими уровнями 2,7-3,7;
    • г) средней по модулю относительной ошибки.
  • 3. Определить размеры платежей на три последующих месяца (построить точечный и интервальный прогнозы на три шага вперед (при уровне значимости 0,1), отобразить на графике фактические данные, результаты расчетов и прогнозирования).

Оценить целесообразность финансирования этого проекта, если в следующем квартале на эти цели фирма может выделить только 120 тыс. руб.

  • 1. Построение модели
  • 1) Оценка параметров модели с помощью надстройки Excel Анализ данных. Построим линейную модель регрессии Y от /. Для проведения регрессионного анализа выполните следующие действия:
    • ? Выберите команду Сервис => Анализ данных.
    • ? В диалоговом окне Анализ данных выберите инструмент Регрессия, а затем нажмите кнопку ок.
    • ? В диалоговом окне Регрессия в поле Входной интервал У введите адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X введите адрес диапазона, который содержит значения независимой переменной t. Если выделены и заголовки столбцов, установите флажок Метки в первой строке.
    • ? Выберите параметры вывода (в данном примере - Новая рабочая книга).
    • ? В поле График подбора поставьте флажок.
    • ? В поле Остатки поставьте необходимые флажки и нажмите кнопку ОК.

Результат регрессионного анализа будет получен в виде, приведенном на рис. 3.5.11 и 3.5.12.

Рис. 3.5.11.

Второй столбец на рис. 3.5.11 содержит коэффициенты уравнения регрессии а 0 , a v

Кривая роста зависимости объемов платежей от сроков (времени) имеет вид

2) Оценка параметров модели «вручную». В табл. 3.5.8 приведены промежуточные расчеты параметров линейной модели по формулам (3.5.16). В результате расчетов получаем те же значения:


Рис. 3.5.12.

Таблица 3.5.8

y t

(t-T)(y,-y)

у, =a 0 + a x t

Иногда для проверки расчетов полезно проверить введенные формулы. Для этого следует выбрать команду Сервис => Параметры и поставить флажок в окне формулы (рис. 3.5.13).


Рис. 3.5.13.

После этого на листе Excel расчетные значения будут заменены соответствующими формулами и функциями (табл. 3.5.9).

  • 2. Оценка качества модели
  • 1) Для оценки адекватности построенных моделей исследуются свойства остаточной компоненты, т.е. расхождения уровней, рассчитанных по модели, и фактических наблюдений (табл. 3.5.10).

При проверке независимости (отсутствияавтокорреляции) определяется отсутствие в ряде остатков систематической составляющей, например, с помощью ^w-критерия Дарбина - Уотсона по формуле (3.4.8):

0t-T)(y t -y )

9t= а о + a x t

=$С$18 + $С$16*А2

=(АЗ - $А$14)

=(ВЗ - $В$14)

=$С$18 + $С$16*АЗ

=$С$18 + $С$16*А4

=$С$18 + $С$16*А5

=$С$18 + $С$16*А6

=$С$18 + $С$16*А7

=$С$18 + $С$16*А8

=$С$18 + $С$16*А9

=(А10 - $А$14)

=(В10 - $В$14)

=$С$18 + $С$16*А10

=$С$18 + $С$16*А11

=(А12 - $А$14)

=(В12 - $В$14)

=$С$18 + $С$16*А12

=$С$18 + $С$16*А13

СРЗНАЧ(Е2:Е13)

Номер

наблюдения

Точки

поворота

е]

( е Г е,-) 2

Так как dw" = 1,88 попало в интервал от d 2 до 2, то по данному критерию можно сделать вывод о выполнении свойства независимости (см. табл. 3.4.1). Это означает, что в ряде динамики не имеется автокорреляции, следовательно, модель по этому критерию адекватна.

Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек [см. формулу (3.5.18)]. Количество поворотных точекр при п = 12 равно 5 (рис. 3.5.14):

Неравенство выполняется (5 > 4). Следовательно, свойство случайности выполняется. Модель по этому критерию адекватна.

Соответствие ряда остатков нормальному закону распределения определим с помощью критерия:

где максимальный уровень ряда остатков е тах = 4,962, минимальный уровень ряда остатков e min = -5,283 (см. табл. 3.5.10), а среднеквадратическое отклонение


Рис. 3.5.14.

Получаем

Расчетное значение попадает в интервал (2,7-3,7), следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.

Проверка равенства нулю математического ожидания уровней ряда остатков. В нашем случае ё = 0, поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется.

Данные анализа ряда остатков приведены в табл. 3.5.11.

2) Для оценки точности модели вычислим среднюю относительную ошибку аппроксимации Е оти (табл. 3.5.12).

Получаем

Вывод: - хороший уровень точности модели.

Проверяемое

свойство

Используемая

статистика

Граница

Вывод

Наименова

Значение

верх

Независимость

^-критерий Дарбина - Уотсона

dw = 2,12 dw" = 4-2,12 = = 1,88

Адекватна

Случайность

Критерий

(поворотных

Адекватна

Нормальность

/^-критерий

Адекватна

Среднее е,= 0

/-статистика

Стьюдента

Адекватна

Вывод: модель статистически адекватна

Таблица 3.5.12

Номер

наблю

дения

Номер

наблю

дения

3. Построение точечного и интервального прогнозов на три шага вперед

Для вычисления точечного прогноза в построенную модель подставляем соответствующие значения фактора t = n + к:

Для построения интервального прогноза рассчитаем доверительный интервал. При уровне значимости а = 0,1 доверительная вероятность равна 90%, а критерий Стьюдента при v = п - 2 = 10 равен 1,812. Ширину доверительного интервала вычислим по формуле (3.5.21):

где (можно взять из протокола регрессионного анализа), / = 1,812 (табличное значение можно получить в Excel с помощью функции стьюдраспобр), Т = 6,5,

(находим из табл. 3.5.8);

Таблица 3.5.13

Прогноз

Верхняя граница

Нижняя граница

U( 1) = 6,80

Щ2) = 7,04

Ответ. Модель имеет вид Y(t) = 38,23 + 1,81/. Размеры платежей составят 61,77; 63,58; 65,40 тыс. руб. Следовательно, денежных средств в объеме 120 тыс. руб. на финансирование этого инвеста-


Рис. 3.5.15.

ционного проекта на три последующих месяца будет недостаточно, поэтому нужно либо изыскать дополнительные средства, либо отказаться от этого проекта.

Вопрос 4. Доверительные интервалы прогноза. Оценка адекватности и точности моделœей

Заключительным этапом применения кривых роста яв­ляется экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t , соответ­ствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени опреде­ляется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желатель­но определить границы возможного изменения прогнозируемого по­казателя, задать «вилку» возможных значений прогнозируемого пока­зателя, ᴛ.ᴇ. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста͵ может быть вызвано:

1) субъективной ошибочностью выбора вида кривой;

2) погрешностью оценивания параметров кривых;

3) погрешностью, связанной с отклонением отдельных наблю­дений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, мо­жет быть отражена в виде доверительного интервала прогноза. До­верительный интервал, учитывающий неопределœенность, связанную с положением тренда, и возможность отклонения от этого тренда, опре­деляется в виде:

, (5.26)

где п - длина временного ряда;

L - период упреждения; - точечный прогноз на момент n+L ;

t a - значение t -статистики Стьюдента;

S p - средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содер­жат погрешность. Погрешность параметра а 0 приводит к вертикально­му сдвигу прямой, погрешность параметра а 1 изменению угла на­клона прямой относительно оси абсцисс. С учетом разброса кон­кретных реализаций относительно линий тренда, дисперсию S 2 p можно представить в виде:

, (5.27)

где: S y 2 -дисперсия отклонений фактических наблюдений от расчетных;

t l - время упреждения, для которого делается экстраполяция, t l = n + L ;

t - порядковый номер уровней ряда, t =1, 2,..., п ;

Порядковый номер уровня, стоящего в серединœе ряда, ;

Тогда доверительный интервал можно представить в виде:

. (5.28)

Обозначим корень в выражении (5.28) через К . Значение К за­висит только от п и L , ᴛ.ᴇ. от длины ряда и периода упреждения. По этой причине можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

. (5.29)

Выражение, аналогичное (5.28), можно получить для полинома второго порядка:

(5.30)

. (5.31)

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:

, (5.32)

где: y t - фактические значения уровней ряда,

Расчетные значения уровней ряда,

п - длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома. Чем выше степень полинома, тем шире доверительный интер­вал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствую­щих параметров уравнения.

Рис. 5.4. Доверительные интервалы прогноза для линœейного тренда

Доверительные интервалы прогнозов, полученных с использо­ванием уравнения экспоненты, определяют аналогичным образом. От­личие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме бывают определœены доверительные ин­тервалы для ряда кривых, имеющих асимптоты, в случае, если значе­ние асимптоты известно (к примеру, для модифицированной экспонен­ты).

В таблице 5.4 приведены значения К* в зависимости от длины временного ряда п и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (п ) значения К* умень­шаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений п : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L .

Таблица 5.4

Значения К* для оценки доверительных интервалов прогноза на основе линœейного тренда и параболического тренда при доверительной вероятности 0,9 (7)

Одна из базовых задач, возникающих при прогнозировании, состоит в определœении доверительных интервалов прогноза. Интуитивно понятно, что в базе расчета доверительности интервала прогноза должен быть положен измеритель колеблемости ряда. Чем выше эта колеблемость, тем шире интервал для прогноза. Следовательно, вопрос о доверительном интервале прогноза следует начать с рассмотрения измерителя колеблемости. Обычно таким измерителœем является среднее квадратическое отклонение:

где - соответственно фактическое и расчетное значения ряда;

f – число степеней свободы, определяемое исходя из числа наблюдений (n ) и числа оцениваемых параметров.

f = n – z,

где z – число оцениваемых параметров.

К примеру, для параболы второй степени f = n – 3, третьей степени f = n – 4 и т.д.

Сумму квадратов отклонений от тренда можно разложить следующим образом:

Последнее выражение можно упростить. Допустим, что начало отсчета находится в серединœе ряда, тогда , а параметры а и b будут равны:

После преобразований получим:

Разность первых двух членов правой стороны равна сумме квадратов отклонений от средней арифметической, ᴛ.ᴇ. .

Таким образом,

Последнее выражение показывает, что сумма квадратов отклонений от линий тренда меньше, чем от средней арифметической.

Сумма квадратов отклонений от линий тренда, ᴛ.ᴇ. и среднее квадратическое отклонение от тренда Sy является основой при определœении средней квадратической ошибки параметров.

Прежде чем приступить к определœению доверительного интервала прогноза, следовало бы сделать оговорку. Дело в том, что предположение о нормальности распределœения отклонений вокруг линии регрессии не может ни утверждаться и не быть проверено при анализе рядов. Дискуссии еще в 30-40-х годах пролили свет на трудности, связанные с этой проблемой. В итоге, принципиальный новый подход так и не был найден. Все предложения так или иначе связаны с определœением доверительного интервала на базе оценки среднего квадратического отклонения членов ряда.

Полученные в ходе оценивания параметры не свободны от погрешности. Расчетные значения несут на себе груз неопределœенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал прогноза определяется как

где - средняя квадратическая ошибка;

Расчетное значение у t ;

Значение t -критерия Стьюдента.

В случае если t = I + L , то последнее определит значение доверительного интервала на L единиц времени.

Доверительный интервал прогноза должен учитывать не только неопределœенность, но возможность отклонения, ᴛ.ᴇ. диапазон варьирования. В случае если обозначим среднюю квадратическую ошибку как S p , тогда доверительный интервал прогноза составит:

Доверительные интервалы прогноза - понятие и виды. Классификация и особенности категории "Доверительные интервалы прогноза" 2017, 2018.

Последние материалы раздела:

Ол взмш при мгу: отделение математики Заочные математические школы для школьников
Ол взмш при мгу: отделение математики Заочные математические школы для школьников

Для учащихся 6-х классов: · математика, русский язык (курс из 2-х предметов) - охватывает материал 5-6 классов. Для учащихся 7–11 классов...

Интересные факты о физике
Интересные факты о физике

Какая наука богата на интересные факты? Физика! 7 класс - это время, когда школьники начинают изучать её. Чтобы серьезный предмет не казался таким...

Дмитрий конюхов путешественник биография
Дмитрий конюхов путешественник биография

Личное дело Федор Филиппович Конюхов (64 года) родился на берегу Азовского моря в селе Чкалово Запорожской области Украины. Его родители были...