Лекции по эконометрике: учебное пособие. Конспект лекций по курсу «Эконометрика

Александр Дозорцев


1. Любимая глава

Для многих любителей русской словесности, самой известной главой в культовой поэме «Москва-Петушки» является «Серп и Молот — Карачарово». Сам автор, флиртуя: «предупреждал всех девушек, что главу «Серп и Молот — Карачарово» следует пропустить, не читая, поскольку за фразой «И немедленно выпил» следуют полторы страницы чистейшего мата, что во всей этой главе нет ни единого цензурного слова за исключением фразы «И немедленно выпил». «Добросовестным уведомлением этим» — автор, Веничка Ерофеев, — «добился только того, что все читатели, в особенности девушки, сразу хватались за главу «Серп и Молот — Карачарово», даже не читая предыдущих глав, даже не прочитав фразы «и немедленно выпил».

Для других любимой главой является «Электроугли — 43-й километр», в которой автор дает рецепты приготовления различных коктейлей, как-то: «Ханаанский бальзам», «Сучий потрох», «Дух Женевы», «Слеза комсомолки», «Поцелуй тети Клавы». За поэти-ческими названиями скрываются настолько неудобоваримые сочетания ингредиентов, что можно свихнуться от одной только мысли, что и в самом деле существовали люди, которые смешивали и реально пили эти адские смеси.

Но для меня, обладателя первой степени по статистике и экономике Иерусалимского Университета и второй степени по эконометрике того же университета, однозначно самой любимой главой является «Новогиреево — Реутово». Эта глава «Поэма в Поэме», посвященная эмпирическим исследованиям и анализу данных.


2. Индивидуальные графики или «методичка» эмпирического исследования.

Итак, что-же меня так «зацепило» в этой главе? — Ну конечно «индивидуальные графики»:
«….что это были за графики? Ну, это очень просто: на веленевой бумаге, черной тушью, рисуются две оси — одна ось горизонтальная, другая вертикальная. На горизонтальной откладываются последовательно все рабочие дни истекшего месяца, а на вертикальной — количество выпитых граммов, в перерасчете на чистый алкоголь. Учитывалось, конечно, только выпитое на производстве и до него, поскольку выпитое вечером — величина для всех более или менее постоянная и для серьезного исследователя не может представить интереса».

Вопросы технологии, как-то тушь и бумага, оставим для других специалистов, а я как «серьезный исследователь» разберу методы исследования Венечки Ерофеева:


  • Выбор метода анализа — График! Венечка уже в 70-х годах предыдущего столетия осознавал преимущества визуального представления данных.

  • Определения горизонтальной оси — «все рабочие дни истекшего месяца», тем самым автор подразумевает анализ временных рядов при этом графики индивидуальные, практически возможно использование Panel Data Analysis.

  • Определения вертикальной оси или зависимой переменой: «количество выпитых граммов», т.е цель исследования изучение зависимости потребления алкоголя от личных характеристик и временных/сезонных факторов, как будет показано далее.

  • Нормализация данных— «количество выпитых граммов, в перерасчете на чистый алкоголь». Вне зависимости от вида напитка, происходит нормализация данных.

  • Фокусирование исследования на главной проблеме: «Учитывалось, конечно, только выпитое на производстве и до него, поскольку выпитое вечером — величина для всех более или менее постоянная и для серьезного исследователя не может представить интереса».

  • Процесс сбора и первичной обработки: «Итак, по истечении месяца рабочий подходит ко мне с отчетом: в такой то день выпито того то и столько то, в другой — столько то и того то. А я, черной тушью и на веленевой бумаге, изображаю все это красивою диаграммою.»

3. Индивидуальные графики или «методичка» эмпирического исследования.

Помимо самого разбора научного метода Венички, интересно посмотреть и проанализировать сами графики:
«Вот, полюбуйтесь, например, это линия комсомольца Виктора Тотошкина»

А это Алексей Блиндяев, «член КПСС с 1936 г., потрепанный старый хрен»:

А вот уж это — ваш покорный слуга, экс бригадир монтажников ПТУСа, автор поэмы «Москва — Петушки»:

Вот анализ самого автора: «Ведь правда, интересные линии? Даже для самого поверхностного взгляда — интересные? У одного — Гималаи, Тироль, бакинские промыслы или даже верх кремлевской стены, которую я, впрочем, никогда не видел. У другого — предрассветный бриз на реке Кама, тихий всплеск и бисер фонарной ряби. У третьего — биение гордого сердца, песня о буревестнике и девятый вал. И все это — если видеть только внешнюю форму линии».

Как было обещано ранее, индивидуальные графики позволяют определить личные особенности потребления алкоголя, как-то волатильность потребления, минимум и максимум. Помимо этого, временные ряды позволяют в данном случае определить сезонность потребления у всех участников данного исследования. Как можно заметить на графиках выделены 10-ое и 26-ое числа. Более того, в эти числа на всех графиках наблюдается увеличение потребления алкоголя. Априорные представления о структуре оплаты труда в Советском Союзе (аванс и получка) и увеличения потребления алкоголя в эти дни, позволяют сделать вывод, что резкое увеличение ликвидности (наличные средства) статистически увеличивает потребление алкоголя.

4. Резюме

Романтик Веничка, в своей гениальной поэме смог объяснить доступным языком «Слезы Комсомолки» и «Поцелуя тети Клавы» основные подходы эконометрических исследований. Наглядность и доходчивость его объяснений делают первую половину главы «Новогиреево — Реутово» обязательным для изучения для всякого, уважающего себя специалиста по анализу данных. В наше время Data Mining и наступающей Big Data без анализа получаемых данных не возможен ни какой бизнес или научная разработка.

Н. И. Шанченко

ЛЕКЦИИ ПО ЭКОНОМЕТРИКЕ

Учебное пособие. Ульяновск: УлГТУ, 2008.

АННОТАЦИЯ

Содержит краткий курс лекций по дисциплине «Эконометрика», включая описа-
ние основных задач эконометрики и методов, применяемых для их решения. Предназначено для студентов экономических и информационных специальностей.

Учебное пособие является электронной версией книги:
Шанченко, Н. И. Лекции по эконометрике: учебное пособие / Ульяновск: УлГТУ, 2008. - 139 с.

СОДЕРЖАНИЕ
Введение
1. Предмет и методы эконометрики
1.1. Предмет и методы эконометрики
1.2. Характеристика взаимосвязей
1.3. Основные этапы построения эконометрической модели
1.4. Выбор вида эконометрической модели
1.5. Методы отбора факторов
1.6. Оценка параметров моделей
1.7. Примеры эконометрических моделей
Контрольные вопросы.
2. Парный регрессионный анализ
2.1. Понятие парной регрессии
2.2. Построение уравнения регрессии
2.2.1. Постановка задачи
2.2.2. Спецификация модели
2.3. Оценка параметров линейной парной регрессии
2.4. Оценка параметров нелинейных моделей
2.5. Качество оценок МНК линейной регрессии. Теорема Гаусса-Маркова
2.6. Проверка качества уравнения регрессии. F-критерий Фишера
2.7. Коэффициенты корреляции. Оценка тесноты связи
2.8. Точность коэффициентов регрессии. Проверка значимости
2.9. Точечный и интервальный прогноз по уравнению линейной регрессии
2.10. Коэффициент эластичности
Контрольные вопросы
3. Множественный регрессионный анализ
3.1. Понятие множественной регрессии
3.2. Отбор факторов при построении множественной регрессии
3.2.1. Требования к факторам
3.2.2. Мультиколлинеарность
3.3. Выбор формы уравнения регрессии
3.4. Оценка параметров уравнения линейной множественной регрессии
3.5. Качество оценок МНК линейной множественной регрессии. Теорема Гаусса-Маркова
3.6. Проверка качества уравнения регрессии. F-критерий Фишера
3.7. Точность коэффициентов регрессии. Доверительные интервалы
3.8. Частные уравнения регрессии. Частная корреляция
3.9. Обобщенный метод наименьших квадратов. Гетероскедастичность
3.9.1. Обобщенный метод наименьших квадратов
3.9.2. Обобщенный метод наименьших квадратов в случае
гетероскедастичности остатков
3.10. Проверка остатков регрессии на гетероскедастичность
3.11. Построение регрессионных моделей при наличии автокорреляции остатков
3.12. Регрессионные модели с переменной структурой. Фиктивные переменные
3.12.1. Фиктивные переменные
3.12.2. Тест Чоу
3.11. Проблемы построения регрессионных моделей
Контрольные вопросы
4. Системы эконометрических уравнений
4.1. Структурная и приведенная формы модели
4.2. Оценка параметров структурной формы модели
4.3. Косвенный метод наименьших квадратов
4.4. Двухшаговый метод наименьших квадратов
4.5. Трехшаговый метод наименьших квадратов
Контрольные вопросы
5. Моделирование одномерных временных рядов и прогнозирование
5.1. Составляющие временного ряда
5.2. Автокорреляция уровней временного ряда
5.3. Моделирование тенденции временного ряда
5.3.1. Методы определения наличия тенденции
5.3.2. Сглаживание временного ряда по методу скользящей средней
5.3.3. Метод аналитического выравнивания
5.3.4. Выбор вида тенденции
5.3.5. Оценка адекватности и точности модели тенденции
5.4. Моделирование периодических колебаний
5.4.1. Выделение периодической компоненты по методу
скользящей средней
5.4.2. Моделирование сезонных колебаний с помощью фиктивных переменных
5.4.3 Моделирование сезонных колебаний с помощью гармонического анализа
5.5. Прогнозирование уровней временного ряда на основе кривых роста
5.5.1. Метод аналитического выравнивания
5.6. Адаптивные модели прогнозирования
5.6.1. Понятие адаптивных методов прогнозирования
5.6.2. Экспоненциальное сглаживание
5.6.3. Использование экспоненциальной средней
для краткосрочного прогнозирования
5.6.4. Адаптивные полиномиальные модели
5.7. Исследование взаимосвязи двух временных рядов
5.8. Коинтеграция временных рядов
Контрольные вопросы
6. Линейные модели стохастических процессов
6.1. Стационарные стохастические процессы
6.1.1. Основные понятия
6.1.2. Параметрические тесты стационарности
6.1.3. Непараметрические тесты стационарности
6.2. Линейные модели стационарных временных рядов. Процессы ARMA
6.2.1. Модели авторегрессии (AR)
6.2.2. Модели скользящего среднего (MA)
6.2.3. Модели авторегрессии-скользящего среднего (ARMA)
6.3. Автокорреляционные функции
6.3.1. Автокорреляционная функция
6.3.2. Частная автокорреляционная функция
6.4. Прогнозирование ARMA-процессов
6.4.1. AR-процессы
6.4.2. MA-процессы
6.4.3. ARMA-процессы
6.5. Нестационарные интегрируемые процессы
6.5.1. Нестационарные стохастические процессы. Нестационарные временные ряды
6.5.2. Тесты Дики-Фуллера
6.5.3. Модификации теста Дики-Фуллера для случая автокорреляции
6.5.4. Метод разностей и интегрируемость
6.6. Модели ARIMA
6.6.1. Определение и идентификация модели
6.6.2. Прогнозирование ARIMA-процессов
Контрольные вопросы
7. Динамические эконометрические модели
7.1. Общая характеристика динамических моделей
7.2. Модели с распределенным лагом
7.2.1. Оценка параметров модели с распределенным лагом методом Койка
7.2.2. Оценка параметров модели с распределенным лагом методом Алмон
7.2.3. Интерпретация параметров
7.3. Модели авторегрессии
7.3.1. Интерпретация параметров
7.3.2. Оценка параметров моделей авторегрессии
7.4. Модель частичной корректировки
7.5. Модель адаптивных ожиданий
Контрольные вопросы
8. Информационные технологии эконометрических исследований
8.1. Электронные таблицы Excel
8.2. Статистический пакет общего назначения STATISTICA
8.3. Эконометрические программные пакеты. Matrixer 5.1
8.4. Анализ временных рядов в системе ЭВРИСТА
Контрольные вопросы
Глоссарий
Приложения

1. Нормированная функция Лапласа
2. Значения критических уровней t?,k для распределения Стьюдента
3. Значения F-критерия Фишера на уровне значимости? = 0,05
4. Значения F-критерия Фишера на уровне значимости? = 0,01
5. Значения X2a ;k критерия Пирсона
6. Значения статистик Дарбина-Уотсона dL dU
7. Критические значения f-критерия для DF-, ADF- и РР-тестов, рассчитанные по Маккиннону
8. Критические значения коинтеграционного ADF-критерия
Библиографический список
Интернет-ресурсы

Введение
Развитие экономики, усложнение экономических процессов и повышение
требований к принимаемым управленческим решениям в области макро и мик-
роэкономики потребовало более тщательного и объективного анализа реально
протекающих процессов на основе привлечения современных математических
и статистических методов.
С другой стороны, проблема нарушения предпосылок классических статистических методов при решении реальных экономических задач привели к необходимости развития и совершенствования классических методов математической статистики и уточнения постановок соответствующих задач.
В результате этих процессов осуществилось выделение и формирование новой отрасли знания под названием Эконометрика, связанной с разработкой и применением методов количественной оценки экономических явлений и процессов и их взаимосвязей.
Основным методом исследования в эконометрике является экономико-математическое моделирование. Правильно построенная модель должна давать
ответ на вопрос о количественной оценке величины изменения изучаемого явления или процесса в зависимости от изменений внешней среды. Например, как скажется увеличение или уменьшение уровня инвестиций на совокупном валовом продукте, какие дополнительные ресурсы понадобятся для запланированного увеличения выпуска продукции и т. п.
Практическая значимость эконометрики определяется тем, что применение ее методов позволяет выявить реально существующие связи между явлениями,
дать обоснованный прогноз развития явления в заданных условиях, проверить и
численно оценить экономические последствия принимаемых управленческих
решений.
Построение эконометрических моделей приходится осуществлять в условиях, когда нарушаются предпосылки классических статистических методов, и учитывать наличие таких явлений, как:
– мультиколлинеарность объясняющих переменных;
– закрытость механизма связи между переменными в изолированной регрессии;
– эффект гетероскедастичности, т. е. отсутствия нормального распределения остатков для регрессионной функции;
– автокорреляция остатков;
– ложная корреляция.
Разработка методов, преодолевающих эти трудности, составляет теоретическую основу эконометрики.
Наряду с логически правильным формальным применением имеющегося
математического и статистического инструментария важными составляющими
успеха эконометрического исследования являются экономически адекватная
постановка задачи и последующая экономическая интерпретация полученных
результатов.
Огромный толчок развитию эконометрических методов и их широкому
внедрению в практику дало развитие средств вычислительной техники и особенно появление персональных и портативных компьютеров. Разработка программных пакетов, реализующих методы построения и исследования эконометрических моделей привело к тому, что выполнение эконометрических процедур становится доступным самому широкому кругу аналитиков, экономистов и ме-
неджеров. В настоящее время основные усилия прикладного исследователя
сводятся к подготовке качественных исходных данных, к правильной постанов-
ке проблемы и экономически обоснованной интерпретации результатов иссле-
дования. Вместе с тем, от исследователя требуется четкое понимание областей
применимости используемых методов и сложности и неочевидности процесса
перенесения полученных теоретических результатов на реальную действительность.
Настоящее пособие отражает содержание односеместрового курса лекций, читаемых на факультете информационных систем и технологий УлГТУ студентам специальности «Прикладная информатика (в экономике)» и соответствует Государственному образовательному стандарту по дисциплине «Эконометрика». Пособие состоит из восьми глав и приложения.
В первой главе дается характеристика предмету эконометрики и применяемым ме-
тодам, освещаются основные аспекты эконометрического моделирования, применяемые методики и виды используемых переменных.
Во второй главе рассмотрены вопросы построения парных регрессионных
моделей: постановка задачи, спецификация и оценка параметров моделей,
оценка качества полученных моделей, получение точечного и интервального
прогнозных значений, экономическая интерпретация модели.
Третья глава посвящена построению множественных регрессионных моделей. Подробно рассмотрены вопросы спецификации и оценки параметров модели, оценки качества полученной модели и ее статистической значимости.
Приведены условия, обеспечивающие эффективность метода наименьших квадратов (теорема Гаусса-Маркова). Описан обобщенный метод наименьших
квадратов, позволяющий получать эффективные оценки параметров в условиях
мультиколлинеарности факторов и автокорреляции остатков. Рассмотрены рег-
рессионные модели с переменной структурой.
Четвертая глава посвящена построению моделей в виде системы эконометрических уравнений. Изложены особенности моделей, возникающие трудности применения классических методов и описаны наиболее широко применяемые методы оценки параметров, такие как косвенный, двухшаговый и трехшаговый методы наименьших квадратов.
В пятой главе рассмотрены вопросы моделирования одномерных временных рядов и прогнозирования: структура временного ряда, явление автокорреляции, моделирование тенденции и периодической составляющей ряда, прогнозирование уровней ряда. Отдельное внимание уделено адаптивным методам прогнозирования и моделированию коинтегрируемых временных рядов.
В шестой главе освещены вопросы построения линейных моделей стохастических процессов: AR, MA и ARMA-моделей стационарных процессов, ARIMA-моделей нестационарных процессов. Описаны методы проверки временных рядов на стационарность.
В седьмой главе излагаются модели и методы, применяемые для исследования эконометрических моделей, описывающих динамику развития экономических процессов. Рассмотрены модели авторегрессии и модели с распределенным лагом. Описаны применяемые для оценки параметров моделей, такие как методы инструментальных переменных, методы Койка и Алмон.
Восьмая глава посвящена информационным технологиям эконометрических
исследований. Изложены общие требования к программному обеспечению и возможности программных пакетов Excel, STATISTICA, ЭВРИСТА, Matrixer 5.1.
В приложении даны часто используемые статистические таблицы.
Пособие предназначено студентам экономических и информационных специальностей. Изложение материала ориентировано на читателя, обладающе-
го знаниями в пределах курсов высшей математики и математической статистики, читаемых студентам экономических и информационных специальностей. Пособие будет также полезно всем желающим познакомиться с основными задачами, моделями и методами эконометрики.

В этом разделе вы найдете решенные задач по разным разделам эконометрики, выполненные с применением пакета электронных таблиц MS Excel. Большая часть работ снабжена подробным текстовым отчетом.

Если вам нужна помощь в выполнении контрольных работ по эконометрике в Excel, обращайтесь: эконометрика на заказ


Понравилось? Добавьте в закладки

Решение эконометрики в Экселе

Задача 1. Парная регрессия.
Для исходных данных, приведенных ниже, рассчитайте

  • коэффициенты линейного регрессионного уравнения
  • рассчитайте остаточную дисперсию
  • вычислите значения коэффициентов корреляции и детерминации
  • рассчитайте коэффициент эластичности
  • рассчитайте доверительные границы уравнения регрессии (по уровню 0,95, t=2,44)
  • в одной системе координат постройте: уравнение регрессии, экспериментальные точки, доверительные границы уравнения регрессии

Задача 2. Построить требуемое уравнение регрессии. Вычислить коэффициент детерминации, коэффициент эластичности, бета коэффициент и дать их смысловую нагрузку в терминах задачи. Проверить адекватность уравнения с помощью F теста. Найти дисперсии оценок и 95% доверительные интервалы для параметров регрессии. Данные взять из таблицы. Найти прогнозируемое значение объясняемой переменной для некоторого значения объясняющей переменной, не заданной в таблице.
Построить уравнение линейной регрессии объема валового выпуска (в млн. руб.) от стоимости основных производственных фондов (млн. руб.).

Задача 3. Множественная регрессия.
Построить требуемое уравнение регрессии. Вычислить коэффициент детерминации, частные коэффициенты эластичности, частные бета коэффициенты и дать их смысловую нагрузку в терминах задачи. Проверить адекватность уравнения с помощью F теста. Найти оценку матрицы ковариаций оценок параметров регрессии и 95% доверительные интервалы для параметров регрессии. Проверить наличие мультиколлинеарности в модели. Данные взять из таблицы.
Построить уравнение линейной регрессии себестоимости единицы товара (в сотнях руб.) от величины энерговооруженности (кВт) и производительности труда (тов/час).

Задача 4. Трендовые модели
Проверить ряд на наличие тренда. Сгладить ряд методом простой скользящей средней $(m = 3)$, экспоненциальным сглаживанием $(\alpha = 0,3; \alpha = 0,8)$. Построить исходный и сглаженные ряды. На основании построенных рядов определить вид трендовой модели. Построить трендовую модель.
Сделать прогноз изучаемого признака на два шага вперед.
87; 77; 75; 74; 69; 66; 62; 61; 59; 57; 57; 52; 50; 48; 46; 43; 43; 41; 38; 35

Задача 5. По заданным статистическим данным постройте линейную модель множественной регрессии и исследуйте её.

  • Постройте линейную модель множественной регрессии.
  • Запишите стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
  • Найдите коэффициенты парной, частной и множественной корреляции. Проанализируйте их.
  • Найдите скорректированный коэффициент множественной детерминации. Сравните его с нескорректированным (общим) коэффициентом детерминации.
  • С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации $R^2_{y x_1 x_2}$.
  • С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора $x_1$ после $x_2$ и фактора $x_2$ после $x_1$.
  • Составьте уравнение линейной парной регрессии, оставив лишь один значащий фактор.

Задача 6. По данным опроса 15 женщин, находящихся в роддоме, исследовать зависимость веса новорожденного (у) от среднего числа сигарет (х), выкуриваемых матерью в день, с учетом числа уже имеющихся у матери детей (z).

КРАТКОЕ ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ

Эконометрика – молодая наука, которая своим происхождение обязана развитию статистики и совершенствованию ее методов с одной стороны. С другой стороны эконометрика многим обязана в своем становлении и развитии укреплению позиций системного подхода в современной науке в целом и особенно усовершенствованию математических методов и моделей в экономике. Формирование эконометрики в качестве самостоятельной науки (а не просто раздела статистики) относится к первой трети 20 века и окончательное ее утверждение в виде важного самостоятельного направления в экономических исследованиях относят к середине 20 века.

Эконометрика рассматривает модели реальных экономических систем, которые значительно ближе к реальным рыночным процессам, чем модели экономической теории и в то же время характеризуются значительно большей целостностью (общесистемным подходом) по сравнению с старыми статистическими моделями. Последние нередко представляли эклектический набор разрозненных методов, искусственно собранных вместе и не объединенных одной интегрирующей идеей. Сами эконометрические модели – это по сути своей математические модели, а именно, уравнения (уравнения регрессии), не учитывающие упорядоченности данных во времени; математические соотношения, известные как временные ряды и фактически тоже своеобразные уравнения, описывающие процессы с дискретным временем, развитие их в хронологически упорядоченной последовательности; наконец, системы уравнений (системы эконометрических уравнений), которые успешно применяются для описания макроэкономических процессов и систем.

Несколько конкретнее эконометрика - это существенно междисциплинарная наука, возникшая на стыке экономики, высших методов статистики, математической статистики и в самое последнее время информационных технологий, эффективно реализующих интеграцию этих наук. От первых простейших попыток применения точных количественных методов математики к экономическим проблемам она довольно быстро перешла к использованию методов математической статистики для решения задач экономики и успешно развивает применение математической статистики и даже теории нечетких множеств и нечеткой логики к исследованию сложных процессов социально-экономической природы.

Еще в рамках статистики – способствуя зарождению эконометрики – ученые-экономисты и статистики занимались исследованием макроэкономических проблем на основе временных рядов таких показателей, как валютные курсы и пр. Изучался рынок труда, разрабатывались методы статистической проверки теории производительности организации труда на производстве. Приблизительно в это время (19 век) метод множественной регрессии был применен для оценки функции спроса.

Следующим важным этапом стали работы по применению основных методов математической статистики (корреляционно-регрессионного анализа, анализа временных рядов, метода множественной регрессии) для изучения социально-экономических явлений и процессов, включая оценку функции спроса. Тогда же (первая половина XX века) выполнялись исследования по циклическим процессам в экономике и выделению бизнес-циклов. Так изучение динамики временных рядов и экстраполяция подмеченных закономерностей в сочетании с использованием некоторых базовых теоретических предпосылок привело к построению экономических барометров (гарвардский барометр). Концепция экономического барометра использует следующую важную идею: в динамике различных компонентов экономического процесса имеются такие показатели, изменение которых опережает изменение других компонентов. Таким образом, показатели, изменение которых опережает в своем развитии изменение других показателей, являются в некотором роде предвестниками последних. Конкретно для гарвардского барометра имеется 5 групп показателей. Они затем сводятся в три отдельные кривые: одна характеризует фондовый рынок, другая – товарный рынок, третья кривая – денежный рынок. В основу прогноза с использованием гарвардского барометра было положено свойство каждой отдельной кривой повторять движение остальных кривых в определенной последовательности и с определенным отставанием.

Однако в конце первой трети двадцатого века эффективность подобных методов стала снижаться и их применение сошло на нет. Это связано с существенным изменением структуры мировых экономических отношений и изменением природы регулирующих факторов в экономике, в частности переходом к кейнсианской модели воздействия на экономику со стороны государства. Одновременно пытались применить методы Фурье-анализа и периодограмм к эконометрическим построениям.

Необходимость использования моделирования (в эконометрике это особенно очевидно), а не простого совершенствования вычислительных методов определяется тем, что многие объекты (или проблемы, относящиеся к этим объектам) непосредственно исследовать или вовсе невозможно, или же это исследование требует много времени и средств. Процесс моделирования включает три элемента: 1) субъект (исследователь), 2) объект исследования, 3)модель, опосредствующую отношения познающего субъекта и познаваемого объекта. Модель сначала строится – первый этап ; затем исследуется – второй этап ; после этого полученные знания аккуратно переносятся на исследуемую реальную систему – третий этап . Только после этого переходят к практической проверке и использованию полученных выводов (знаний) в реальной жизни, например, решению задачи прогноза – четвертый этап.

На этапе построения модели используются гипотезы о виде статистической зависимости и определяются неизвестные (на этом этапе) коэффициенты (параметры) моделей при помощи метода наименьших квадратов (МНК). Далее модель исследуется с применением методов математической статистики (проверки гипотез) – второй этап. На третьем этапе выполняются наиболее сложные и тонкие процессы переноса полученных знаний о модели на реальную систему – они требуют особого внимания и аккуратности. Затем наступает наиболее ответственный четвертый этап проверки полученных выводов в реальных условиях и их соответствующего применения, которые не выполняются автоматически, а требуют особого внимания к границам применимости этих выводов.

ЛЕКЦИЯ 1. ПОСТРОЕНИЕ МОДЕЛИ: ОПРЕДЕЛЕНИЕ

ПАРАМЕТРОВ МОДЕЛИ (МНК).

Вернемся к первому этапу. После формирования гипотезы о виде зависимости (функционального вида правой части уравнения регрессии) необходимо выполнить определение входящих в уравнение коэффициентов – подбор параметров зависимости - и тем самым установить окончательно модель явления. Это осуществляется методом наименьших квадратов (МНК). Получающаяся модель проверяется на значимость с помощью различных критериев, представляющих основу статистической проверки гипотез, например, если

y i = f(x i) + ε i , где f(x i)=a o + a 1 x (1.2)

то коэффициенты определяются по МНК условием обращения в минимум функции

∑(y i -a o -a 1 x) 2 →min, (1.3)

где требование минимизации квадратов отклонений приводит к системе нормальных уравнений (линейные алгебраические уравнения особого вида) для нахождения из нее коэффициентов a i .

В экономике и, следовательно, в эконометрике исследуемые явления и характеризующие их величины это сложные случайные процессы и случайные величины, параметры этих процессов. Случайные величины в процессе анализа представляются состоящими из постоянной компоненты и случайной компоненты. При этом постоянная составляющая это математическое ожидание, или среднее арифметическое (среднее) значение исходной случайной величины:

= (1.4)

Если же данные не сгруппированы, то все частоты f равны 1 и получаем формулу простого среднего:

(1.5)

Среднее случайной компоненты, или остатка равно нулю. Если бы это оказалось не так, то это ненулевое значение следовало бы включить в среднее значение исходной случайной величины и, таким образом, все свелось бы к предыдущему. Мера разброса (вариации) случайной величины, или, что то же, ее распределения, - это дисперсия.

Первоначально дисперсия определяется как среднее квадрата разности между самой случайной величиной и средним этой случайной величины:

Var(χ) = 2 =
(1.6)

В этом выражении коэффициенты ƒ не что иное как веса, или весовые коэффициенты значений величины χ . Это попросту величины, показывающие сколько раз входят те или иные значения в данное эмпирическое распределение величины χ для дискретных распределений или же в данный интервал (данную группу) для непрерывных распределений.

Часто при расчетах используют выражение для дисперсии в виде разности среднего от квадрата исходной случайной величины и квадрата среднего от нее:

σ 2 = -(1.7)

Тогда окончательно для дисперсии исходной случайной величины получаем, что она равна дисперсии остатка, поскольку вся вариация исходной случайной величины равна вариации остатка, просто по самому определению остатка.

В действительности, кроме самых простых и редких случаев, неизвестно распределение случайной величины и даже основные характеристики изучаемой генеральной совокупности. Требуется получить информацию о случайной величине, характеризующей данное явление или процесс или соответственно генеральной совокупности, из результатов наблюдений . Совокупность результатов наблюдений представляет собой выборку из генеральной совокупности и по этим данным (выборки) с применением подходящей формулы и методов оценивания (прежде всего метода наименьших квадратов) получают приближенное значение неизвестной характеристики (параметра) исследуемой случайной величины или в терминах статистики генеральной совокупности.

Эконометрика использует для изучения различных явлений и процессов признаки, характеризующие эти явления и процессы. Признаки могут быть количественными и атрибутивными, не поддающимися непосредственно количественному измерению. Эконометрика сосредоточена преимущественно на исследовании явлений и процессов, характеризующихся количественными признаками. Тем не менее, она способна исследовать и взаимосвязи между атрибутивными (не количественными) признаками . Сами количественные признаки это фактически случайные величины, которые описываются своими распределениями (совокупностью принимаемых значений и совокупностью вероятностей, с которыми эти значения принимаются). Соответственно для признаков определяются средние, а сами случайные величины могут быть представлены в виде суммы средней и остатка, характеризующего случайные флуктуации.

у = + ε, (1.8)

где средняя (первое слагаемое) может быть приближена или просто заменена некоторой функцией, например линейной:

= a o + a 1 x (1.9)

Это представление имеет глубокий смысл и будет неоднократно использоваться и обсуждаться далее. Далее помимо среднего для признака как для случайной величины определяется дисперсия, которая служит мерой вариации признака в целом (интегральная характеристика колеблемости признака).

D=σ 2 =
(1.10)

Эконометрика исследует взаимозависимости между признаками и динамику их изменения во времени. Признаки, зависящие от других называются зависимыми, или объясняющими. Признаки от которых зависят первые (зависимые) называются независимыми, или факторами, или регрессорами. Далее мы увидим, что их так называемая независимость друг от друга отнюдь не носит абсолютный характер. Тем не менее понятие независимости факторов является весьма важным и весьма полезным начальным предположением. После исследования соответствующих базовых моделей начального уровня удается строить и изучать более сложные и более совершенные модели, в которых возможно учитывать частичную зависимость факторов.

Также естественно, что в качестве начальных базовых моделей используются простейшие зависимости, например линейные. После этого рассматривают модели, которые можно преобразовать к линейным. И наконец, только после этого существенно нелинейные модели. О том, каков точный смысл этих понятий речь пойдет в следующих лекциях.

Прежде всего, необходимо определить остаток (иначе отклонения, или погрешности) для каждого конкретного наблюдения. Этот остаток после принятия гипотезы линейной зависимости определяется как разность между фактическим значением наблюденной зависимой величины у и ее расчетным значением, получаемым по значению фактора х и формуле линейной зависимости у от х.

Линия графика (линейной зависимости), или линия регрессии должна быть такова, чтобы указанные остатки являлись минимальными. Как понимать требование минимальности именно всех остатков? Ведь уменьшая одни остатки, мы всегда с необходимостью будем увеличивать другие. Наилучший способ это потребовать минимизации суммы квадратов остатков. Остатки еще называют отклонения. В этом случае говорят о минимизации суммы квадратов отклонений. Это одно и то же. Наилучшее соответствие кривой точкам наблюдений получилось бы в предельном случае абсолютно точного соответствия, когда кривая (в нашем случае прямая) пройдет точно через все точки. Но это нереально для линии регрессии, ввиду наличия случайного члена и ошибок наблюдений.

Именно описанный только что принцип минимизации квадратов остатков и его реализация называются методом наименьших квадратов (МНК) . Поскольку существует также модификация и развитие его, то говорят также о традиционном, или обычном МНК. В математике (математической статистике и теории приближенных вычислений) МНК рассматривается в качестве одного из наиболее важных и эффективных методов приближенных вычислений и методов оценивания. По существу именно ситуации, когда система алгебраических линейных уравнений не имеет точного решения, является наиболее общей и важной с практической точки зрения. И в большинстве случаев удается найти содержательные приближенные решения, дающие ответ на вопросы, поставленные в данной задаче.

Важно понимать, что в МНК переменные и коэффициенты как бы меняются местами. Из требования минимизации суммы квадратов остатков вытекает довольно простая система линейных алгебраических уравнений. Она называется нормальная система, или система нормальных уравнений . В этой системе уравнений в качестве известных величин выступают величины, получаемые в результате перемножения, возведения в квадрат и последующего суммирования наблюденных значений переменных. Надо отчетливо понимать, что, несмотря на свой нередко относительно громоздкий вид, это всего лишь известные величины, играющие теперь роль коэффициентов системы. С другой стороны сами исходные коэффициенты линейной зависимости (параметры) неизвестны. Именно их и надо определить из системы нормальных уравнений.

Для решения системы алгебраических линейных уравнений существуют различные методы от простого исключения переменных до использования определителей и обратных матриц, метод Гаусса, систематизирующий и обобщающий исключение переменных и называемый поэтому методом последовательного исключения неизвестных. Для случая двух переменных эти формулы нахождения решения системы нормальных уравнений довольно просты. Для множественной регрессии, когда рассматриваются зависимости от множества факторов такие формулы становятся более громоздкими.

Важно то, что в очень большом количестве исследуемых ситуаций выборочная дисперсия весьма близка к генеральной дисперсии и является хорошим приближением и тем самым хорошей оценкой для генеральной дисперсии, кроме отдельных специальных случаев. В то же время выборочное среднее не является достаточно хорошей оценкой, а служит всего лишь грубым первоначальным приближением к оценке генерального среднего, которое уточняется с помощью формул, использующих выборочную дисперсию.

Итак, оценки – это приближения к неизвестным величинам с некоторыми важными хорошими свойствами. Опираясь на оценки важнейших характеристик случайных величин, выявляют и исследуют связи между ними, определяют величину этих связей, исходя из важнейших показателей, характеризующих статистические зависимости между величинами и процессами. Мерой взаимосвязи между переменными является выборочная ковариация, которая для последовательности наблюдений двух переменных представляет среднее произведений разностей результатов наблюдений и их соответствующих средних. Есть другая форма вычисления ковариации, когда она представляется в виде среднего попарных произведений соответствующих результатов наблюдений этих двух переменных, из которого вычитается произведение средних этих двух переменных:

Cov(x,y)=å(x-`x)(y-`y)/n=[(∑xy)/n] – [] (1.11)

Ковариация легко вычисляется, но при всей ее простоте она вовсе не является наилучшим измерителем взаимосвязи между величинами. Более точно характеризует зависимость коэффициент корреляции. Выборочный коэффициент корреляции, или просто выборочная корреляция это просто частное от деления выборочной ковариации на произведение выборочных дисперсий соответствующих переменных. Преимущество коэффициента корреляции перед ковариацией заключается в том, что ковариация зависит от единиц, в которых измеряются переменные, коэффициент корреляции это величина безразмерная.

r=Cov(x,y)/Övar(x)var(y) (1.12)

Последние материалы раздела:

Интересные факты о физике
Интересные факты о физике

Какая наука богата на интересные факты? Физика! 7 класс - это время, когда школьники начинают изучать её. Чтобы серьезный предмет не казался таким...

Дмитрий конюхов путешественник биография
Дмитрий конюхов путешественник биография

Личное дело Федор Филиппович Конюхов (64 года) родился на берегу Азовского моря в селе Чкалово Запорожской области Украины. Его родители были...

Ход войны Русско японская 1904 1905 карта военных действий
Ход войны Русско японская 1904 1905 карта военных действий

Одним из крупнейших военных конфликтов начала XX века является русско-японская война 1904-1905 гг. Ее результатом была первая, в новейшей истории,...