- •ОГЛАВЛЕНИЕ
- •ПРЕДИСЛОВИЕ
- •МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ
- •РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
- •РЕКОМЕНДАЦИИ ПО САМОСТОЯТЕЛЬНОЙ РАБОТЕ СТУДЕНТА
- •ТЕОРЕТИЧЕСКИЕ МАТЕРИАЛЫ
- •ГЛАВА 1. СТАТИСТИЧЕСКИЕ ПОНЯТИЯ И РАСПРЕДЕЛЕНИЯ
- •§ 1. Введение
- •§ 2. Суть регрессионного анализа
- •§ 3. Некоторые статистические определения
- •§ 4. Нормальное (гауссовское) распределение
- •§ 5. (хи-квадрат)-распределение
- •§ 6. Распределение Стьюдента (t-распределение)
- •§ 7. F-распределение (распределение дисперсионного отношения)
- •§ 8. Статистическая проверка гипотез
- •§ 9. Определение критических значений распределений Стьюдента и Фишера с использованием программы Microsoft Office Excel
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 2. ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. УСЛОВИЯ ГАУССА–МАРКОВА
- •§ 1. Основные понятия
- •§ 2. Метод наименьших квадратов
- •§ 3. Предпосылки метода наименьших квадратов
- •§ 4. Анализ точности определения оценок коэффициентов регрессии
- •§ 5. Проверка статистической значимости коэффициентов парной линейной регрессии
- •§ 6. Интервальные оценки коэффициентов линейного уравнения регрессии
- •§ 7. Доверительные интервалы для зависимой переменной
- •§ 8. Проверка общего качества уравнения регрессии. Коэффициент детерминации
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
- •§ 1. Определение параметров уравнения регрессии
- •§ 2. Расчет коэффициентов множественной линейной регрессии
- •§ 3. Дисперсии и стандартные ошибки коэффициентов
- •§ 4. Проверка статистической значимости коэффициентов уравнения регрессии
- •§ 5. Интервальные оценки коэффициентов теоретического уравнения регрессии
- •§ 6. Проверка общего качества уравнения регрессии
- •§ 7. Проверка равенства двух коэффициентов детерминации
- •§ 8. Проверка гипотезы о совпадении уравнений регрессии для двух выборок
- •§ 10. Частные уравнения регрессии
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 4. АВТОКОРРЕЛЯЦИЯ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
- •§ 1. Суть и причины автокорреляции
- •§ 2. Последствия автокорреляции
- •§ 3. Обнаружение автокорреляции. Критерий Дарбина–Уотсона
- •§ 4. Методы устранения автокорреляции
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 5. ГЕТЕРОСКЕДАСТИЧНОСТЬ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
- •§ 1. Общие понятия
- •§ 2. Последствия гетероскедастичности
- •§ 3. Обнаружение гетероскедастичности
- •§ 4. Методы смягчения проблемы гетероскедастичности
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 6. МУЛЬТИКОЛЛИНЕАРНОСТЬ
- •§ 1. Общие понятия и последствия мультиколлнеарности
- •§ 2. Определение мультиколлинеарности
- •§ 3. Методы устранения мультиколлинеарности
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 7. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ В РЕГРЕССИОННЫХ МОДЕЛЯХ
- •§ 1. Модель с одной фиктивной (бинарной) переменной
- •§ 3. Сравнение двух регрессий
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 8. НЕЛИНЕЙНАЯ РЕГРЕССИЯ
- •§ 1. Общие понятия
- •§ 2. Степенные модели (логарифмические)
- •§ 3. Обратная модель (гиперболическая)
- •§ 4. Полиномиальная модель
- •§ 5. Показательная модель (лог-линейная)
- •§ 6. Выбор формы модели
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 9. ВРЕМЕННЫЕ РЯДЫ
- •§ 1. Общие понятия
- •§ 2. Моделирование тренда временного ряда
- •§ 4. Стационарные ряды
- •§ 5. Процесс авторегрессии AR(p)
- •§ 6. Процессы скользящего среднего MA(q)
- •§ 7. Комбинированные процессы авторегрессии-скользящего среднего ARMA(p, q)
- •§ 8. Модели ARMA, учитывающие наличие сезонности
- •§ 9. Нестационарные временные ряды. Процессы авторегрессии и проинтегрированного скользящего среднего ARIMA(p, k, q)
- •§ 10. Регрессионные модели с распределенными лагами
- •§ 11. Полиномиально распределенные лаги Ш. Алмон
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 10. СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ
- •§ 1. Общие понятия
- •§ 2. Идентификация структурной формы модели
- •§ 3. Косвенный метод наименьших квадратов
- •§ 4. Двухшаговый метод наименьших квадратов
- •§ 5. Трехшаговый метод наименьших квадратов
- •Резюме
- •Вопросы для самопроверки
- •ЗАКЛЮЧЕНИЕ
- •ЗАДАНИЯ ДЛЯ КОНТРОЛЯ
- •Тесты для самоконтроля
- •Ключи к тестам для самоконтроля
- •Контрольная работа
- •Вопросы к зачету (экзамену)
- •ГЛОССАРИЙ
- •СПИСОК ЛИТЕРАТУРЫ
ГЛОССАРИЙ
А
Автокорреляция остатков (serial correlation) — взаимная за-
висимость случайных остатков в различных наблюдениях.
В
Временной ряд (time-series data) — данные, естественным образом упорядоченные во времени. Наблюдения в соседние моменты времени часто бывают зависимыми.
Выбор переменных. Эта задача возникает тогда, когда имеется большой перечень потенциально полезных объясняющих X-перемен- ных и необходимо принять решение о том, какие именно из этих переменных следует включить в уравнение регрессии. Когда X-пере- менных слишком много, то качество результатов снижается, поскольку информация неэффективно расходуется на оценивание бесполезных параметров. С другой стороны, отсутствие одной или нескольких важных X-переменных приводит к снижению качества прогнозов вследствие потери нужной информации.
Выборочное стандартное отклонение представляет собой меру изменчивости и используется для обобщающего перехода от имеющихся данных к некоторой более крупной генеральной совокупности (реальной или гипотетической).
Г
Генеральная совокупность — совокупность всех мыслимых наблюдений, которые могли бы быть произведены при данном реальном комплексе условий.
Гомоскедастичность (homoscedasticity) — зависимость дис-
персии случайных остатков от номера наблюдения.
Гетероскедастичность (heteroscedasticity) — зависимость дисперсии случайных остатков от номера наблюдения.
Д
Дисперсия, или квадрат стандартного отклонения, — характеристика, отражающая степень «разброса» случайной величины относительно среднего значения (математического ожидания). Несет ту же информацию, что и стандартное отклонение, но труднее ин-
259
терпретируется, поскольку единицы измерения дисперсии представляют собой единицы измерения исходных данных, возведенные в квадрат.
Доверительный интервал — область, в которую неизвестный параметр генеральной совокупности попадает с заданной вероятностью или с заданным уровнем доверия.
И
Инструментальная переменная — переменная, на которую заменяют коррелирующую со случайными отклонениями объясняющую переменную. Инструментальная переменная должна коррелировать (желательно сильно) с заменяемой объясняющей переменной и не должна коррелировать со случайным отклонением.
К
Корреляционная зависимость — частный случай статистиче-
ской связи, при котором разным значениям переменной соответствуют разные средние значения другой переменной.
Корреляционное поле (диаграмма рассеяния) — графическое изображение реальных статистических данных в виде точек в декартовой системе координат.
Косвенный метод наименьших квадратов — метод решения системы одновременных уравнений. Сначала уравнение преобразуют к приведенной форме, а затем применяют обычный метод наименьших квадратов.
Коэффициент авторегрессии — параметр ρ в авторегрессион-
ном процессе первого порядка εt = ρ εt −1 +ν t .
Коэффициент детерминации R2 — доля объясненной диспер-
сии в общей дисперсии зависимой переменной.
Коэффициент корреляции — показатель, характеризующий степень тесноты линейной связи между двумя переменными. Число в диапазоне от -1 до +1.
Коэффициент регрессии. Коэффициент bj для j-й X-переменной, показывающий влияние Xj на Y. Коэффициент bj указывает, на какое увеличение Y можно рассчитывать в случае, который ничем не отличается от нынешнего за исключением того, что значение Xj увеличилось на единицу.
260
Критическое значение. Соответствующее значение, которое берут из подходящей стандартной статистической таблицы для сравнения со значением тестовой статистики.
Л
Линейная модель. Модель, исходящая из того, что наблюдаемое значение Y определяется линейными соотношениями в генеральной совокупности плюс нормально распределенная случайная ошибка.
М
Метод наименьших квадратов — метод определения пара-
метров уравнения регрессии минимизирующий сумму квадратов случайных остатков.
Мультиколлинеарность — высокая степень корреляции (взаимной зависимости) объясняющих переменных. В таком случае трудно получить качественные оценки отдельных коэффициентов регрессии.
Н
Несмещенная оценка — оценка, которая корректна в среднем, т. е. не является систематически завышенной или заниженной в сравнении с соответствующим параметром генеральной совокупности.
Нормальное распределение — непрерывное распределение, представленное хорошо известной колоколообразной кривой.
Нулевая гипотеза — гипотеза, которую принимают по умолчанию и обозначают Н0; зачастую указывает на какой-либо особый случай (например, чистую случайность).
О
Оценка — некоторое число, вычисленное на основе фактических данных.
Ошибка второго рода происходит в случае, когда верна альтернативная (исследовательская) гипотеза, но вместо нее принимают нулевую гипотезу и объявляют, что результат не является статистически значимым.
Ошибка оценки — разность между значением параметра генеральной совокупности и его статистической оценкой; как правило неизвестна.
261
Ошибка первого рода происходит в случае, когда нулевая гипотеза верна, но она отвергается и результат ошибочно объявляется статистически значимым.
П
Параметр — любой показатель, вычисленный для всей генеральной совокупности.
Полиномиальная регрессия — один из способов решения проблемы нелинейности, при котором Y прогнозируется на основе од-
ной переменной X и ряда степеней этой переменной (X 2 , X 3 ,... X m).
Р
Регрессионный анализ — прогнозирование одной Y-перемен- ной по одной или нескольким X-переменным.
С
Система одновременных уравнений — набор взаимосвязан-
ных регрессионных моделей, в которых одни и те же переменные могут одновременно (в различных уравнениях) играть роль зависимых и объясняющих переменных.
Спецификация уравнения регрессии — выбор формулы связи переменных.
Степени свободы — количество независимых источников информации в стандартной ошибке.
Стандартное отклонение (среднее квадратическое откло-
нение) — традиционный подход к измерению изменчивости; обобщает типичное расстояние между средним значением и отдельными значениями данных.
Стандартная ошибка коэффициента регрессии Sb j показы-
вает, на сколько (приблизительно) может отстоять оценка bj от значения параметра β j в генеральной совокупности.
Статистика Дарбина–Уотсона (DW) — показатель, исполь-
зуемый при проведении теста на наличие или отсутствие корреляции случайных отклонений.
Статистическая зависимость — зависимость, при которой изменение одной из величин влечет изменение распределения другой.
262
Т
Тест Голдфелда–Квандта — один из тестов для определения наличия или отсутствия гетероскедастичности остатков.
Тенденция (тренд) для временного ряда — очень долгосроч-
ное поведение исследуемого временного ряда.
У
Уровень доверия α свидетельствует о том, насколько неожиданным является факт, что данные соответствуют нулевой гипотезе. Малые значения α обозначают большую неожиданность такого факта и приводят к отказу от нулевой гипотезы Н0. Принято отвергать Н0, когда значение α меньше, чем 0,05.
Ф
Фиктивная переменная (индикаторная переменная) — ко-
личественная переменная, используемая для описания качественного признака. Может принимать только два значения — 0 и 1.
Функцией регрессии Y на X называется функция f(x), если она описывает поведение условного среднего значения зависимой переменной Y (при условии, что значения объясняющей(их) переменной(ых) зафиксированы).
Э
Эконометрика — это научная дисциплина, объединяющая совокупность теоретических результатов, приемов и моделей, предназначенных для того, чтобы на базе экономической теории, экономической и математикой статистики придавать конкретное количественное выражение общим закономерностям, установленным экономической теорией (С. А. Айвазян, В. С. Мхитарян).
Экстраполяция — прогнозирование за пределами диапазона данных, имеющихся в распоряжении исследователя; связано с особым риском, поскольку в таком случае результат нельзя проверить с помощью изучения имеющихся данных.
Эластичность Y по отношению к Xi — ожидаемое процент-
ное изменение Y, связанное с изменением Xi на 1% при условии, что все другие X-переменные не изменяются; оценивается с помощью коэффициента регрессии, полученного в результате регрессионного анализа логарифмов Y и Xi.
263
F
F-статистика (F statistic) — основа для F-теста в дисперсионном анализе представляет собой отношение двух измерений дисперсии, используемых для выполнения проверки гипотез.
F-таблица содержит критические значения распределения F- статистики при условии справедливости нулевой гипотезы; таким образом, при условии справедливости нулевой гипотезы значение F-статистики превосходит критическое значение лишь в некотором определенном проценте случаев (например, в 5% случаев).
F-тест — общий тест, позволяющий выяснить, объясняют ли X-переменные значимую долю вариации переменной Y.
t-статистика — один из способов выполнения t-теста. t-таблица — таблица, которая вносит поправку на добавлен-
ную неопределенность, вызванную тем, что вместо неизвестного точного значения изменчивости для исследуемой генеральной совокупности используется некоторая ее оценка (стандартная ошибка).
t-тесты для отдельных коэффициентов регрессии — если регрессия значима, метод дальнейшего статистического вывода относительно отдельных коэффициентов регрессии.
264