- •Министерство образования и науки украины
- •Основные понятия регрессионного анализа Парная регрессия
- •Проверка гипотезы о значимости коэффициента корреляции.
- •Прогноз и его доверительные интервалы.
- •Оценка адекватности нелинейной парной регрессии.
- •Прогноз и его доверительный интервал для парной нелинейной регрессии.
- •Множественная регрессия.
- •Мультиколлинеарность.
- •Алгоритм фаррара –глобера состоит из следующих шагов:
- •Автокорреляция
- •Пространственная корреляция возмущений ( Гетероскедастичность)
- •Пример решение задания 1.
- •Решение.
Мультиколлинеарность.
При построении уравнения множественной регрессии может возникнуть проблемма мультиколлинеарности факторов, их тесной линейной связи
Наиболее полно исследовать мультиколлинеарность можно с помощью алгоритма ФАРРАРА-ГЛОБЕРА.Он содержит три вида статистических критериев с помощью которых проверяется мультиколлинеарность соответственно: 1). всего массива объясняющих переменных (хи-квадрат);2). каждой объясняющей переменной с остальными объясняющими переменными ( F- критерий); 3).каждой пары объясняющих переменных ( t -критерий ).
Алгоритм фаррара –глобера состоит из следующих шагов:
ШАГ 1. НОРМАЛИЗОВАТЬ ПЕРЕМЕННЫЕ ИСПОЛЬЗУЯ ФОРМУЛУ:
Х* = (Х – Х )/ σк
ШАГ 2. НАЙТИ КОРРЕЛЯЦИОННУЮ МАТРИЦУ R
R = X* т ● X* / (п- 1 )
ШАГ 3. ОПРЕДЕЛИТЬ КРИТЕРИЙ χ² = - [ n – 1 – 1/6(2m+5)] · ln |R|,
ГДЕ |R| -ОПРЕДЕЛИТЕЛЬ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ.
ЗНАЧЕНИЕ ЭТОГО КРИТЕРИЯ СРАВНИВАЕТСЯ С χ²табл. ПРИ ½m(m-1) СТЕПЕНИ СВОБОДЫ И УРОВНЮ ЗНАЧИМОСТИ α. ЕСЛИ χ²факт.<χ²табл. , ТО В МАССИВЕ НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ МУЛЬТИКОЛЛИНЕАРНО
СТЬ ОТСУТСТВУЕТ.
ШАГ 4. ОПРЕДЕЛИТЬ МАТРИЦУ С ОБРАТНУЮ К R.
C = R ¯ ¹ = ( X*тX* /(п – 1 ))¯ ¹
ШАГ 5. РАССЧИТАТЬ F-КРИТЕРИИ:
Fk = ( Ckk - 1) (( n - р ) / ( р- 1)),
ГДЕ Ckk – ДИАГОНАЛЬНЫЕ ЭЛЕМЕНТЫ МАТРИЦЫ С.
ФАКТИЧЕСКИЕ ЗНАЧЕНИЯ КРИТЕРИЕВ Fk СРАВНИВАЮТСЯ С ТАБЛИЧНЫМИ ПРИ n-р СТЕПЕНЕЙ СВОБОДЫ И УРОВНЮ ЗНАЧИМОСТИ α.
ЕСЛИ Fk факт. > Fтабл. , ТО СООТВЕТСТВУЮЩАЯ k-Я ОБЪЯСНЯЮЩАЯ ПЕРЕМЕННАЯ МУЛЬТИКОЛЛИНЕАРНА С ДРУГИМИ.
ПРИ ЭТОМ, КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ ДЛЯ k–ОЙ ПЕРЕМЕННОЙ ВЫЧИСЛЯЕТСЯ ПО ФОРМУЛЕ:
R²k = 1 – 1/Сkk.
ШАГ 6. НАЙТИ ЧАСТНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ:
rki = - Скj / √ Скк· Cjj,
ГДЕ Скj -ЭЛЕМЕНТ МАТРИЦЫ С РАСПОЛОЖЕННЫЙ В к – ОЙ СТРОКЕ И j –ОМ СТОЛБЦЕ, Скк И С jj – ДИАГОНАЛЬНЫЕ ЭЛЕМЕНТЫ МАТРИЦЫ С.
ШАГ 7. РАССЧИТАТЬ t – КРИТЕРИИ:
tkj = ( rki *√ n – m )/√1-r²ki .
ФАКТИЧЕСКИЕ ЗНАЧЕНИЯ tkj СРАВНИВАЮТСЯ С ТАБЛИЧНЫМИ ПРИ n-m СТЕПЕНЕЙ СВОБОДЫ И УРОВНЕ ЗНАЧИМОСТИ α .ЕСЛИ tkjфакт. > tтабл. , ТО МЕЖДУ ПЕРЕМЕННЫМИ Хк И Хj СУЩЕСТВУЕТ МУЛЬТИКОЛЛИНЕАРНОСТЬ.
Автокорреляция
При обработке временных рядов в силу адитивности векторов возмущений весьма реальным является предположение о том, что эти возмущения связаны между собой во времени, т.е. имеет место автокорреляция. В простейшем случае имеет место авторегрессионный процесс первого порядка.
ОПРЕДЕЛЕНИЕ: Возмущение Ut подчиняется авторегрессионому процессу первого порядка, если выполняются следующие условия:
Ковариационная матрица в этом случае имеет вид:
Все элементы матрицы Ώ определяются через авторегрессионый параметр ρ, однако при эмпирических исследованиях ρ неизвестно и должно быть статистически оценено.
d-тест Дарбина-Уотсона на наличие автокорреляции возмущений (d-тест Д-У)
При d-тесте Д-У нулевой гипотезы предполагается классическая модель нормальной регрессии (регрессоры не стохастические). Как альтернативную гипотезу в более широком смысле d-тест использует условия существования авторегрессии первого порядка. При этом проверяется пара гипотез о параметре ρ, а не предпосылка о наличии авторегрессии, которая считается аксиомой.
d- статистика Д-У вычисляется по формуле:
,
где погрешность уравнения в периодt. Для ее нахождения осуществляется оценка 1-МНК исследуемого уравнения. Для определения областей принятия решений при d-тесте на автокорреляцию возмущений применяем правило:
Если величина d-статистики приближается к значению2, то автокорреляция отсутствует. Чем больше расчётная величина d-статистики стремится к нулю, тем сильнее проявляются признаки положительной автокорреляции. Чем больше d-статистика приближается к четырем, тем сильнее признаки отрицательной автокорреляции.
При проведении одностороннего теста необходимо использовать и, а при проведении двухстороннего тестаигде,-нижнее табличное значение, -нижнее табличное значение,-верхнее табличное значениеd. При проведении d-теста рекомендуется выбирать уровень значимости α по возможности большим, а также, чтобы уменьшить вероятность ошибочного решения, присоединять область неопределённых результатов к области отклонения. d-тест может быть проведён по 6-шаговой схеме:
Шаг 1: Подобрать к данной нулевой гипотезе Но : p = 0 подходящую альтернативную гипотезу:
1 Н А : р ≠ 0
2 Н А : р > 0
3 Н А : р < 0
Шаг 2: Выбрать высокий уровень значимости α
Шаг 3: Найти в таблице верхнее и нижнее значение d-критерия и рассчитать с ними соответствующие области и принятия решений.
Шаг 4: Рассчитать величину d- статистик
Шаг 5: Принять решение.
Шаг 6: Интерпретировать результаты теста. При сомнениях исходить из того, что имеет место автокорреляция возмущений.
Н А : р ≠ 0 |
du |
? |
du |
4-dо |
? |
4-dо | ||||
Н А : р > 0 |
du |
? |
du |
|
|
| ||||
Н А : р < 0 |
|
|
|
4-dо |
? |
4-dо |
? |
- инконклюзивная область |
|
- область отклонения гипотезы Но |
|
- область принятия гипотезы Но |
Области принятия решений при d-тесте нулевой гипотезы с тремя альтернативными гипотезами.
Оценка регрессионного параметра p , преобразование данных и оценка вспомогательной модели.
Авторегрессионый параметр p, как правило, неизвестен, потому метод Эйткена чаще всего не может быть применен. При подозрении на автокорреляцию оценка по методу Эйткена может быть проведена только с использованием вспомогательной модели следующим образом:
Шаг 1: Расчёт вектора погрешностей при оценке 1- МНК
Шаг 2: d-тест на автокорреляцию.
Рассчитать, на основе найденного Û , d – статистику и провести d-тест. Если невозможно отклонить гипотезу о том, что p ≠ 0, то выполнить оценку по методу Эйткена (Шаги 3,4,5).
Шаг 3: Оценка авторегрессионого параметра p
Рассчитать по элементам вектора погрешностей 1-МНК оценщик для p
или :
Шаг 4: Преобразование матрицы данных:
Матрица данных преобразуют с помощью матрицы преобразования следующим образом: , гденовая матрица данныхпри авто регрессионном процессе 1-го порядка имеет вид:
Шаг 5: Оценка по 1-МНК преобразованной матрицы данных.
Рассчитать:
где
при этом