- •11. Оценка дисперсии ошибок.
- •12. Оценка существенности параметров линейной регрессии и корреляции
- •13. Интервалы прогноза по линейному уравнению регрессии
- •14. Нелинейная регрессия. Линеаризируемые и нелинеаризируемые модели.Эластичность
- •15. Корреляция для нелинейной регрессии. Средняя ошибка аппроксимации.
- •16. Множественная регрессия. Спецификация модели. Отбор факторов.
- •17. Мнк для множественной регрессии. Мультиколлинеарность ее последствия.
- •19. Множественная корреляция. Скорректированный индекс детерминации.
- •20. Частная корреляция при множественной регрессии. Прцедура пошагового отбора переменных
19. Множественная корреляция. Скорректированный индекс детерминации.
Для множе. регрессии необходим пар-тр оценки его значимости. Введем показатель множ. корреляции и его квадрата — коэф-та детерминации. Показатель множ. корреляции хар-т тесноту связи рассм-ого набора факторов с исследуемым признаком. Независимо от формы связи в качестве показателя множ. корреляции может быть использован индекс множ. корреляции
(1)
При лин. зависимости признаков формула индекса множ. корреляции имеет вид
где — стандартизованные коэф-ты регрессии;
— парные коэф-ты корреляции результата с каждым фактором.
Для док-ва рассм. лин. ур-ние множ. регрессии в стандартизированном масштабе. Для него индекс множ. корреляции
Числитель подкоренного выражения представляет собой факторную сумму квадратов отклонений для стандартизованных переменных
Т.к. tу=0 и Σ(tу-ty)2= Σt2y=n, то индекс множественной корреляции используя ty=β1tx1+β2tx2+…+βptxp, получим:
Формула индекса множ. корреляции (1) для лин. регрессии получила наз. лин. коэф-та множ. корреляции, или совокупного коэф-та корреляции.
При лин. зависимости опр-ние совокупного коэф-та корреляции через матрицу парных коэф-тов корреляции:
где ∆r — опр-ль матрицы парных коэф-тов корреляции;
∆r11 — опр-ль матрицы межфакторной корреляции.
Для ур-ния у=а+b1x1+b2x2+…+bрxр+ε опр-ль матрицы коэф-тов парной корреляции примет вид:
Формула скорректированного индекса множественной детерминации имеет вид:
,
где — число параметров при переменных;
— число наблюдений.
Поскольку , то величину скорректированного (adjusted) индекса детерминации можно представить в виде
.
Чем больше величина , тем сильнее различаются и .
20. Частная корреляция при множественной регрессии. Прцедура пошагового отбора переменных
Для множ. регрессии возникает естественная задача найти «чистую» корреляцию между двумя переменными, исключив (линейное) влияние других факторов. Это можно сделать с помощью коэф-та частной корреляции. Предположим, что имеется регрессионная модель y=a+b1x1+b2x2+ε. Цель — опр-ть корреляцию между у и первым регрессором х1 после исключения влияния х2.
Соответствующая процедура устроена следующим образом.
1. Осущ-им регрессию у на х2 и константу и получим прогнозные знач ŷ=α1+α2х2
2. Осущ-им регрессию х1 на х2 и константу и получим прогнозные знач x1=γ1+γ2х2.
Удалим влияние х2, взяв остатки еу =у-ŷ и ех1=х1-х1.
Опр-м (выборочный) коэф-т частной корреляции между у и х1 при исключении влияния х2 как (выборочный) коэф-т корреляции между еу и ех1
r(y,x1|x2)=r(ey,ex1)
Из св-в метода наим. квадратов => что еу и ех1 не коррелированны с х2. Именно в этом смысле указанная процедура соответствует интуитивному представлению об «исключении (линейного) влияния переменной х2».
М. показать: .
Значения r(y,x1|x2) лежат в интервале [-1, 1], как у обычного коэф-та корреляции. Равенство коэф-та r(y,x1|x2) нулю означает, отсутствие прямого (линейного) влияния переменной х1 на у.
Сущест. связь м/у r(y,x1|x2) и R2: ;
.
Коэф-т частной корреляции часто используется при решении проблемы спецификации модели. На практике довольно часто приходится сталкиваться с ситуацией, когда имеется большое число наблюдений различных параметров (независимых переменных), но нет априорной модели изучаемого явления. Возникает естественная проблема, какие перем включить в регрессионную схему.
Процедура присоединения-удаления
На первом шаге из исходного набора объясняющих переменных выбирается (включается в число регрессоров) переменная, имеющая наибольший по мо-дулю коэф-т корреляции с зависимой переменной у.
Второй шаг состоит из двух подшагов. На первом, если число регрессоров уже больше двух, делается попытка исключить один из регрессоров. Ищется тот регрессор xS, удаление которого приводит к наименьшему уменьшению коэффициента детерминации. Затем сравнивается значение F-статистики для проверки гипотезы Н0 о незначимости этого регрессора с некоторым заранее заданным пороговым значением Fискл. Если F < Fискл, то xS удаляется из списка регрессоров.
Второй подшаг состоит в попытке включения нового регрессора из исходного набора предсказывающих переменных. Ищем переменную xр с наибольшим по модулю частным коэф-том корреляции (исключается влияние ранее включенных в уравнение регрессоров) и сравниваем значение F-статистики для проверки гипотезы Н0 о незначимости этого регрессора с не-которым заранее заданным пороговым значением Fвкл. Если F > Fвкл, то хр включается в список регрессоров. Второй шаг повторяется до тех пор, пока происходит изменение списка регрессоров.