Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры с 11 по 20.doc
Скачиваний:
16
Добавлен:
21.09.2019
Размер:
426.5 Кб
Скачать

19. Множественная корреляция. Скорректированный индекс детерминации.

Для множе. регрессии необходим пар-тр оценки его значимости. Введем показатель множ. корреляции и его квадрата — коэф-та детерминации. Показатель множ. корреляции хар-т тесноту связи рассм-ого набора факторов с исследуемым признаком. Независимо от формы связи в качестве показателя множ. корреляции может быть использован индекс множ. корреляции

(1)

При лин. зависимости признаков формула индекса множ. корреляции имеет вид

где — стандартизованные коэф-ты регрессии;

— парные коэф-ты корреляции результата с каждым фактором.

Для док-ва рассм. лин. ур-ние множ. регрессии в стандартизированном масштабе. Для него индекс множ. корреляции

Числитель подкоренного выражения представляет собой факторную сумму квадратов отклонений для стандартизованных переменных

Т.к. tу=0 и Σ(tу-ty)2= Σt2y=n, то индекс множественной корреляции используя ty1tx12tx2+…+βptxp, получим:

Формула индекса множ. корреляции (1) для лин. регрессии получила наз. лин. коэф-та множ. корреляции, или совокупного коэф-та корреляции.

При лин. зависимости опр-ние совокупного коэф-та корреляции через матрицу парных коэф-тов корреляции:

где ∆r — опр-ль матрицы парных коэф-тов корреляции;

r11 — опр-ль матрицы межфакторной корреляции.

Для ур-ния у=а+b1x1+b2x2+…+bрxр+ε опр-ль матрицы коэф-тов парной корреляции примет вид:

Формула скорректированного индекса множественной детерминации имеет вид:

,

где — число параметров при переменных;

— число наблюдений.

Поскольку , то величину скорректированного (adjusted) индекса детерминации можно представить в виде

.

Чем больше величина , тем сильнее различаются и .

20. Частная корреляция при множественной регрессии. Прцедура пошагового отбора переменных

Для множ. регрессии возникает естественная задача найти «чистую» корреляцию между двумя переменными, исключив (линейное) влияние других факторов. Это можно сделать с помощью коэф-та частной корреляции. Предположим, что имеется регрессионная модель y=a+b1x1+b2x2+ε. Цель — опр-ть корреляцию между у и первым регрессором х1 после исключения влияния х2.

Соответствующая процедура устроена следующим образом.

1. Осущ-им регрессию у на х2 и константу и получим прогнозные знач ŷ=α12х2

2. Осущ-им регрессию х1 на х2 и константу и получим прогнозные знач x112х2.

  1. Удалим влияние х2, взяв остатки еу =у-ŷ и ех111.

  2. Опр-м (выборочный) коэф-т частной корреляции между у и х1 при исключении влияния х2 как (выборочный) коэф-т корреляции между еу и ех1

r(y,x1|x2)=r(ey,ex1)

Из св-в метода наим. квадратов => что еу и ех1 не коррелированны с х2. Именно в этом смысле указанная процедура соответствует интуитивному представлению об «исключении (линейного) влияния переменной х2».

М. показать: .

Значения r(y,x1|x2) лежат в интервале [-1, 1], как у обычного коэф-та корреляции. Равенство коэф-та r(y,x1|x2) нулю означает, отсутствие прямого (линейного) влияния переменной х1 на у.

Сущест. связь м/у r(y,x1|x2) и R2: ;

.

Коэф-т частной корреляции часто используется при решении проблемы спецификации модели. На практике довольно часто приходится сталкиваться с ситуацией, когда имеется большое число наблюдений различных параметров (независимых переменных), но нет априорной модели изучаемого явления. Возникает естественная проблема, какие перем включить в регрессионную схему.

Процедура присоединения-удаления

На первом шаге из исходного набора объясняющих переменных выбирается (включается в число регрессоров) переменная, имеющая наибольший по мо-дулю коэф-т корреляции с зависимой переменной у.

Второй шаг состоит из двух подшагов. На первом, если число регрессоров уже больше двух, делается попытка исключить один из регрессоров. Ищется тот регрессор xS, удаление которого приводит к наименьшему уменьшению коэффициента детерминации. Затем сравнивается значение F-статистики для проверки гипотезы Н0 о незначимости этого регрессора с некоторым заранее заданным пороговым значением Fискл. Если F < Fискл, то xS удаляется из списка регрессоров.

Второй подшаг состоит в попытке включения нового регрессора из исходного набора предсказывающих переменных. Ищем переменную xр с наибольшим по модулю частным коэф-том корреляции (исключается влияние ранее включенных в уравнение регрессоров) и сравниваем значение F-статистики для проверки гипотезы Н0 о незначимости этого регрессора с не-которым заранее заданным пороговым значением Fвкл. Если F > Fвкл, то хр включается в список регрессоров. Второй шаг повторяется до тех пор, пока происходит изменение списка регрессоров.