Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по эконометрике.docx
Скачиваний:
400
Добавлен:
29.03.2016
Размер:
9.51 Mб
Скачать

3.5. Качество оценок мнк линейной множественной регрессии. Теорема Гаусса-Маркова

В классическом множественном регрессионном анализе обычно делаются следующие предпосылки:

1. Математическое ожидание случайного члена равно нулю в любом налюдении

(3.30)

2. Дисперсия случайного члена постоянна для всех наблюдений

. (3.31)

3. Значения случайного члена в любых наблюдениях ине коррелируют между собой

Cov() = 0 (i ≠ j).(3.32)

Это условие с учетом того, что М() =М() = 0 принимает вид

M() = 0 (i ≠ j). (3.33)

4. Случайный член должен быть распределен независимо от объясняющих переменных в одних и тех же наблюдениях

Cov() =M() =0, (3.34)

где было учтено, что М() = 0.

Следует сказать, что последнее условие заведомо выполняется, если

объясняющие переменные считаются детерминированными величинами.

5. Матрица является неособенной, т. е. столбцы матрицыX линейно независимы.

6. Значения случайного члена распределены по нормальному закону.

Модель (3.6), удовлетворяющая приведенным предпосылкам 1- 6, называется классической нормальной линейной моделью множественной регрессии.

Модель (3.6), удовлетворяющая приведенным предпосылкам 1- 5, называется классической линейной моделью множественной регрессии.

Согласно теореме Гаусса-Маркова, при выполнении указанных предпосылок оценки параметров линейной множественной регрессии (3.13), полученные методом наименьших квадратов, будут несмещенными и эффективными (т. е. будут иметь наименьшую дисперсию) в классе линейных несмещенных оценок.

Нарушение одного из условий Гаусса-Маркова приводит к нарушению

эффективности оценок, т. е. в классе несмещенных оценок можно найти такие, которые имеют меньшую дисперсию.

После построения модели необходимо вычислить значения остатков еi и проверить выполнение предпосылок 1- 6, так как их нарушение снижает качество модели. Если условия нарушаются, то следует модернизировать модель соответствующим образом. Эти вопросы будут рассмотрены далее.

3.6. Проверка качества уравнения регрессии. F-критерий Фишера

Как и в случае парной регрессии для оценки качества полученного множественной уравнения регрессии (3.6) можно использовать коэффициентмножественной детерминации, представляющий собой отношение факторной суммы квадратов остатков к их общей сумме квадратов:

(3.35)

- остаточная сумма квадратов.

Коэффициент множественной корреляции равен корню из коэффициента множественной детерминации:

(3.36)

Оба показателя изменяются от нуля до единицы.показывает, какая часть вариации результативного признакаy объяснена уравнением регрессии. Чем выше значение, тем лучше данная модель согласуется с данными наблюдений.

Коэффициент множественной корреляции Rиспользуется для оценки тесноты связи факторов с исследуемым признаком. Чем ближе величинаR к единице, тем теснее данная связь, тем лучше теоретическая зависимость согласуется с эмпирическими данными.

Введём понятие дисперсии на одну степень свободы (df).

, (3.37)

где (n-1) - количество степеней свободы для общей дисперсии;

p–для факторнойдисперсии (количество независимых переменных в уравнении регрессии);

(n-p-1) – для остаточной дисперсии.

Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации ) осуществляется с помощьюF-критерия Фишера

(3.38)

Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии отвергается при выполнении условияF >Fкрит, гдеFкритопределяется по таблицамF-критерия Фишера по двум степеням свободыk1 = p,k2 =n-p-1 и заданному уровню значимости α.

Величина коэффициента множественной корреляции Rне может быть меньше максимального парного индекса корреляции max.

В случае линейной зависимости (3.6) коэффициент корреляции R связан с парными коэффициентами корреляциисоотношением

(3.39)

Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину.

Поэтому при большом количестве факторов предпочтительнее использовать, так называемый, скорректированный, улучшенный (adjusted) коэффициент множественной детерминации, определяемый соотношением

(3.40)

Чем больше величина p, тем сильнее различияи.

При использовании для оценки целесообразности включения фактора в уравнение регрессии следует учитывать, что увеличениепри включении нового фактора не обязательно свидетельствует о его значимости, так как значениеувеличивается всегда, когдаt - статистика по модулю больше единицы.

При заданном объеме наблюдений и при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Отметим, что низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации может быть обусловлено следующими причинами:

– в регрессионную модель не включены существенные факторы;

– неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель.