Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Консп. лек. по экономет. Цвиль М.М..doc
Скачиваний:
53
Добавлен:
09.11.2019
Размер:
3.5 Mб
Скачать

4. Оценка значимости уравнения регрессии. Коэффициент детерминации

Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.

В математической статистике дисперсионный анализ рассмотрен как самостоятельный инструмент (метод) статистического анализа. Здесь же он применяется как вспомогательное средство для изучения качества регрессионной модели.

Согласно основной идее дисперсионного анализа общая сумма квадратов отклонений зависимой переменной от средней представляется в виде:

(2.23)

или , (2.24)

где и – соответственно сумма квадратов, обусловленная регрессией, и остаточная сумма квадратов, характеризующая влияние неучтенных факторов и

(2.24)

Легко убедиться в том, что в (2.23) третье слагаемое равно 0 (см. [1], с.70).

Схема дисперсионного анализа имеет вид, представленный в таблице.

Компоненты регрессии

Сумма квадратов

Число степеней свободы

Средние квадраты

Регрессия

m1

Остаточная

nm

Общая

n1

Средние квадраты , представляют собой несмещенные оценки дисперсий зависимой переменной, обусловленных соответственно регрессией или объясняющей переменной и воздействием неучтенных случайных факторов и ошибок; m – число оцениваемых параметров уравнения регрессии; n – число наблюдений.

При отсутствии линейной зависимости между зависимой и объясняющими(ей) переменными случайные величины и имеют – распределение соответственно с m – 1 и nm степенями свободы, а их отношение – -распределение с теми же степенями свободы. Поэтому уравнение регрессии значимо на уровне , если фактически наблюдаемое значение статистики

, (2.24)

где – табличное значение -критерия Фишера-Снедекора, определенное на уровне значимости при и степенях свободы.

Учитывая смысл величин и , можно сказать, что значение показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с ее средней.

В случае линейной парной регрессии , и уравнение регрессии значимо на уровне , если

. (2.25)

Иначе, гипотеза о равенстве параметра нулю, т.е. , отвергается.

Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, (или, как говорят, мерой качества подгонки регрессионной модели к наблюденным значениям ), характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации, определяемый по формуле:

. (2.26)

Величина показывает, какая часть (доля) вариации зависимой переменной обусловлена вариацией объясняющей переменной.

Так как , то .

Чем ближе к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии. Если , то эмпирические точки лежат на линии регрессии и между переменными и существует линейная функциональная зависимость. Если , то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных, и линия регрессии параллельна оси абсцисс.

Если известен коэффициент детерминации , то критерий значимости (2.24) уравнения регрессии или самого коэффициента детерминации может быть записан в виде:

.

В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, т.е. .