Эконометрика / 5
.docx
1. Парная линейная регрессия.
2. Метод наименьших квадратов.
3. Коэффициент корреляции.
Простейшей системой корреляционной связи является линейная связь. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид:
y=a+bx.
Оно определяется по данным о значениях признаков х и у в изучаемой совокупности, состоящей из n единиц. Для нахождения параметров уравнения a и b использовался метод наименьших квадратов.
Исходное условие метода наименьших квадратов для прямой линии имеет вид:
Для отыскания значений параметров a и b, при которых принимает минимальное значение, частные производные функции приравниваем к нулю и преобразуем получаемые уравнения, которые называются нормальными уравнениями метода наименьших квадратов для прямой:
Отсюда система нормальных уравнений имеет следующий вид :
(1)
Решая эту систему определяем значения переменных a и b.
Теснота парной линейной корреляционной связи измеряется коэффициентом корреляции rxy:
(2)
После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.
Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Оценка значимости уравнения регрессии в целом производится на основе -критерия Фишера, который заключается в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fкрит значений -критерия Фишера. Fфакт определяется по следующей формуле:
.
где - коэффициент детерминации;
n – число единиц совокупности.
Fкрит – это максимально возможное значение критерия при данных степенях свободы (1, n-2) и уровне значимости α. Уровень значимости α – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.
Если фактическое значение -критерия больше табличного , то гипотеза Н0отклоняется, т.е. признается статистическая значимость и надежность уравнения регрессии.
В парной линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его случайная ошибка: и .
Случайные ошибки коэффициентов регрессии определяются по формулам:
.
Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции mr:
.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается -критерий Стьюдента. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции проводится путем сопоставления их значений с величиной случайной ошибки:
; ; .
Сравниваем фактические и критические (табличные) значения -статистики. Если tфакт>tкрит(α,n-2), то Н0 отклоняется, т.е. a, b и rxy не случайно отличаются от нуля и все они статистически значимы. Иначе, гипотеза Н0 о случайной природе показателей принимается.