Число степеней свободы для общей суммы квадратов отклонений
dfобщ = n-1.
Для суммы квадратов отклонения, объясненных регрессией dfрег = 1.
Для остаточной суммы квадратов отклонения dfост = n-2.
n – число наблюдений.
Между степенями свободы определяются соответствия:
dfобщ = dfрег + dfост
Разделив каждую сумму квадратов отклонений на соответствующее число степеней свободы, получим величину – средний квадрат отклонения на одну степень свободы.
Эти величины используются для проверки уравнения регрессии. Проверяются гипотезы о существенности уравнения регрессии; о значимости коэффициентов уравнения регрессии; о значимости коэффициента корреляции.
Для проверки гипотезы о существенности уравнения регрессии используется F-критерий Фишера.
Способ 1.
Изначально принимается гипотеза Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого вычисляется
F-статистика:
.
Определяется табличное значение Fdf1,df2,α при заданном уровне значимости α и степенях свободы df1 = 1, df2 = n-2.
Данное значение можно определить по таблице. Оно представляет собой процентную точку, которая определяется из уравнения:
α – уровень значимости, т.е. некоторая маленькая вероятность (например – 0,05), определяющая надежность полученных оценок.
Р(F) – плотность распределения вероятности Фишера со степенями свободы df1, df2.
Если Fpасч> Fdf1,df2,α (рассчитанное значение больше, чем табличное) точка попала в зону α – зону отклонения гипотеза H0 отклоняется и признается статистическая значимость и надежность уравнения регрессии и коэффициента детерминации.
Обычно 1-ый способ проверки значимости используется для ручных расчетов.
Способ 2.
В пакетах программ используется другой способ проверки – вычисляется P-уровень, т.е. значение вероятности, соответствующее расчетному значению F-критерия.
Если P<α, то гипотезу H0 следует отвергнуть, т.е. признать статистическую значимость и надежность уравнения регрессии и коэффициента детерминации. Чем меньше значение P-уровня, тем надежнее полученные оценки.
Величина F-критерия связана с коэффициентом детерминации R2:
.
Проверка существенности уравнения регрессии с помощью F-критерия проводится при условии нормальности распределения ошибки регрессии.
При таком же предположении можно проверить гипотезы относительно каждого коэффициента с использованием Т-статистики Стьюдента:
а, b – коэффициенты уравнения регрессии,
r – коэффициент корреляции.
t-статистика для коэффициента уравнения регрессии а – ;
t-статистика для коэффициента уравнения регрессии b – ;
t-статистика для коэффициента корреляции r – .
ma, mb, mr – стандартные ошибки.
; ; .
Для проверки значимости этих коэффициентов необходимо сравнить полученные расчетные значения ta, tb, tr с табличным значением распределения Стьюдента с df степенями свободы и уровнем значимости α, т.е. с tdf,α (df = n-2).
Если расчетное значение по абсолютной величине больше табличного, то нулевая гипотеза H0
Н0: а =0,
Н0: b = 0,
Н0: r = 0.
отвергается и значение соответствующего коэффициента считается значимым при данном уровне значимости α.
Связь между F-критерием Фишера и t – статистикой Стьюдента выражается равенством:
= .
Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равна проверке гипотезы о существенности уравнения регрессии.
Качество уравнения регрессии можно также оценить с помощью средней ошибки аппроксимации