- •Вариационный ряд
- •Распределение выборки
- •Несмещенные оценки дисперсии
- •Замечание
- •Состоятельность
- •Теорема Бореля
- •Замечание
- •Теорема Гливенко - Кантелли
- •Замечание
- •Гистограмма
- •Построение гистограммы
- •Замечание
- •Эффективность
- •Замечание
- •Метод моментов Пирсона
- •Достаточное условие состоятельности оценки, найденной по методу Пирсона
- •Метод максимального правдоподобия Фишера
- •Ди для математического ожидания (генеральной средней) µ при известной дисперсии σ2
- •Пример простой статистической гипотезы
- •Пример сложной статистической гипотезы
- •Замечание
- •Замечание
- •Минимаксный критерий
- •Критерий Бейеса
- •Регрессионный анализ
- •Замечание
- •Задачи регрессионного анализа
- •Аддитивная модель регрессии
- •Замечание
- •Уравнение множественной линейной регрессии
- •Проверка значимости уравнения множественной линейной регрессии
- •Несмещенная точечная оценка остаточной дисперсии
Замечание
При проведении расчетов оценок параметров множественной линейной модели регрессионного анализа с помощью МНК рекомендуется, чтобы n - число наблюдений - превосходило k+1 - число параметров - не менее чем в три раза.
Уравнение множественной линейной регрессии
Определяя на основании модельного уравнения (1) условное математическое ожидание критериальной переменной Y в предположении, что предикторы X1, X2, …, Xk приняли соответственно некоторые конкретные значения x1, x2,…, xk, принимая во внимание, что в этом случае β0+β1x1+β2x2+…+βjxj+…+βkxk есть константа, учитывая также, что согласно второй предпосылке регрессионного анализа M( ) равно нулю, получаем уравнение регрессии:
M(Y/x1,x2,…,xk)=β0+β1x1+β2x2+…+βjxj+…+βkxk |
(5) |
Следовательно, функциональная составляющая исходной регрессионной модели представляет собой функцию регрессии.
Оценка параметров множественной линейной модели регрессии с помощью метода наименьших квадратов.
Согласно этому методу в качестве оценки неизвестного вектора принимают тот вектор , который минимизирует квадрат длины вектора - остаточную сумму квадратов отклонений фактических значений критериальной переменной Y от соответствующих расчетных значений, найденных на основе уравнения регрессии Y на X1, X2,…, Xk:
,
т.е. искомый вектор должен удовлетворять требованию
.
Необходимые и достаточные условия минимума квадратичной формы Qост, рассматриваемой как функция аргументов β0, β1, β2,…, βj,…, βk, известны из математического анализа:
.
Осуществляя дифференцирование функции
отдельно по каждому из параметров β0, β1, β2,…, βj,…, βk, и приравнивая все эти производные нулю, получим k+1 соотношение для определения β0, β1, β2,…, βj,…, βk - МНК-оценок коэффициентов регрессии:
. |
(10) |
Система уравнений (10) в матричной форме записываются так:
,
или
, |
(11) |
где ХТ - транспонированная матрица X.
Учитывая, что в случае выполнения условий минимума Qост,, общее соотношение (7) имеет вид , на основании уравнения (11) приходим к равенству:
или, в эквивалентном виде,
.
Если - невырожденная матрица, то умножая слева обе части последнего уравнения на обратную матрицу , находим матричное выражение, определяющее МНК-оценку параметров модели множественной линейной регрессии как вектор-функцию выборочных данных:
. |
(12) |
Проверка значимости уравнения множественной линейной регрессии. Несмещенная оценка остаточной дисперсии критериальной переменной.
Проверка значимости уравнения множественной линейной регрессии
Проверить значимость уравнения регрессии – означает определить, соответствует ли математическая модель, выражающая зависимость между переменными, эмпирическим данным, достаточно ли включенных в уравнение объясняющих переменных (предикторов) для описания зависимой (критериальной) переменной.
Основная гипотеза:
H0: β0=β1=β2=…=βk=0.
Статистика критерия Фишера:
.
Условие отвержения основной гипотезы: F>Fкр, где Fкр - критическое значение, удовлетворяющее при заданном уровне значимости α применяемого критерия следующему условию:
P{F>Fкр(k+1,n-k-1)}=α.
При отвержении основной гипотезы заключают (с вероятностью ошибки такого вывода, равной α), что уравнение регрессии значимо (существенно), т.е. хотя бы один из коэффициентов регрессии отличен от нуля. В ином случае делают вывод, что имеющиеся статистические данные не подтверждаю его значимость.