- •Министерство общего и профессионального
- •1. Введение
- •2. Модель множественной регрессии
- •3. Преобразование данных при оценке нелинейных соотношений между переменными
- •4. Порядок выполнения лабораторной работы
- •4.1. Применение функции линейн для оценки параметров регрессии
- •4.2. Определение коэффициентов регрессии и параметров
- •4.3. Проверка значимости коэффициентовI
- •4.4. Проверка значимости уравнения регрессии
- •4.5. Вычисление расчетных значений регрессии и построение диаграмм
- •4.6. Построение других регрессионных моделей
- •5. Задание к лабораторной работе
- •6. Литература
Министерство общего и профессионального
ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
______________________________
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ОТКРЫТЫЙ УНИВЕРСИТЕТ
КОЛОМЕНСКИЙ ИНСТИТУТ
|
«УТВЕРЖДЕНО» Учебно-методическим Советом КИ МГОУ Председатель совета
______________________
А. М. Липатов
«____»___________ 2003 г. |
Трушков А. С.
Родионов К.А.
ВЫСШАЯ МАТЕМАТИКА
И Н С Т Р У К Ц И Я
для выполнения лабораторной работы
Множественный линейный регрессионный анализ. Оценка функциональной зависимости параметров энергоустановки.
2003 г.
Содержание
1. |
Введение |
2 |
2. |
Модель множественной регрессии |
2 |
3. |
Преобразование данных при оценке нелинейных соотношений между переменными |
4 |
4. |
Порядок выполнения лабораторной работы |
5 |
4.1. |
Применение функции ЛИНЕЙН для оценки параметров регрессии |
7 |
4.2. |
Определение коэффициентов регрессии и параметров регрессионной статистики |
8 |
4.3. |
Проверка значимости коэффициентов уравнения регрессии |
8 |
4.4. |
Проверка значимости уравнения регрессии |
9 |
4.5. |
Вычисление расчетных значений регрессии и построение диаграмм |
9 |
4.6. |
Построение других регрессионных моделей |
10 |
5. |
Задание к лабораторной работе |
12 |
6. |
Литература |
12 |
1. Введение
Лабораторная работа выполняется с помощью электронных таблиц Microsoft Excel в операционной среде Windows 9x/ME/XP/NT/2000. В рабочей книге Excel используется программный код, написанный на алгоритмическом языке Visual Basic for Application (VBA), с помощью которого по заданному номеру варианта генерируется выборка со случайным объемом наблюдений на основе розыгрыша четырехмерной случайной величины (P, U, T, M) по заданному уравнению регрессии P = f(U, T, M) и дисперсии ошибки. C помощью программы производится линейный регрессионный анализ.
Целью лабораторной работы является определение функциональной зависимости параметров энергоустановки с помощью множественного регрессионного анализа для различных форм зависимости. Освоение алгоритмов статистических методов обработки наблюдений: вычисление коэффициентов регрессии, построение линейной регрессии, определение значимости коэффициентов регрессии, анализ дисперсий, расчет коэффициента детерминации, определение значимости уравнения регрессии, построение диаграммы наблюдений случайной величины и диаграммы расчетной величины по полученной регрессионной модели.
2. Модель множественной регрессии
Рассматривается следующее уравнение модели:
y = 1x1 + 2x2 + ... + kxk + , (1)
где - вектор коэффициентов модели,
х1 , х2 , ... , хk - регрессоры (независимые переменные),
- случайная компонента, N(0, ), где 2 - дисперсия ошибок.
Будем рассматривать модель, где в качестве регрессоров выступают степени аргумента х:
y = 0 + 1x + 2x2 + ... + kxk + . (2)
По результатам экспериментов (xi ; yi ), i = 1, ... , n надо определить значения коэффициентов i .
Пусть:
. (3)
Здесь Х - матрица размера n(k+1) наблюдаемых значений регрессоров.
Пусть y* = 0 + 1x + 2x2 + ... + kxk - уравнение регрессии.
Тогда - прогноз значений объясняемой переменной.
Обозначим:
- вектор прогнозируемых значений. (4)
Тогда - вектор разности между выборочными и прогнозируемыми значениямиy.
Будем находить вектор из условия минимизации длины вектора(или ее квадрата):. Из линейной алгебры известно соотношение:
. (5)
Можно показать, что для оценки коэффициентов множественной регрессии необходимо использовать формулу, совпадающую со случаем парной регрессии:
. (6)
Для оценки дисперсии ошибок 2 используется формула:
. (7)
На основании теоремы Гаусса-Маркова можно утверждать, что эти оценки являются несмещенными и эффективными в классе линейных несмещенных оценок.
Коэффициент детерминации определяется так же, как и для парной регрессии:
. (8)
Для определения дисперсий оценок коэффициентов регрессии вычисляется матрица ковариаций:
. (9)
В качестве дисперсий оценок:
(10)
берутся диагональные элементы qii матрицы :.
Для построения доверительных интервалов для коэффициентов регрессии i используют статистику:
, (11)
имеющую распределение Стьюдента с n - (k + 1) степенями свободы. Таким образом, доверительный интервал имеет вид:
, (12)
где t - квантиль распределения Стьюдента, соответствующий надежности и n - (k + 1) степеням свободы.
Для проверки значимости коэффициентов регрессии i можно использовать эту же статистику. А именно, при проверке гипотезы:
H0: i = 0 (13)
H1: i 0
двусторонняя критическая область формируется из условия:
, (14)
где tкр(; n - (k + 1)) - критическая точка распределения Стьюдента, соответствующая уровню значимости и числу степеней свободы n - (k + 1) .
Для оценки значимости уравнения регрессии, то есть проверки факта улучшения прогноза значения у по сравнению с тривиальным: используется критерий Фишера. Гипотеза:
H0: 1 = 2 = ... = k = 0 (15)
(свободный член 0 - не учитывается) проверяется с использованием статистики:
, (16)
имеющей распределение Фишера F(k; n - (k + 1)). Если наблюдаемое значение Fнабл больше критического Fкр(; k; n - (k + 1)), то гипотеза Н0 - отвергается.