Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
15
Добавлен:
19.03.2015
Размер:
648.7 Кб
Скачать

12

Министерство общего и профессионального

ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

______________________________

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ОТКРЫТЫЙ УНИВЕРСИТЕТ

КОЛОМЕНСКИЙ ИНСТИТУТ

«УТВЕРЖДЕНО»

Учебно-методическим

Советом КИ МГОУ

Председатель совета

______________________

А. М. Липатов

«____»___________ 2003 г.

Трушков А. С.

Родионов К.А.

ВЫСШАЯ МАТЕМАТИКА

И Н С Т Р У К Ц И Я

для выполнения лабораторной работы

Множественный линейный регрессионный анализ. Оценка функциональной зависимости параметров энергоустановки.

2003 г.

Содержание

1.

Введение

2

2.

Модель множественной регрессии

2

3.

Преобразование данных при оценке нелинейных соотношений

между переменными

4

4.

Порядок выполнения лабораторной работы

5

4.1.

Применение функции ЛИНЕЙН для оценки параметров регрессии

7

4.2.

Определение коэффициентов регрессии и параметров регрессионной статистики

8

4.3.

Проверка значимости коэффициентов уравнения регрессии

8

4.4.

Проверка значимости уравнения регрессии

9

4.5.

Вычисление расчетных значений регрессии и построение диаграмм

9

4.6.

Построение других регрессионных моделей

10

5.

Задание к лабораторной работе

12

6.

Литература

12

1. Введение

Лабораторная работа выполняется с помощью электронных таблиц Microsoft Excel в операционной среде Windows 9x/ME/XP/NT/2000. В рабочей книге Excel используется программный код, написанный на алгоритмическом языке Visual Basic for Application (VBA), с помощью которого по заданному номеру варианта генерируется выборка со случайным объемом наблюдений на основе розыгрыша четырехмерной случайной величины (P, U, T, M) по заданному уравнению регрессии P = f(U, T, M) и дисперсии ошибки. C помощью программы производится линейный регрессионный анализ.

Целью лабораторной работы является определение функциональной зависимости параметров энергоустановки с помощью множественного регрессионного анализа для различных форм зависимости. Освоение алгоритмов статистических методов обработки наблюдений: вычисление коэффициентов регрессии, построение линейной регрессии, определение значимости коэффициентов регрессии, анализ дисперсий, расчет коэффициента детерминации, определение значимости уравнения регрессии, построение диаграммы наблюдений случайной величины и диаграммы расчетной величины по полученной регрессионной модели.

2. Модель множественной регрессии

Рассматривается следующее уравнение модели:

y = 1x1 + 2x2 + ... + kxk + , (1)

где - вектор коэффициентов модели,

х1 , х2 , ... , хk - регрессоры (независимые переменные),

- случайная компонента, N(0, ), где 2 - дисперсия ошибок.

Будем рассматривать модель, где в качестве регрессоров выступают степени аргумента х:

y = 0 + 1x + 2x2 + ... + kxk + . (2)

По результатам экспериментов (xi ; yi ), i = 1, ... , n надо определить значения коэффициентов i .

Пусть:

. (3)

Здесь Х - матрица размера n(k+1) наблюдаемых значений регрессоров.

Пусть y* = 0 + 1x + 2x2 + ... + kxk - уравнение регрессии.

Тогда - прогноз значений объясняемой переменной.

Обозначим:

- вектор прогнозируемых значений. (4)

Тогда - вектор разности между выборочными и прогнозируемыми значениямиy.

Будем находить вектор из условия минимизации длины вектора(или ее квадрата):. Из линейной алгебры известно соотношение:

. (5)

Можно показать, что для оценки коэффициентов множественной регрессии необходимо использовать формулу, совпадающую со случаем парной регрессии:

. (6)

Для оценки дисперсии ошибок 2 используется формула:

. (7)

На основании теоремы Гаусса-Маркова можно утверждать, что эти оценки являются несмещенными и эффективными в классе линейных несмещенных оценок.

Коэффициент детерминации определяется так же, как и для парной регрессии:

. (8)

Для определения дисперсий оценок коэффициентов регрессии вычисляется матрица ковариаций:

. (9)

В качестве дисперсий оценок:

(10)

берутся диагональные элементы qii матрицы :.

Для построения доверительных интервалов для коэффициентов регрессии i используют статистику:

, (11)

имеющую распределение Стьюдента с n - (k + 1) степенями свободы. Таким образом, доверительный интервал имеет вид:

, (12)

где t - квантиль распределения Стьюдента, соответствующий надежности и n - (k + 1) степеням свободы.

Для проверки значимости коэффициентов регрессии i можно использовать эту же статистику. А именно, при проверке гипотезы:

H0: i = 0 (13)

H1: i 0

двусторонняя критическая область формируется из условия:

, (14)

где tкр(; n - (k + 1)) - критическая точка распределения Стьюдента, соответствующая уровню значимости и числу степеней свободы n - (k + 1) .

Для оценки значимости уравнения регрессии, то есть проверки факта улучшения прогноза значения у по сравнению с тривиальным: используется критерий Фишера. Гипотеза:

H0: 1 = 2 = ... = k = 0 (15)

(свободный член 0 - не учитывается) проверяется с использованием статистики:

, (16)

имеющей распределение Фишера F(k; n - (k + 1)). Если наблюдаемое значение Fнабл больше критического Fкр(; k; n - (k + 1)), то гипотеза Н0 - отвергается.

Соседние файлы в папке Lab3