- •Лабораторная работа 6 тема: регрессионный анализ. Уравнение линейной парной регрессии.
- •Нелинейная регрессия
- •Методические рекомендации
- •Справочная информация по технологии работы с режимом "Регрессия" надстройки Пакет анализа msExcel
- •Решение
- •Решим задачу прогнозирования.
- •Задача 2
- •Выводы.
- •Варианты задач для самостоятельного решения Задача №1
- •Задача 2
Решим задачу прогнозирования.
Поскольку коэффициент детерминации R2 имеет достаточно высокое значение и расстояние 2 мили, для которого надо сделать прогноз, находится в пределах диапазона исходных данных (таблица 1), то мы можем использовать полученное уравнение линейной регрессии для прогнозирования
минут.
При прогнозах на расстояния, не входящие в диапазон исходных данных, нельзя гарантировать справедливость полученной модели. Это объясняется тем, что связь между временем и расстоянием может изменяться по мере увеличения расстояния. На время дальних перевозок могут влиять новые факторы такие, как использование скоростных шоссе, остановки на отдых, обед и т.п.
Таким образом, в результате использования регрессионного анализа в пакете Microsoft Excel мы:
построили уравнение регрессии;
установили форму зависимости и направление связи между переменными - положительная линейная регрессия, которая выражается в равномерном росте функции;
установили направление связи между переменными;
оценили качество полученной регрессионной прямой;
смогли увидеть отклонения расчетных данных от данных исходного набора;
предсказали будущее значение зависимой переменной.
Задача 2
Аппроксимировать полиномом первой степени по методу наименьших квадратов опытные данные, заданные выборкой двух взаимосвязанных дискретных случайных величин X и Y; по полученным данным оценить тесноту связи между ними; выполнить статистическое оценивание результатов расчетов.
(Данные к примеру приведены в столбцах 2 и 3 табл.6. Как видим, в данном примере объем парной выборки n = 18.)
Решение.
При ручной обработке экспериментальных данных результаты промежуточных вычислений целесообразно представить в табличном виде (см. табл. 6).
Решение состоит из следующих этапов:
1) По исходным данным находим суммы (см. табл.6)
3182, 1333,= 563094,99605,2359733182,3182 и средние значения176,778,74,056.
(В формулах для краткости у знака суммы опущены индексы, например, обозначение соответствует.)
Таблица.6
|
|
| |||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
72 |
183 |
5184 |
33489 |
13176 |
2 |
70 |
170 |
4900 |
28900 |
11900 |
3 |
83 |
176 |
6889 |
30976 |
14608 |
4 |
68 |
178 |
4624 |
31684 |
12104 |
5 |
69 |
176 |
4761 |
30976 |
12144 |
6 |
83 |
180 |
6889 |
32400 |
14940 |
7 |
74 |
176 |
5476 |
30976 |
13024 |
8 |
79 |
185 |
6241 |
34225 |
14615 |
9 |
71 |
184 |
5041 |
33856 |
13064 |
10 |
68 |
174 |
4624 |
30276 |
11832 |
11 |
70 |
168 |
4900 |
28224 |
11760 |
12 |
70 |
174 |
4900 |
30276 |
12180 |
13 |
85 |
189 |
7225 |
35721 |
16065 |
14 |
83 |
172 |
6889 |
29584 |
14276 |
15 |
85 |
175 |
7225 |
30625 |
14875 |
16 |
60 |
167 |
3600 |
27889 |
10020 |
17 |
74 |
179 |
5476 |
32041 |
13246 |
18 |
69 |
176 |
4761 |
30976 |
12144 |
|
99605 |
563094 |
235973 |
2) Рассчитываем вспомогательные величины для вычисления коэффициентов регрессии:
= ;
= ;
;
= 5908.
3) Находим коэффициенты регрессий:
= 149,434;
;
;
.
4) Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции r:
.
Коэффициент корреляции изменяется в пределах от –1 до 1: . Знаки коэффициентов регрессии и корреляции совпадают. Интерпретация значенийr представлена в табл.7, 8.
Таблица 7
Оценка линейного коэффициента корреляции r по характеру связи
Значение линейного коэффициента связи |
Характер связи |
Интерпретация связи |
r = 0 |
Отсутствует |
- |
0 < r < 1 |
Вероятностная, прямая |
С увеличением X увеличивается Y |
-1 < r < 0 |
Вероятностная, обратная |
С увеличением X уменьшается Y и наоборот |
r = +1 |
Функциональная, прямая |
Каждому значению факторного признака строго соответствует одно значение функции, с увеличением X увеличивается Y |
r = -1 |
Функциональная, обратная |
Каждому значению факторного признака строго соответствует одно значение функции, с увеличением X уменьшается Y и наоборот |
Таблица.8
Оценка коэффициента корреляции r по степени тесноты связи
Значение линейного коэффициента связи |
Характер связи |
До 0,3 |
Практически отсутствует |
0,3 - 0,5 |
Слабая |
0,5 - 0,7 |
Умеренная |
0,7 - 1,0 |
Сильная |
В нашем примере значение
5) Для записи результатов вычислений определяем значения несмещенной дисперсии:
;
и среднего квадратического отклонения выборочного среднего:
; .