Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕОРИЯ_СТАТИСТИКИ / СО-1-12_ЗАЧЕТ / Лаб.работы / лаб_4_Уравнения линейной парной регрессии_статистика.doc
Скачиваний:
62
Добавлен:
10.06.2015
Размер:
1.26 Mб
Скачать

Решим задачу прогнозирования.

Поскольку коэффициент детерминации R2 имеет достаточно высокое значение и расстояние 2 мили, для которого надо сделать прогноз, находится в пределах диапазона исходных данных (таблица 1), то мы можем использовать полученное уравнение линейной регрессии для прогнозирования

минут.

При прогнозах на расстояния, не входящие в диапазон исходных данных, нельзя гарантировать справедливость полученной модели. Это объясняется тем, что связь между временем и расстоянием может изменяться по мере увеличения расстояния. На время дальних перевозок могут влиять новые факторы такие, как использование скоростных шоссе, остановки на отдых, обед и т.п.

Таким образом, в результате использования регрессионного анализа в пакете Microsoft Excel мы:

  • построили уравнение регрессии;

  • установили форму зависимости и направление связи между переменными - положительная линейная регрессия, которая выражается в равномерном росте функции;

  • установили направление связи между переменными;

  • оценили качество полученной регрессионной прямой;

  • смогли увидеть отклонения расчетных данных от данных исходного набора;

  • предсказали будущее значение зависимой переменной.

Задача 2

Аппроксимировать полиномом первой степени по методу наименьших квадратов опытные данные, заданные выборкой двух взаимосвязанных дискретных случайных величин X и Y; по полученным данным оценить тесноту связи между ними; выполнить статистическое оценивание результатов расчетов.

(Данные к примеру приведены в столбцах 2 и 3 табл.6. Как видим, в данном примере объем парной выборки n = 18.)

Решение.

При ручной обработке экспериментальных данных результаты промежуточных вычислений целесообразно представить в табличном виде (см. табл. 6).

Решение состоит из следующих этапов:

1) По исходным данным находим суммы (см. табл.6)

3182, 1333,= 563094,99605,2359733182,3182 и средние значения176,778,74,056.

(В формулах для краткости у знака суммы опущены индексы, например, обозначение соответствует.)

Таблица.6

1

2

3

4

5

6

1

72

183

5184

33489

13176

2

70

170

4900

28900

11900

3

83

176

6889

30976

14608

4

68

178

4624

31684

12104

5

69

176

4761

30976

12144

6

83

180

6889

32400

14940

7

74

176

5476

30976

13024

8

79

185

6241

34225

14615

9

71

184

5041

33856

13064

10

68

174

4624

30276

11832

11

70

168

4900

28224

11760

12

70

174

4900

30276

12180

13

85

189

7225

35721

16065

14

83

172

6889

29584

14276

15

85

175

7225

30625

14875

16

60

167

3600

27889

10020

17

74

179

5476

32041

13246

18

69

176

4761

30976

12144

99605

563094

235973

2) Рассчитываем вспомогательные величины для вычисления коэффициентов регрессии:

= ;

= ;

;

= 5908.

3) Находим коэффициенты регрессий:

= 149,434;

;

;

.

4) Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции r:

.

Коэффициент корреляции изменяется в пределах от –1 до 1: . Знаки коэффициентов регрессии и корреляции совпадают. Интерпретация значенийr представлена в табл.7, 8.

Таблица 7

Оценка линейного коэффициента корреляции r по характеру связи

Значение линейного коэффициента связи

Характер связи

Интерпретация связи

r = 0

Отсутствует

-

0 < r < 1

Вероятностная, прямая

С увеличением X увеличивается Y

-1 < r < 0

Вероятностная, обратная

С увеличением X уменьшается Y и наоборот

r = +1

Функциональная, прямая

Каждому значению факторного признака строго соответствует одно значение функции, с увеличением X увеличивается Y

r = -1

Функциональная, обратная

Каждому значению факторного признака строго соответствует одно значение функции, с увеличением X уменьшается Y и наоборот

Таблица.8

Оценка коэффициента корреляции r по степени тесноты связи

Значение линейного коэффициента связи

Характер связи

До   0,3 

Практически отсутствует

  0,3  -   0,5 

Слабая

  0,5 -   0,7 

Умеренная

  0,7 -   1,0 

Сильная

В нашем примере значение

5) Для записи результатов вычислений определяем значения несмещенной дисперсии:

;

и среднего квадратического отклонения выборочного среднего:

; .