Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metod_stat_Poln_Vers.doc
Скачиваний:
2
Добавлен:
21.08.2019
Размер:
4.15 Mб
Скачать

Исходные данные для выполнения задания №1.

Вариант № 1.

Интервал значений

Частота

2,0<x<=4,0

1

4,0<x<=6,0

5

6,0<x<=8,0

7

8,0<x<=10,0

10

10,0<x<=12,0

11

12,0<x<=14,0

13

14,0<x<=16,0

2

16,0<x<=18,0

1

Итого

50

Вариант № 2

Интервал значений

Частота

8,0<=x<10,0

2

10,0<=x<12,0

14

12,0<=x<14,0

21

14,0<=x<16,0

28

16,0<=x<18,0

18

18,0<=x<20,0

11

20,0<=x<22,0

6

Итого

100

Вариант № 3

Интервал значений

Частота

3,0<=x<6,0

4

6,0<=x<9,0

5

9,0<=x<12,0

16

12,0<=x<15,0

23

15,0<=x<18,0

27

18,0<=x<21,0

14

21,0<=x<24,0

7

24,0<=x<27,0

3

27,0<=x<30,0

1

Итого

100

Вариант №4

Интервал значений

Частота

8,0<=x<11,0

1

11,0<=x<14,0

3

14,0<=x<17,0

15

17,0<=x<20,0

22

20,0<=x<23,0

27

23,0<=x<26,0

16

26,0<=x<29,0

10

29,0<=x<32,0

5

32,0<=x<35,0

1

Итого

100

Вариант № 5.

Интервал значений

частота

9,0<=x<12,0

2

12,0<=x<15,0

8

15,0<=x<18,0

16

18,0<=x<21,0

23

21,0<=x<24,0

28

24,0<=x<27,0

18

27,0<=x<30,0

4

30,0<=x<33,0

1

Итого

100

Вариант №6.

Интервал значений

частота

4,0<=x<7,0

2

7,0<=x<10,0

17

10,0<=x<13,0

18

13,0<=x<16,0

26

16,0<=x<19,0

17

19,0<=x<22,0

10

22,0<=x<25,0

8

25,0<=x<28,0

2

Итого

100

Вариант № 7.

Интервал значений

Частота

5,0<=x<6,2

4

6,2<=x<7,4

2

7,4<=x<8,6

13

8,6<=x<9,8

19

9,8<=x<11,0

18

11,0<=x<12,2

29

12,2<=x<13,4

12

13,4<=x<14,6

2

14,6<=x<15,8

1

Итого

100

Вариант №8.

Интервал значений

Частота

0,0<=x<2,0

4

2,0<=x<4,0

2

4,0<=x<6,0

9

6,0<=x<8,0

17

8,0<=x<10,0

25

10,0<=x<12,0

21

12,0<=x<14,0

10

14,0<=x<16,0

3

16,0<=x<18,0

9

Итого

100

Вариант №9

Интервал значений

Частота

4,0<=x<9,0

2

9,0<=x<14,0

3

14,0<=x<19,0

18

19,0<=x<24,0

18

24,0<=x<29,0

22

29,0<=x<34,0

27

34,0<=x<39,0

8

39,0<=x<44,0

1

44,0<=x<49,0

1

Итого

100

Вариант № 10.

Интервал значений

Частота

8,0<=x<13,0

2

13,0<=x<18,0

4

18,0<=x<23,0

14

23,0<=x<28,0

17

28,0<=x<33,0

28

33,0<=x<38,0

16

38,0<=x<43,0

11

43,0<=x<48,0

5

48,0<=x<53,0

3

Итого

100

Вариант № 11.

Интервал значений

Частота

40<=x<50

2

50<=x<60

4

60<=x<70

7

70<=x<80

10

80<=x<90

15

90<=x<100

20

100<=x<110

22

110<=x<120

11

120<=x<130

6

130<=x<140

3

Итого

100

Вариант № 12.

Интервал значений

Частота

80<=x<90

1

90<=x<100

5

100<=x<110

8

110<=x<120

9

120<=x<130

13

130<=x<140

22

140<=x<150

20

150<=x<160

12

160<=x<170

8

170<=x<180

2

Итого

100

Вариант № 13.

Интервал значений

Частота

0<=x<2

4

2<=x<4

9

4<=x<6

12

6<=x<8

22

8<=x<10

19

10<=x<12

16

12<=x<14

11

14<=x<16

7

Итого

100

Вариант № 14.

Интервал значений

Частота

2,2<=x<5,4

3

5,4<=x<8,6

5

8,6<=x<11,8

9

11,8<=x<15

10

15<=x<18,2

12

18,2<=x<21,4

13

21,4<=x<24,6

18

24,6<=x<27,8

17

27,8<=x<31

11

31<=x<34,2

8

34,2<=x<37,4

4

Итого

110

Вариант № 15.

Интервал значений

Частота

0<=x<28

2

28<=x<113

5

113<=x<198

11

198<=x<283

12

283<=x<368

15

368<=x<453

9

453<=x<538

9

538<=x<623

6

623<=x<708

1

Итого

70

Вариант № 16.

Интервал значений

Частота

1<=x<5

2

5<=x<9

5

9<=x<13

9

13<=x<17

15

17<=x<21

18

21<=x<25

17

25<=x<29

14

29<=x<33

11

33<=x<37

7

37<=x<41

2

Итого

100

Вариант № 17.

Интервал значений

Частота

1,5<=x<4,5

1

4,5<=x<7,5

5

7,5<=x<10,5

8

10,5<=x<13,5

12

13,5<=x<16,5

16

16,5<=x<19,5

18

19,5<=x<22,5

15

22,5<=x<25,5

12

25,5<=x<28,5

9

28,5<=x<31,5

4

Итого

100

Вариант № 18.

Интервал значений

Частота

1<=x<3

4

3<=x<5

7

5<=x<7

11

7<=x<9

18

9<=x<11

20

11<=x<13

22

13<=x<15

19

15<=x<17

13

17<=x<19

10

19<=x<21

6

Итого

130

Вариант № 19.

Интервал значений

Частота

1<=x<3

4

3<=x<5

7

5<=x<7

11

7<=x<9

18

9<=x<11

20

11<=x<13

22

13<=x<15

19

15<=x<17

13

17<=x<19

10

19<=x<21

6

Итого

130

Вариант № 20.

Интервал значений

Частота

0,7<=x<1,2

3

1,2<=x<1,7

8

1,7<=x<2,2

13

2,2<=x<2,7

18

2,7<=x<3,2

23

3,2<=x<3,7

21

3,7<=x<4,2

16

4,2<=x<4,7

11

5,2<=x<5,7

7

Итого

120

Вариант № 21.

Интервал значений

Частота

11<=x<13

6

13<=x<15

10

15<=x<17

15

17<=x<19

19

19<=x<21

22

21<=x<23

23

23<=x<25

18

25<=x<27

13

27<=x<29

9

29<=x<31

5

Итого

140

Вариант № 22.

Интервал значений

Частота

1,2<=x<4,4

4

4,4<=x<7,6

7

7,6<=x<10,8

10

10,8<=x<14

14

14<=x<17,2

17

17,2<=x<20,4

18

20,4<=x<23,6

17

23,6<=x<26,8

14

26,8<=x<30

12

30<=x<33,2

7

Итого

120

Вариант № 23.

Интервал значений

Частота

3,0<=x<6,2

4

6,2<=x<9,4

3

9,4<=x<12,6

9

12,6<=x<15,8

17

15,8<=x<19,0

20

19,0<=x<22,2

23

22,2<=x<25,4

16

25,4<=x<28,6

7

28,6<=x<31,8

1

Итого

100

Вариант № 24.

Интервал значений

Частота

8,5<=x<11,0

2

11,0<=x<13,5

8

13,5<=x<16,0

13

16,0<=x<18,5

16

18,5<=x<21,0

26

21,0<=x<23,5

22

23,5<=x<26,0

19

26,0<=x<28,5

10

28,5<=x<31,0

4

Итого

120

Вариант № 25.

Интервал значений

Частота

1,7<=x<3,4

6

3,4<=x<5,1

8

5,1<=x<6,8

15

6,8<=x<8,5

23

8,5<=x<10,2

23

10,2<=x<11,9

19

11,9<=x<13,6

17

13,6<=x<15,3

11

15,3<=x<17,0

8

Итого

130

3. Дисперсионный анализ

Дисперсионный анализ используется в практике статистических исследований с целью выявления влияния на изучаемый показатель различных факторов, обычно не поддающихся количественному измерению. В качестве простого примера, приводящего к задаче дисперсионного анализа можно привести следующий пример. Пусть руководству некоторой торговой компании необходимо оценить эффективность работы ряда филиалов, расположенных в различных районах города. В данном случае требуется оценить влияние на реализацию продукции такого фактора, как расположение филиала. В целях упрощения будем считать, что в данных районах проживает одинаковое количество людей, средняя заработная плата одинакова, каждый филиал проводит одну и ту же маркетинговую политику и т. д. Иными словами мы говорим о том, что влияние всех остальных факторов в данном случае остается неизменным.

Сущность дисперсионного анализа состоит в разложении общей дисперсии результирующего показателя на части, которые обусловлены влиянием изучаемого фактора и всех остальных, не учитываемых факторов.

В зависимости от количества исследуемых факторов модели дисперсионного анализа принято подразделять на одно-, двух-, …, многофакторные.

Однофакторный дисперсионный анализ. В данном случае рассматривается простейший случай проверки влияния только одного фактора. Постановка задачи однофакторного дисперсионного анализа: пусть нами наблюдается независимых нормально распределенных случайных величин , , …, (возвращаясь к вышеописанному примеру, в качестве данных случайных величин рассматриваются объемы реализации соответственно в первом, втором, …, - ом филиале). Предполагается, что все они имеют одно и то же среднеквадратическое отклонение и в общем случае различные математические ожидания , , …, . Пусть над каждой из этих величин проводится серия из наблюдений, в результате которой для каждой из этих случайных величин получены следующие данные:

. (3.1)

Опираясь на эти данные необходимо проверить статистическую гипотезу:

, (3.2)

при альтернативной гипотезе:

. (3.3)

Если проверяемая гипотеза верна, то это будет говорить о том, что выбранный для исследования фактор не оказывает существенного влияния на результирующий показатель. В противном случае, если отвергается, то можно считать, влияние данного фактора установленным. Очевидно, что до проверки нулевой гипотезы (3.2) необходимо проверить гипотезу о равенстве среднеквадратических отклонений:

, (3.4)

при альтернативной гипотезе:

. 5 (3.5)

Для осуществления дальнейших выкладок данные, собранные в результате исследований, сведем в таблицу 3.1.

Таблица 3.1

Исходные данные для проведения дисперсионного анализа.

№ магазина

Объемы реализации

1

2

3

….

1

….

2

….

….

Введем следующие обозначения:

- среднее арифметическое из наблюдений над с.в. ;

- среднее арифметическое из наблюдений над с.в. ;

…………………………………………………………………………………..;

- среднее арифметическое из наблюдений над с.в. ;

- среднее арифметическое всей системы из наблюдений (общее среднее арифметическое).

Проверка гипотезы основывается на выполнении следующего соотношения, называемого основным тождеством дисперсионного анализа:

, (3.6)

т. е. равенстве суммы квадратов отклонений наблюдаемых значений от среднего арифметического по всей системе наблюдений двум слагаемым:

  • сумме квадратов отклонений групповых средних от общего среднего арифметического (первое слагаемое в (3.6));

  • сумме квадратов отклонений наблюдаемых значений от групповых средних (второе слагаемое в (3.6)).

Введем следующие обозначения:

; (3.7)

; (3.8)

. (3.9)

Тогда соотношение (3.6) можно переписать в следующем виде:

. (3.10)

Так как выражение (3.7) является показателем, характеризующим вариацию индивидуальных значений признака в исследуемой совокупности, то видно, что вся вариация может быть разложена на две составляющие. Составляющая – отражает влияние на формирование значений результирующего признака исследуемого фактора, составляющая – отражает влияние на формирование значений результирующего признака всех остальных неучтенных факторов.

Для выяснения значимости влияния выбранного фактора формирование значений результирующего признака рассчитывается величина (критерий Фишера):

, (3.11)

которая при выполнении предположений о нормальном распределении величин , …, будет подчиняться распределению Фишера с степенями свободы. Критические границы распределения Фишера приведены в приложении 3. Если расчетное значение величины больше критической границы распределения Фишера с степенями свободы при уровне значимости , т. е.:

, (3.12)

то говорят, что нулевая гипотеза (3.2) отвергается и считается, что исследуемый фактор существенно влияет на изменение значений результирующего показателя. Степень влияния исследуемого фактора определяется показателем, который называется коэффициентом детерминации и рассчитывается по следующей формуле:

. (3.13)

Значение данного показателя говорит о том, какая доля вариации (в процентах) результирующего показателя объясняется влиянием исследуемого фактора.

В случае не выполнения условия (3.12) гипотеза (3.2) принимается и считается, что влияние исследуемого фактора на изменение значений результирующего признака не значимо.

Рассмотрим в качестве примера следующую задачу. Пусть в четырех торговых точках применяются различные способы рекламирования одного и того же товара. Предполагается методами дисперсионного анализа на уровне значимости выяснить, существенно ли влияние такого фактора, как способ рекламы на изменение значений объемов реализации этого товара. Данные об объемах реализации товара (в денежном выражении по дням недели) приведены в таблице 3.2.

Таблица 3.2

Исходные данные для проведения дисперсионного анализа

Объемы реализации, т. руб.

Пн.

Вт.

Ср.

Чт.

Способ рекламы

1

14

15

14,8

15

2

14,4

14,9

14,9

15,5

3

14,2

15,2

14,6

15,4

4

14,5

15

14,7

15,2

Для проведения процедуры дисперсионного анализа составим вспомогательную таблицу 3.3, содержание которой понятно без дополнительных пояснений.

Таблица 3.3

Вспомогательная таблица для проведения однофакторного дисперсионного анализа

Объемы реализации, т. руб. (j)

Способ рекламы (i)

1

14

196

15

225

14,8

219

15

225

58,8

3457,4

865

2

14,4

207,4

14,9

222

14,9

222

15,5

240,3

59,7

3564,1

891,7

3

14,2

201,6

15,2

231

14,6

213,2

15,4

237,2

59,4

3528,4

883

4

14,5

210,3

15

225

14,7

216,1

15,2

231

59,4

3528,4

882,4

57,1

815,3

60,1

903

59

870,3

61,1

933,5

237,3

14078,3

3522,1

С использованием данных таблицы 3.3 и соотношения: определяем выборочные дисперсии в каждой - й группе:

; ; ; .

Проверим гипотезу о равенстве дисперсий (3.4). Для этого рассчитываем критерий Кочрена:

,

и сравниваем полученное значение со значением критической границы распределения Кочрена при (четыре выборки) и при ( - объем каждой из выборок) (Приложение 5). Т. к. то гипотезу о равенстве дисперсий в генеральной совокупности можно принять и приступать к проверке основной гипотезы дисперсионного анализа (3.2). Для этого рассчитаем компоненты , , . Для упрощения вычислений формулы (3.7 – 3.9) перепишем в следующем, более удобном виде:

; (3.14)

; (3.15)

. (3.16)

С учетом формул (3.14 – 3.16) и данных таблицы 3.3 имеем:

,

,

.

Проверкой убеждаемся, что соотношения (3.6, 3.10) выполняются, следовательно, все расчеты выполнены верно. По формуле (3.11) определим расчетное значение критерия Фишера:

.

По таблице приложения 4 найдем критическую границу распределения Фишера при (3; 12) степенях свободы и уровне значимости - . Так как соотношение (3.12) не выполняется и , то можно нулевую гипотезу (3.2) принять и считать, что выбранный для анализа фактор (способ рекламы) не оказывает статистически значимого влияния на формирование значений объемов реализации товара.

В случае, когда на формирование значений результирующего признака оказывают влияние два или более факторов, процедура дисперсионного анализа для оценки степени такого влияния аналогична рассмотренной и основана на разложении суммы квадратов отклонений наблюдаемых значений от общего среднего арифметического на компоненты, отражающие влияние выбранных для анализа факторов и компоненты, отражающие влияние всех остальных, неучтенных факторов.

Рассмотрим процедуру многофакторного дисперсионного анализа на примере двухфакторного анализа. Предположим, что в статистической совокупности, рассмотренной в предыдущем примере, изменения объемов продаж товара обусловлены влиянием двух факторов: различием способов рекламы (фактор А) и различиями между продавцами этого товара (фактор В). Предположим, что по признаку А результаты наблюдений могут разбиты на групп а по признаку В на групп. Таким образом, общее количество групп равно . Далее для простоты будем считать, что в каждой группе у нас находится по одному наблюдению и, следовательно, общее число наблюдений . Тогда данные наблюдений могут быть представлены в виде таблицы 3.4.

Таблица 3.4 - Общий вид таблицы исходных данных для проведения двухфакторного дисперсионного анализа

Группы наблюдений по фактору В,

1

2

3

.

Группы наблюдений по фактору А, i =1,…m

1

.

.

.

.

В таблице 3.4 обозначено:

; (3.17)

; (3.18)

. (3.19)

Основное тождество дисперсионного анализа в данном случае имеет вид:

. (3.20)

Введем обозначения:

; (3.21)

; (3.22)

; (3.23)

. (3.24)

Тогда выражение (3.20) можно переписать в более компактном виде:

(3.25)

В данном выражении величина представляет собой всю вариацию значений исследуемого признака, величина представляет долю вариации, обусловленную влиянием фактора А, величина представляет долю вариации, обусловленную влиянием фактора В, величина представляет долю вариации, обусловленную влиянием всех остальных неучтенных факторов.

Значимость влияния факторов А и B устанавливают рассчитывая следующие величины:

; (3.26)

. (3.27)

Величина подчиняется распределению Фишера с степенями свободы, величина подчиняется распределению Фишера с степенями свободы и, следовательно, если или больше критических границ соответствующих распределений при выбранном уровне значимости :

; (3.28)

, (3.29)

то гипотезу о равенстве центров распределений необходимо отвергнуть и считать, что соответствующий фактор значимо влияет на исследуемый признак6.

При выполнении соотношений (3.28) или (3.29) величины:

; (3.30)

(3.31)

показывают какая доля вариации исследуемого признака объясняется влиянием соответствующего фактора.

В качестве примера решим задачу, по данным задачи предыдущего пункта считая, что вариация значений объемов продаж обусловлена влиянием двух факторов: различиями в способе рекламирования товара и различиями между продавцами. Таблица для проведения дисперсионного анализа имеет следующий вид (таблица 3.5):

Таблица 3.5 - Вспомогательная таблица для проведения двухфакторного дисперсионного анализа ( - объемы реализации, тыс. рублей/день)

Продавцы (j)

фактор В

Способ рекламы (i)

фактор А

1

14

196

15

225

14,8

219

15

225

58,8

3457,4

865

2

14,4

207,4

14,9

222

14,9

222

15,5

240,3

59,7

3564,1

891,7

3

14,2

201,6

15,2

231

14,6

213,2

15,4

237,2

59,4

3528,4

883

4

14,5

210,3

15

225

14,7

216,1

15,2

231

59,4

3528,4

882,4

57,1

60,1

59

61,1

237,3

3260,4

3612,01

3481

3733,2

14078,3

14086,6

815,3

903

870,3

933,5

3522,1

С использованием данных таблицы 3.5 и соотношения: определяем выборочные дисперсии в каждой - й группе:

, , , .

Проверим гипотезу о равенстве дисперсий в группах по фактору В. Для этого рассчитываем критерий Кочрена:

,

и сравниваем полученное значение со значением критической границы распределения Кочрена (Приложение 5). Т. к. то гипотезу о равенстве дисперсий в генеральной совокупности можно принять и приступать к проверке основной гипотезы дисперсионного анализа. Рассчитаем значения сумм , , (значений суммы было рассчитано в предыдущем примере). Для практических расчетов формулы 3.22 – 3.24 можно переписать в следующем, более удобном для расчетов, виде:

; (3.32)

; (3.33)

. (3.34)

С учетом формул (3.32 – 3.34) и данных таблицы 9 имеем:

, ,

,

Основное тождество дисперсионного анализа (3.25) выполняется, следовательно, расчеты выполнены верно. По формулам (3.26 – 2.27) рассчитаем значения критерия Фишера:

,

По таблице приложения 4 найдем критическую границу распределения Фишера при (3; 9) степенях свободы и уровне значимости - . Т.к. соотношения (3.28) не выполняется, а соотношение (3.29) выполняется, то можно считать, что фактор В значимо влияет на исследуемый признак и влиянием данного фактора объясняется (3.31) вариации исследуемого признака. Иными словами, наиболее существенное влияние на объем реализации товара оказывают индивидуальные различия между продавцами.

Варианты индивидуальных заданий к теме "Дисперсионный анализ"

Для своего варианта исходных данных об объемах продаж в пяти магазинах, расположенных в различных районах города методами дисперсионного анализа оценить влияние на объем продаж таких факторов как расположение магазина и день недели. При проверке необходимых гипотез принимать уровень значимости равным: .

Исходные данные для выполнения задания №3

Вариант №1.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

40,000

42,000

41,000

39,000

44,000

37,000

51,000

2

35,000

46,000

50,000

39,000

46,000

48,000

34,000

3

37,000

47,000

42,000

47,000

48,000

48,000

50,000

4

49,000

52,000

40,000

46,000

45,000

38,000

47,000

5

43,000

55,000

44,000

51,000

49,000

43,000

37,000

Вариант №2.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

40,000

35,000

43,000

43,000

48,000

43,000

37,000

2

44,000

37,000

42,000

42,000

42,000

40,000

47,000

3

35,000

46,000

48,000

48,000

47,000

44,000

47,000

4

49,000

45,000

44,000

45,000

39,000

45,000

47,000

5

50,000

55,000

46,000

51,000

52,000

53,000

43,000

Вариант №3.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

41,000

41,000

35,000

36,000

45,000

39,000

42,000

2

42,000

39,000

39,000

44,000

37,000

46,000

45,000

3

40,000

43,000

38,000

33,000

49,000

41,000

46,000

4

47,000

46,000

41,000

41,000

44,000

40,000

41,000

5

55,000

48,000

42,000

48,000

42,000

41,000

47,000

Вариант №4.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

45,000

41,000

43,000

34,000

38,000

39,000

34,000

2

35,000

47,000

42,000

39,000

46,000

43,000

37,000

3

51,000

45,000

51,000

50,000

41,000

38,000

44,000

4

44,000

42,000

48,000

53,000

43,000

42,000

45,000

5

51,000

44,000

42,000

47,000

48,000

50,000

45,000

Вариант №5.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

39,000

38,000

40,000

48,000

37,000

33,000

42,000

2

37,000

42,000

39,000

45,000

45,000

41,000

32,000

3

45,000

52,000

49,000

36,000

44,000

41,000

39,000

4

40,000

47,000

44,000

46,000

44,000

44,000

48,000

5

52,000

59,000

41,000

43,000

53,000

46,000

41,000

Вариант №6.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

53,000

66,000

57,000

70,000

55,000

69,000

47,000

2

41,000

50,000

64,000

41,000

58,000

46,000

58,000

3

43,000

55,000

34,000

49,000

59,000

51,000

66,000

4

50,000

33,000

44,000

67,000

55,000

60,000

65,000

5

37,000

52,000

51,000

48,000

56,000

73,000

58,000

Вариант №7.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

62,000

43,000

50,000

42,000

56,000

47,000

55,000

2

59,000

51,000

61,000

75,000

57,000

52,000

61,000

3

55,000

43,000

59,000

54,000

51,000

67,000

73,000

4

51,000

57,000

48,000

63,000

32,000

66,000

58,000

5

61,000

70,000

55,000

57,000

45,000

41,000

51,000

Вариант №8.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

53,000

45,000

37,000

61,000

43,000

50,000

50,000

2

50,000

56,000

49,000

35,000

42,000

54,000

39,000

3

51,000

45,000

42,000

44,000

50,000

56,000

53,000

4

67,000

54,000

41,000

56,000

57,000

59,000

61,000

5

71,000

53,000

61,000

58,000

52,000

79,000

55,000

Вариант №9.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

36,000

68,000

53,000

39,000

56,000

63,000

41,000

2

53,000

51,000

40,000

64,000

52,000

57,000

45,000

3

47,000

57,000

55,000

72,000

51,000

76,000

69,000

4

37,000

39,000

50,000

54,000

56,000

64,000

49,000

5

51,000

56,000

58,000

61,000

69,000

64,000

40,000

Вариант №10.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

57,000

58,000

56,000

63,000

53,000

43,000

49,000

2

28,000

57,000

53,000

46,000

45,000

41,000

52,000

3

58,000

51,000

49,000

54,000

52,000

44,000

67,000

4

60,000

69,000

51,000

45,000

64,000

56,000

48,000

5

57,000

38,000

69,000

48,000

51,000

71,000

49,000

Вариант № 11

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

35,000

46,000

50,000

39,000

46,000

48,000

34,000

2

37,000

47,000

42,000

47,000

48,000

48,000

50,000

3

44,000

37,000

42,000

42,000

42,000

40,000

47,000

4

49,000

52,000

40,000

46,000

45,000

38,000

47,000

5

43,000

55,000

44,000

51,000

49,000

43,000

37,000

Вариант № 12.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

40,000

35,000

43,000

43,000

48,000

43,000

37,000

2

44,000

37,000

42,000

42,000

42,000

40,000

47,000

3

43,000

55,000

44,000

51,000

49,000

43,000

37,000

4

49,000

45,000

44,000

45,000

39,000

45,000

47,000

5

50,000

55,000

46,000

51,000

52,000

53,000

43,000

Вариант № 13.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

40,000

35,000

43,000

43,000

48,000

43,000

37,000

2

44,000

37,000

42,000

42,000

42,000

40,000

47,000

3

42,000

39,000

39,000

44,000

37,000

46,000

45,000

4

49,000

45,000

44,000

45,000

39,000

45,000

47,000

5

47,000

46,000

41,000

41,000

44,000

40,000

41,000

Вариант № 14.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

45,000

41,000

43,000

34,000

38,000

39,000

34,000

2

42,000

39,000

39,000

44,000

37,000

46,000

45,000

3

44,000

42,000

48,000

53,000

43,000

42,000

45,000

4

47,000

46,000

41,000

41,000

44,000

40,000

41,000

5

51,000

44,000

42,000

47,000

48,000

50,000

45,000

Вариант № 15.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

37,000

42,000

39,000

45,000

45,000

41,000

32,000

2

35,000

47,000

42,000

39,000

46,000

43,000

37,000

3

52,000

59,000

41,000

43,000

53,000

46,000

41,000

4

44,000

42,000

48,000

53,000

43,000

42,000

45,000

5

45,000

52,000

49,000

36,000

44,000

41,000

39,000

Вариант № 16.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

39,000

38,000

40,000

48,000

37,000

33,000

42,000

2

37,000

52,000

51,000

48,000

56,000

73,000

58,000

3

45,000

52,000

49,000

36,000

44,000

41,000

39,000

4

43,000

55,000

34,000

49,000

59,000

51,000

66,000

5

52,000

59,000

41,000

43,000

53,000

46,000

41,000

Вариант № 17.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

53,000

66,000

57,000

70,000

55,000

69,000

47,000

2

55,000

43,000

59,000

54,000

51,000

67,000

73,000

3

43,000

55,000

34,000

49,000

59,000

51,000

66,000

4

50,000

33,000

44,000

67,000

55,000

60,000

65,000

5

62,000

43,000

50,000

42,000

56,000

47,000

55,000

Вариант № 18.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

62,000

43,000

50,000

42,000

56,000

47,000

55,000

2

53,000

45,000

37,000

61,000

43,000

50,000

50,000

3

55,000

43,000

59,000

54,000

51,000

67,000

73,000

4

67,000

54,000

41,000

56,000

57,000

59,000

61,000

5

61,000

70,000

55,000

57,000

45,000

41,000

51,000

Вариант № 19.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

37,000

39,000

50,000

54,000

56,000

64,000

49,000

2

50,000

56,000

49,000

35,000

42,000

54,000

39,000

3

51,000

45,000

42,000

44,000

50,000

56,000

53,000

4

47,000

57,000

55,000

72,000

51,000

76,000

69,000

5

53,000

51,000

40,000

64,000

52,000

57,000

45,000

Вариант № 20.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

36,000

68,000

53,000

39,000

56,000

63,000

41,000

2

57,000

58,000

56,000

63,000

53,000

43,000

49,000

3

47,000

57,000

55,000

72,000

51,000

76,000

69,000

4

37,000

39,000

50,000

54,000

56,000

64,000

49,000

5

28,000

57,000

53,000

46,000

45,000

41,000

52,000

Вариант № 21.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

37,000

47,000

42,000

47,000

48,000

48,000

50,000

2

28,000

57,000

53,000

46,000

45,000

41,000

52,000

3

43,000

55,000

44,000

51,000

49,000

43,000

37,000

4

49,000

52,000

40,000

46,000

45,000

38,000

47,000

5

57,000

38,000

69,000

48,000

51,000

71,000

49,000

Вариант № 22

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

40,000

35,000

43,000

43,000

48,000

43,000

37,000

2

37,000

47,000

42,000

47,000

48,000

48,000

50,000

3

43,000

55,000

44,000

51,000

49,000

43,000

37,000

4

50,000

55,000

46,000

51,000

52,000

53,000

43,000

5

36,000

68,000

53,000

39,000

56,000

63,000

41,000

Вариант № 23.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

47,000

46,000

41,000

41,000

44,000

40,000

41,000

2

44,000

37,000

42,000

42,000

42,000

40,000

47,000

3

43,000

55,000

44,000

51,000

49,000

43,000

37,000

4

42,000

39,000

39,000

44,000

37,000

46,000

45,000

5

37,000

47,000

42,000

47,000

48,000

48,000

50,000

Вариант № 24.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

40,000

35,000

43,000

43,000

48,000

43,000

37,000

2

44,000

37,000

42,000

42,000

42,000

40,000

47,000

3

51,000

44,000

42,000

47,000

48,000

50,000

45,000

4

49,000

45,000

44,000

45,000

39,000

45,000

47,000

5

45,000

41,000

43,000

34,000

38,000

39,000

34,000

Вариант № 25.

Номер магазина

Объем продаж по дням недели, тыс. руб.

Пон.

Вт.

Ср.

Чт.

Пт.

Суб.

Вс.

1

52,000

59,000

41,000

43,000

53,000

46,000

41,000

2

37,000

42,000

39,000

45,000

45,000

41,000

32,000

3

44,000

42,000

48,000

53,000

43,000

42,000

45,000

4

47,000

46,000

41,000

41,000

44,000

40,000

41,000

5

43,000

55,000

34,000

49,000

59,000

51,000

66,000

4. Анализ Парной корреляции

Анализ парной корреляции проводят, используя методы корреляционного и регрессионного анализа. Корреляционный и регрессионный анализ являются смежными разделами статистики и предназначены для изучения по выборочным данным статистической связи между различными случайными величинами.

В общем случае между какими-либо величинами принято выделять два типа связей:

  • функциональные или детерминированные связи – когда каждой комбинации значений независимых переменных (факторных признаков) поставлено в соответствие единственное значение зависимой переменной (результирующего признака). Примером такой связи может являться зависимость размера заработной платы от выработки при сдельной форме оплаты труда;

  • статистические (корреляционные7 или стохастические) связи – когда каждой комбинации значений факторных признаков могут соответствовать различные значений результирующего признака и наоборот, одному значению результирующего признака могут соответствовать различные комбинации значений факторных признаков.

В случае корреляционной связи говорят, что при изменении значений факторных признаков результирующий признак реагирует изменением своего закона распределения.

При исследовании корреляционных связей необходимо решать следующие задачи:

  • установление факта наличия корреляционной связи, определение ее формы;

  • количественная характеристика степени (силы) связи;

  • формализация (построение математической модели) корреляционной связи методами регрессионного анализа;

  • оценка адекватности построенной модели и ее использование для решения задачи научного обоснования прогноза изменений результирующего признака при изменении значений факторных признаков.

Ниже рассматривается процедура решения описанных задач на примере анализа корреляционной связи для случая двух переменных (анализ парной корреляции). В таблице 4.1 приведены статистические данные о величине личного располагаемого дохода (факторный признак - ) и величине потребительского расхода на оплату медицинских услуг (результирующий признак - ) в США в период с 1964 по 1983 гг.8 Все данные приведены в миллиардах долларов США. Анализ парной корреляции по выборочным данным обычно начинают с графического изображения данных с помощью корреляционного поля (рисунок 4.1). Корреляционное поле представляет собой диаграмму, на которой отмечены точки с координатами . При построении корреляционного поля единицы измерения оси абсцисс и оси ординат желательно выбирать таким образом, чтобы диаграмма имела вид квадрата.

Вытянутость облака точек вдоль одной из диагоналей квадрата позволит предположить наличие корреляционной связи. В рассматриваемом примере облако точек расположено вдоль диагонали, проходящей из левого нижнего в правый верхний угол диаграммы. Данный факт позволяет предположить, что между величиной личного дохода и величиной факторного расхода существует прямая корреляционная связь.

Такой же вывод может быть сделан на основе анализа корреляционной таблицы 4.2, построенной путем группирования исходных данных по четырем интервалам значений по и четырем интервалам значений по .

Таблица 4.1

Исходные данные для проведения корреляционно-регрессионного анализа

Год

Личный доход -

Расходы на мед. услуги -

Год

Личный доход -

Расходы на мед. услуги -

1964

658,0

11,9

1974

1004,8

17,6

1965

700,4

12,1

1975

1010,8

17,9

1966

740,6

12,1

1976

1056,2

18,0

1967

774,4

12,5

1977

1105,4

19,2

1968

816,2

12,8

1978

1162,3

18,6

1969

853,5

13,6

1979

1200,7

20,1

1970

876,8

14,4

1980

1209,5

21,5

1971

900,0

14,8

1981

1248,6

22,0

1972

951,4

15,7

1982

1254,4

22,4

1973

1007,9

16,9

1983

1284,6

23,3

Количество групп k приближенно можно определить исходя из объема наблюдений. При можно принять от 4 до 6 групп, при – от 6 до 8 групп. Ширина интервалов по и при этом определяется из соотношений , , где и - размах вариации значений и соответственно. Для данных, представленных в таблице 4.1, и , , (округления проведены в большую сторону с точностью до ).

Рисунок 4.1 Корреляционное поле значений

Таблица 4.2

Корреляционная таблица

Группы по

658 – 814,7

(736,35)

814,7 – 971,4

(893,05)

971,4 – 1128,1

(1049,75)

1128,1 – 1284,8

(1206,45)

Группы по y

11,9 – 14,8

4

3

-

-

14,8 – 17,7

-

2

2

-

17,7 – 20,6

-

-

3

2

20,6 – 23,5

-

-

-

4

12,15

14,26

17,92

21,32

4

5

5

6

Отложим на корреляционном поле значения групповых средних при значениях факторного признака, соответствующих серединам интервалов по (в корреляционной таблице указаны в скобках) и соединим данные точки отрезками прямых. Полученная ломанная называется эмпирической линией регрессии переменной на переменную . Эмпирическая линия регрессии по своему виду близка к прямой линии, что также позволяет выдвинуть предположение о наличии прямой корреляционной связи между переменной и переменной .

Проверку сделанных предположений проводят, осуществляя процедуры:

  • расчета выборочного коэффициента корреляции;

  • проверки статистической гипотезы о равенстве выборочного коэффициента корреляции нулю;

  • построения доверительных интервалов для коэффициента корреляции в генеральной совокупности значений и .

Выборочный коэффициент корреляции рассчитывается по следующей формуле:

, (4.1)

где и средние арифметические значения факторного и результирующего признака соответственно. Коэффициент корреляции обладает следующими свойствами:

  • может принимать любые значения в интервале

  • коэффициент корреляции может быть равен только в том случае, если между факторной и результирующей переменной существует функциональная связь;

  • если между переменными не наблюдается статистической связи, то коэффициент корреляции равен нулю.

Из вышесказанного следует, что чем ближе значение к , тем вероятнее наличие корреляционной связи между факторным и результирующим признаком.

Значимость корреляционной связи оценивают, проверяя статистическую гипотезу при альтернативной гипотезе на заранее выбранном уровне значимости . Критерием для принятия нулевой гипотезы является выполнение следующего условия:

, (4.2)

где критическая точка распределения Стьюдента с степенями свободы при уровнем значимости (Приложение). В случае если нулевая гипотеза отвергается и считается, что коэффициент корреляции значимо отличается от нуля, то для коэффициента корреляции в генеральной совокупности значений факторного и результирующего признака указывается доверительный интервал с уровнем доверительной вероятности :

. (4.3)

Проведем расчет указанных величин по данным рассматриваемого примера. Для проведения расчета составим и заполним вспомогательную таблицу 4.3, выполняя следующие действия:

  • в столбцы 1, 2 заносим значения факторного признака и результирующего признака ;

  • определяем среднее арифметическое значений факторного признака - (сумма значений столбца 2, деленная на общее количество значений):

;

  • определяем среднее арифметическое значений результирующего признака - (сумма значений столбца 3, деленная на общее количество значений):

.

  • используя значения и , последовательно заполняем столбцы 4 – 8 .

Рассчитываем значение выборочного коэффициента корреляции между величинами и (сумма значений столбца 8, деленная на квадратный корень из произведения сумм значений столбцов 6 и 7):

.

Значение коэффициента корреляции очень близко к +1, что указывает на наличие очень тесной линейной связи между исследуемыми переменными.

Проверим гипотезу о значимости коэффициента корреляции. Выберем уровень значимости и рассчитаем значение величины (4.2):

.

По таблице значений критических точек распределения Стьюдента (Приложение 2) при 18 степенях свободы и уровне значимости находим значение . Условие (4.2) не выполняется, следовательно рассчитанное значение коэффициента корреляции не может быть объяснено только случайными причинами и связь необходимо признать значимой.

Рассчитаем - й доверительный интервал для коэффициента корреляции в генеральной совокупности значений факторного и результирующего признаков (4.3):

.

Таким образом, интервал 0,966 – 0,999 с вероятностью 95% содержит в себе значение коэффициента корреляции в генеральной совокупности значений факторного и результирующего признака.

Таблица 4.3 - Вспомогательная таблица для расчета коэффициента корреляции

x

y

1

2

3

4

5

6

7

8

1

658,0

11,9

-332,825

-4,97

110772,5

24,7009

1654,14

2

700,4

12,1

-290,425

-4,77

84346,68

22,7529

1385,327

3

740,6

12,1

-250,225

-4,77

62612,55

22,7529

1193,573

4

774,4

12,5

-216,425

-4,37

46839,78

19,0969

945,7773

5

816,2

12,8

-174,625

-4,07

30493,89

16,5649

710,7238

6

853,5

13,6

-137,325

-3,27

18858,16

10,6929

449,0528

7

876,8

14,4

-114,03

-2,47

13001,7

6,1009

281,6418

8

900,0

14,8

-90,825

-2,07

8249,181

4,2849

188,0078

9

951,4

15,7

-39,425

-1,17

1554,331

1,3689

46,12725

10

1007,9

16,9

17,075

0,03

291,5556

0,0009

0,51225

11

1004,8

17,6

13,975

0,73

195,3006

0,5329

10,20175

12

1010,8

17,9

19,975

1,03

399,0006

1,0609

20,57425

13

1056,2

18,0

65,375

1,13

4273,891

1,2769

73,87375

14

1105,4

19,2

114,575

2,33

13127,43

5,4289

266,9598

15

1162,3

18,6

171,475

1,73

29403,68

2,9929

296,6518

16

1200,7

20,1

209,875

3,23

44047,52

10,4329

677,8963

17

1209,5

21,5

218,675

4,63

47818,76

21,4369

1012,465

18

1248,6

22,0

257,775

5,13

66447,95

26,3169

1322,386

19

1254,4

22,4

263,575

5,53

69471,78

30,5809

1457,57

20

1284,6

23,3

293,775

6,43

86303,75

41,3449

1888,973

19816,5

337,4

738509,4

269,722

13882,44

После установления факта наличия линейной корреляционной связи осуществляют процедуру регрессионного анализа, сущность которого заключается в построении уравнения, характеризующего закон изменения значений условных средних , , …, при изменении значений факторных переменных. В случае парной корреляции, если методами корреляционного анализа установлено, что между факторной и результирующей переменной существует линейная связь, то закон изменения условных средних ищется в виде следующего уравнения (уравнения парной линейной регрессии):

, (4.4)

где и неизвестные параметры, значения которых определяются по данным, полученным в результате наблюдений (т.е. по данным таблицы 4.1). Для определения параметров и наиболее часто используется метод наименьших квадратов, сущность которого заключается в минимизации суммы квадратов отклонений наблюдаемых значений от значений, рассчитанных по формуле (3.4). Данная сумма как функция неизвестных параметров и имеет следующий вид:

. (4.5)

Для минимизации данной функции необходимо взять частные производные данной функции по параметрам и и приравнять их к нулю в точке ( ):

;

.

После преобразований получаем систему из двух уравнений с двумя неизвестными:

. (4.6)

Из первого уравнения данной системы получаем:

. (4.7)

Откуда видно, что искомое уравнение проходит через точку с координатами ( ). Подставляя полученное выражение для во второе уравнение системы (4.6) имеем:

. (4.8)

Выражение (4.8) имеет смысл только в том случае, если его знаменатель не равен нулю. Т.к. знаменатель представляет собой не что иное, как выражение для дисперсии факторного признака , то можно сделать следующий важный вывод: уравнение линейной регрессии не может быть построено, если значение выборочной дисперсии факторной переменной равно нулю.

Таким образом, уравнение линейной регрессии после определения значений параметров и приобретает вид:

. (4.9)

Разность фактических и расчетных значений результирующей переменной:

, (4.10)

при определенном называется остатком или случайной составляющей в - м наблюдении. При проведении регрессионного анализа предполагается, что случайная составляющая в каждом из -х наблюдений подчиняется нормальному закону распределения с параметрами и .

Оценку дисперсии случайной составляющей рассчитывают по следующей формуле:

. (4.11)

Т. к. параметры уравнения регрессии и оцениваются по выборочным данным, то очевидно, данные значения сами по себе являются случайными величинами, поэтому необходимо проводить оценку значимости данных параметров и указывать доверительные интервалы для значений данных параметров в генеральной совокупности значений факторного и результирующего признака.

Значимость параметров регрессии обычно оценивают, проверяя статистические гипотезы и при альтернативных гипотезах и с использованием следующих соотношений ( критериев):

, . (4.12)

, , (4.13)

распределенных по закону Стьюдента с степенями свободы. Критерием принятия соответствующей нулевой гипотезы является выполнение условий:

; (4.14)

, (4.15)

где - критическая точка распределения Стьюдента с степенями свободы, соответствующая уровню значимости . При невыполнении какого-либо из соотношений (4.14 – 4.15) соответствующий параметр признается незначимым. В случае значимости параметров и для их значений в генеральной совокупности значений факторной и результирующей переменной указываются доверительные интервалы с уровнем доверия в следующем виде:

  • для параметра :

; (4.16)

. (4.17)

В качестве показателя, характеризующего качество разработанной модели в целом, используется коэффициент детерминации , равный:

(4.18)

который показывает, какая доля вариации значений результирующего признака объясняется влиянием факторного признака. Коэффициент детерминации изменяется от нуля до единицы, и чем ближе его значение к единице, тем лучше модель описывает результаты наблюдений.

Основной целью разработки регрессионных моделей является оценка уровня возможных изменений результирующего признака при изменении значений факторного признака, т. е. научно обоснованное прогнозирование развития изучаемого явления. При известном значении факторного признака прогноз значений результирующего признака "в среднем" осуществляется подстановкой данного значения в полученное уравнение регрессии:

. (4.19)

Кроме того, с вероятностью может быть дан интервальный прогноз величины :

, (4.20)

Разработаем уравнение линейной регрессии расходов на медицинские услуги на величину личного дохода по данным рассматриваемого примера. Для проведения расчетов сформируем вспомогательную таблицу 4.4. Используя данные столбцов 2–5 определяем значения параметров уравнения линейной регрессии и :

;

.

Таким образом, уравнение линейной регрессии затрат на медицинские услуги на величину личных доходов приобретает вид:

.

С использованием полученного уравнения последовательно рассчитаем значения , , и заполним столбцы 6 – 8 таблицы 4.4.

С использованием суммы столбца 8 рассчитаем оценку дисперсии случайной составляющей:

.

Таблица 4.4.

Вспомогательная таблица для разработки уравнения линейной регрессии

x

y

x2

xy

e

E2

1

658,0

11,9

432964

7830,2

10,62

-1,28

1,65

10,28809

10,94271

2

700,4

12,1

490560,2

8474,84

11,41

-0,69

0,47

11,08525

11,73979

3

740,6

12,1

548488,4

8961,26

12,17

0,07

0,005

11,84105

12,49551

4

774,4

12,5

599695,4

9680

12,80

0,30

0,09

12,47651

13,13093

5

816,2

12,8

666182,4

10447,36

13,59

0,79

0,62

13,26238

13,91674

6

853,5

13,6

728462,3

11607,6

14,29

0,70

0,48

13,96363

14,61797

7

876,8

14,4

768778,2

12625,92

14,73

0,33

0,11

14,40168

15,056

8

900,0

14,8

810000

13320

15,17

0,37

0,13

14,83785

15,49215

9

951,4

15,7

905162

14936,98

16,13

0,43

0,19

15,80418

16,45846

10

1007,9

16,9

1015862

17033,51

17,19

0,29

0,09

16,86638

17,52066

11

1004,8

17,6

1009623

17684,48

17,14

-0,46

0,22

16,8081

17,46238

12

1010,8

17,9

1021717

18093,32

17,25

-0,65

0,43

16,9209

17,57518

13

1056,2

18,0

1115558

19011,6

18,10

0,10

0,01

17,77442

18,4287

14

1105,4

19,2

1221909

21223,68

19,03

-0,17

0,03

18,69936

19,35368

15

1162,3

18,6

1350941

21618,78

20,10

1,50

2,24

19,76906

20,42342

16

1200,7

20,1

1441680

24134,07

20,82

0,72

0,52

20,49095

21,14537

17

1209,5

21,5

1462890

26004,25

20,98

-0,52

0,27

20,65639

21,31081

18

1248,6

22,0

1559002

27469,2

21,72

-0,28

0,08

21,39144

22,04592

19

1254,4

22,4

1573519

28098,56

21,83

-0,57

0,33

21,50047

22,15497

20

1284,6

23,3

1650197

29931,18

22,40

-0,90

0,82

22,06821

22,72275

19816,5

337,4

20373193

348186,8

337,45

0,05

8,76

10,28809

10,94271

Проверим значимость параметров регрессии. Выберем уровень значимости и рассчитаем значения критериев (4.12, 4.13) (при расчетах значение взято из столбца 6 таблицы 4.3):

;

.

Оба значения существенно больше критической точки распределения Стьюдента и, следовательно, нулевая гипотеза отвергается, и параметры уравнения регрессии необходимо считать значимыми.

Доверительные интервалы для параметров регрессии во всей генеральной совокупности значений факторного и результативного признака с уровнем доверительной вероятности 0,95 рассчитываем по формулам (4.16 – 4.17):

;

;

;

.

Таким образом, указанные интервалы с вероятностью 0,9 будут содержать в себе истинные значения параметров линейной регрессии.

Оценим качество модели с помощью коэффициента детерминации (4.18) (при расчетах значение величины взято из столбца 7 таблицы 4.3):

.

Таким образом, 97% вариации значений расходов на медицинские услуги обусловлены влиянием объема личного дохода.

Предположим, что в 1984 предполагается изменение совокупного личного дохода граждан до 1350 млрд. $. Дадим прогноз расходов на медицинские услуги с использованием разработанной модели. Значение расходов "в среднем" составит (4.19):

,

а истинное значение расходов будет содержаться в 95% - м доверительном интервале (3.20):

.

Таким образом, с вероятностью 0,95 указанный интервал будет содержать в себе истинное значение расходов на медицинские услуги. Аналогичным образом рассчитываем доверительные интервалы для всех значений и заполняем столбцы 9, 10 таблицы 4.4. Результаты расчетов представлены на рисунке 4.2

Рисунок 4.2 График регрессионной зависимости расходов на медицинское обслуживание от величины личного дохода.

Индивидуальные задания к теме "Анализ парной корреляции"

На стр. 64 – 70 приведены данные о функционировании ряда экономических систем за период в 15 лет. В качестве данных представлены: L - затраты на фактор труда; K - затраты на фактор капитала; Y - произведенный продукт. Каждая из переменных, приведена в млрд. долл. США.

Для своего варианта исходных данных:

  • провести анализ парной корреляции между величиной производительности труда ( - результирующая переменная) и его фондовооруженности ( - факторная переменная);

  • построить уравнение линейной регрессии производительности труда на величину его фондовооруженности - ;

  • провести анализ адекватности полученной модели;

  • представить соответствующие графики.

Примечание: при проверке гипотез о значимости коэффициента корреляции, значимости коэффициентов регрессии и построении доверительных интервалов для перечисленных коэффициентов принимать доверительную вероятность равной .

Вариант 1

t

Y

K

L

1

2.27

112.5

48

2

1.94

116.4

42.1

3

2.32

111.6

42.3

4

2.49

108.9

43.7

5

2.57

116.5

42.8

6

2.01

104.5

41.8

7

1.87

102.7

30.0

8

2.39

110.2

44.4

9

2.18

104.7

51.2

10

2.17

109.4

54.6

11

1.80

101.1

57.4

12

2.36

102.6

53.2

13

2.50

128.5

57.6

14

2.27

122.5

58.3

15

2.23

105.2

55.7

Вариант 3

t

Y

K

L

1

15.16

32.10

24.56

2

16.70

31.00

23.70

3

15.44

32.40

23.78

4

15.65

33.20

24.10

5

13.13

31.20

24.00

6

14.22

34.80

23.67

7

16.73

35.40

24.90

8

17.80

33.00

32.75

9

16.88

34.80

26.24

10

15.67

33.30

25.37

11

15.99

36.10

25.66

12

14.33

38.30

24.34

13

15.77

30.60

22.10

14

15.28

32.10

20.57

15

17.04

37.60

24.61

Вариант 2

t

Y

K

L

1

2.27

48

2.12

2

1.94

42.1

2.20

3

2.32

42.3

2.11

4

2.49

43.7

2.03

5

2.57

42.8

2.21

6

2.01

41.8

1.88

7

1.87

30.0

1.91

8

2.39

44.4

2.00

9

2.18

51.2

1.90

10

2.17

54.6

1.99

11

1.80

57.4

1.54

12

2.36

53.2

1.74

13

2.50

57.6

2.23

14

2.27

58.3

2.14

15

2.23

55.7

1.87

Вариант 4

t

Y

K

L

1

48

2.27

112.5

2

42.1

1.94

116.4

3

42.3

2.32

111.6

4

43.7

2.49

108.9

5

42.8

2.57

116.5

6

41.8

2.01

104.5

7

30.0

1.87

102.7

8

44.4

2.39

110.2

9

51.2

2.18

104.7

10

54.6

2.17

109.4

11

57.4

1.80

101.1

12

53.2

2.36

102.6

13

57.6

2.50

128.5

14

58.3

2.27

122.5

15

55.7

2.23

105.2

Вариант 5

t

Y

K

L

1

3.45

2.27

48

2

3.48

1.94

42.1

3

3.06

2.32

42.3

4

3.66

2.49

43.7

5

3.79

2.57

42.8

6

3.85

2.01

41.8

7

3.44

1.87

30.0

8

4.08

2.39

44.4

9

4.50

2.18

51.2

10

4.31

2.17

54.6

11

3.57

1.80

57.4

12

3.55

2.36

53.2

13

4.61

2.50

57.6

14

3.99

2.27

58.3

15

4.78

2.23

55.7

Вариант 7

t

Y

K

L

1

3.45

112.5

2.12

2

3.48

116.4

2.20

3

3.06

111.6

2.11

4

3.66

108.9

2.03

5

3.79

116.5

2.21

6

3.85

104.5

1.88

7

3.44

102.7

1.91

8

4.08

110.2

2.00

9

4.50

104.7

1.90

10

4.31

109.4

1.99

11

3.57

101.1

1.54

12

3.55

102.6

1.74

13

4.61

128.5

2.23

14

3.99

122.5

2.14

15

4.78

105.2

1.87

Вариант 6

t

Y

K

L

1

15.16

2.12

32.10

2

16.70

2.20

31.00

3

15.44

2.11

32.40

4

15.65

2.03

33.20

5

13.13

2.21

31.20

6

14.22

1.88

34.80

7

16.73

1.91

35.40

8

17.80

2.00

33.00

9

16.88

1.90

34.80

10

15.67

1.99

33.30

11

15.99

1.54

36.10

12

14.33

1.74

38.30

13

15.77

2.23

30.60

14

15.28

2.14

32.10

15

17.04

1.87

37.60

Вариант 8

t

Y

K

L

1

3.45

48

112.5

2

3.48

42.1

116.4

3

3.06

42.3

111.6

4

3.66

43.7

108.9

5

3.79

42.8

116.5

6

3.85

41.8

104.5

7

3.44

30.0

102.7

8

4.08

44.4

110.2

9

4.50

51.2

104.7

10

4.31

54.6

109.4

11

3.57

57.4

101.1

12

3.55

53.2

102.6

13

4.61

57.6

128.5

14

3.99

58.3

122.5

15

4.78

55.7

105.2

Вариант 9

t

Y

K

L

1

112.5

2.27

2.12

2

116.4

1.94

2.20

3

111.6

2.32

2.11

4

108.9

2.49

2.03

5

116.5

2.57

2.21

6

104.5

2.01

1.88

7

102.7

1.87

1.91

8

110.2

2.39

2.00

9

104.7

2.18

1.90

10

109.4

2.17

1.99

11

101.1

1.80

1.54

12

102.6

2.36

1.74

13

128.5

2.50

2.23

14

122.5

2.27

2.14

15

105.2

2.23

1.87

Вариант 11

t

Y

K

L

1

0.257

0.215

0.703

2

0.285

0.236

0.730

3

0.313

0.258

0.755

4

0.344

0.282

0.781

5

0.381

0.310

0.808

6

0.422

0.343

0.820

7

0.464

0.380

0.818

8

0.510

0.422

0.825

9

0.558

0.467

0.849

10

0.607

0.516

0.867

11

0.657

0.571

0.866

12

0.707

0.630

0.863

13

0.758

0.695

0.877

14

0.809

0.765

0.903

15

0.866

0.840

0.937

Вариант 10

t

Y

K

L

1

3.45

32.10

24.56

2

3.48

31.00

23.70

3

3.06

32.40

23.78

4

3.66

33.20

24.10

5

3.79

31.20

24.00

6

3.85

34.80

23.67

7

3.44

35.40

24.90

8

4.08

33.00

32.75

9

4.50

34.80

26.24

10

4.31

33.30

25.37

11

3.57

36.10

25.66

12

3.55

38.30

24.34

13

4.61

30.60

22.10

14

3.99

32.10

20.57

15

4.78

37.60

24.61

Вариант 12

t

Y

K

L

1

3.45

2.12

32.10

2

3.48

2.20

31.00

3

3.06

2.11

32.40

4

3.66

2.03

33.20

5

3.79

2.21

31.20

6

3.85

1.88

34.80

7

3.44

1.91

35.40

8

4.08

2.00

33.00

9

4.50

1.90

34.80

10

4.31

1.99

33.30

11

3.57

1.54

36.10

12

3.55

1.74

38.30

13

4.61

2.23

30.60

14

3.99

2.14

32.10

15

4.78

1.87

37.60

Вариант 13

t

Y

K

L

1

112.5

3.45

2.12

2

116.4

3.48

2.20

3

111.6

3.06

2.11

4

108.9

3.66

2.03

5

116.5

3.79

2.21

6

104.5

3.85

1.88

7

102.7

3.44

1.91

8

110.2

4.08

2.00

9

104.7

4.50

1.90

10

109.4

4.31

1.99

11

101.1

3.57

1.54

12

102.6

3.55

1.74

13

128.5

4.61

2.23

14

122.5

3.99

2.14

15

105.2

4.78

1.87

Вариант 15

t

Y

K

L

1

43.08

30.57

61.39

2

46.57

34.20

64.77

3

50.10

37.93

68.68

4

53.50

41.56

72.65

5

56.44

45.33

75.67

6

59.70

49.72

78.33

7

64.12

54.64

81.48

8

69.10

60.69

85.03

9

74.61

68.60

88.30

10

80.91

77.70

91.30

11

86.91

86.09

94.35

12

92.73

93.18

97.31

13

99.33

100.21

100.08

14

105.28

108.08

102.83

15

111.22

116.78

105.51

Вариант 14

t

Y

K

L

1

118.76

125.98

108.09

2

125.83

135.58

110.67

3

132.23

145.87

113.19

4

139.13

156.74

115.58

5

146.11

167.90

117.96

6

152.39

179.54

120.35

7

158.09

191.58

122.59

8

165.07

203.91

124.61

9

174.64

216.78

126.31

10

185.57

230.43

127.64

11

195.15

244.87

128.66

12

201.99

259.66

129.57

13

206.68

274.29

130.52

14

210.69

288.82

131.21

15

215.93

303.47

131.07

Вариант 16

t

Y

K

L

1

201.60

3.45

10.11

2

202.00

3.48

13.65

3

202.60

3.06

13.75

4

201.80

3.66

11.64

5

203.30

3.79

12.87

6

203.40

3.85

12.43

7

204.70

3.44

14.33

8

204.30

4.08

15.26

9

204.50

4.50

15.90

10

203.90

4.31

18.21

11

202.70

3.57

13.22

12

205.80

3.55

13.45

13

209.5

4.61

12.22

14

204.3

3.99

12.00

15

202.8

4.78

13.07

Вариант 17

t

Y

K

L

1

1.61

1.85

1.22

2

1.69

1.99

1.25

3

1.77

2.14

1.28

4

1.87

2.30

1.31

5

1.96

2.46

1.33

6

2.06

2.63

1.36

7

2.11

2.81

1.39

8

2.22

2.99

1.41

9

2.33

3.18

1.43

10

2.51

3.38

1.45

11

2.63

3.59

1.46

12

2.73

3.81

1.47

13

2.77

4.03

1.48

14

2.84

4.24

1.49

15

2.88

4.46

1.49

Вариант 19

t

Y

K

L

1

131.73

145.69

113.3

2

139.48

156.78

115.52

3

145.81

167.69

117.96

4

153.32

179.45

120.4

5

157.1

191.56

122.62

6

164.82

203.74

124.72

7

173.55

216.58

126.39

8

186.64

230.20

127.72

9

195.43

244.73

128.71

10

203.11

259.80

129.49

11

206.29

274.32

130.6

12

211.03

288.73

131.37

13

214.41

303.50

131.49

14

223.85

318.14

129.93

15

229.43

333.94

127.94

Вариант 18

t

Y

K

L

1

1.09

1.15

1.03

2

1.18

1.27

1.07

3

1.23

1.37

1.10

4

1.34

1.47

1.13

5

1.42

1.58

1.16

6

1.48

1.71

1.19

7

1.61

1.85

1.22

8

1.69

1.99

1.25

9

1.77

2.14

1.28

10

1.87

2.30

1.31

11

1.96

2.46

1.33

12

2.06

2.63

1.36

13

2.11

2.81

1.39

14

2.22

2.99

1.41

15

2.33

3.18

1.43

Вариант 20

t

Y

K

L

1

0.58

0.45

0.70

2

0.62

0.50

0.73

3

0.67

0.56

0.78

4

0.72

0.61

0.83

5

0.76

0.66

0.86

6

0.79

0.73

0.88

7

0.87

0.80

0.92

8

0.92

0.88

0.96

9

1.00

1.00

1.00

10

1.09

1.15

1.03

11

1.18

1.27

1.07

12

1.23

1.37

1.10

13

1.34

1.47

1.13

14

1.42

1.58

1.16

15

1.48

1.71

1.19

Вариант 21

t

Y

K

L

1

1.000

1.000

1.000

2

1.124

1.092

1.046

3

1.222

1.192

1.078

4

1.339

1.304

1.110

5

1.488

1.434

1.162

6

1.657

1.583

1.182

7

1.809

1.757

1.159

8

1.998

1.952

1.170

9

2.181

2.162

1.214

10

2.378

2.390

1.249

11

2.575

2.641

1.238

12

2.769

2.918

1.222

13

2.974

3.220

1.250

14

3.161

3.544

1.286

15

3.376

3.890

1.337

Вариант 23

t

Y

K

L

1

84.6

59.34

92.39

2

82.63

57.58

91.68

3

77.41

55.88

91.11

4

81.24

50.63

91.05

5

84.97

55.57

91.5

6

89.43

56.39

92.38

7

92.27

58.16

92.46

8

92.32

61.82

92.18

9

95.22

64.3

91.75

10

95.78

67.1

92.27

11

97.76

69.66

92.98

12

98.45

72.56

93.43

13

98.67

70.02

93.81

14

99.65

72.97

93.5

15

102

75.97

93.41

Вариант 22

t

Y

K

L

1

38.84

37.87

80.79

2

43.66

41.35

84.51

3

47.47

45.13

87.09

4

51.99

49.39

89.71

5

57.80

54.30

93.87

6

64.36

59.93

95.47

7

70.26

66.55

93.65

8

77.60

73.93

94.50

9

84.71

81.86

98.10

10

92.38

90.51

100.88

11

100.00

100.00

100.00

12

107.54

110.49

98.73

13

115.51

121.96

100.96

14

122.76

134.22

103.87

15

131.12

147.33

108.01

Вариант 24

t

Y

K

L

1

80.53

50.56

91.68

2

73.72

61.03

91.39

3

85.22

66.63

91.1

4

85.38

40.83

91.1

5

87.28

50.13

92.4

6

88.81

63.99

92.83

7

96.41

79.11

92.26

8

96.58

46.22

91.25

9

93.81

59.86

92.26

10

94.05

76.57

93.41

11

101.91

91.91

93.55

12

99.05

48.86

93.26

13

97.78

64.83

93.41

14

98.37

83.13

93.84

15

106.53

101.64

93.55

Вариант 25

t

Y

K

L

1

39.09

37.80

81.08

2

43.41

41.43

84.23

3

47.65

45.25

87.10

4

52.31

49.55

90.10

5

57.99

54.48

93.23

6

64.20

60.18

94.62

7

70.62

66.74

94.32

8

77.54

74.07

95.19

9

84.85

82.04

97.90

10

92.37

90.72

99.97

11

99.98

100.25

99.90

12

107.65

110.74

99.61

13

115.33

122.16

101.13

14

123.04

134.43

104.18

15

131.74

147.54

108.07

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]