Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уч. пособие по ММСИ.doc
Скачиваний:
45
Добавлен:
11.12.2018
Размер:
2.12 Mб
Скачать

3. Смысл коэффициента корреляции Пирсона

Вернемся к коэффициенту Пирсона. Чтобы лучше понять его роль, проведем эксперимент. Увеличим разброс точек вдоль прямой. Для этого в столбце, соответствующем переменной Y, в первой строке уменьшим на 2 число часов, проводимых перед телевизором, во второй строке число часов, наоборот, увеличим на 2, в третьей строке снова уменьшим на 2, в четвертой – увеличим на 2 и т. д. Получаем табл. 17.5.

Таблица 17.5

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

X

1

1

2

3

3

3

4

4

4

5

6

6

7

7

8

8

9

9

10

10

Y

1

6,5

1,5

7

2

7

3

6

4

7

3

9

3

8

5

8

3

8

5

8

Этой таблице соответствует график на рис. 17.4, в котором все точки разбросаны, если можно так выразиться, с большим размахом.

Интересно здесь то, что уравнение линии регрессии при новом, более размашистом положении точек, оказывается практически тем же самым, и, соответственно, почти тем же самым является коэффициент связи.

Рис. 17.4. Время, затрачиваемое на просмотр телепередач, при различных количествах лет, прошедших после выхода на пенсию (второй вариант)

Покажем это. Строим табл. 17.6, в которой сведены элементы формулы

Таблица 17.6

1

1

–4,5

20,25

1

–4,25

19,125

2

1

–4,5

20,25

6,5

1,25

–5,625

3

2

–3,5

12,25

1,5

–3,75

13,125

4

3

–2,5

6,25

7

1,75

–4,375

5

3

–2,5

6,25

2

–3,25

8,125

6

3

–2,5

6,25

7

1,75

–4,375

7

4

–1,5

2,25

3

–2,25

3,375

8

4

–1,5

2,25

6

0,75

–1,125

9

4

–1,5

2,25

4

–1,25

1,875

10

5

–0,5

0,25

7

1,75

–0,875

11

6

0,5

0,25

3

–2,25

–1,125

12

6

0,5

0,25

9

3,75

1,875

13

7

1,5

2,25

3

–2,25

–3,375

14

7

1,5

2,25

8

2,75

4,125

15

8

2,5

6,25

5

–0,25

–0,625

16

8

2,5

6,25

8

2,75

6,875

17

9

3,5

12,25

3

–2,25

–7,875

18

9

3,5

12,25

8

2,75

9,625

19

10

4,5

20,25

5

–0,25

–1,125

20

10

4,5

20,25

8

2,75

12,375

 = 110

 = 161

 = 105

 = 50

= 5,5

= 5,25

Получаем: а = 0,31 (50 : 161); в = 3,5 (5,25 – 0,31 х 5,5).

Новое уравнение: Y = 0,31X + 3,5. Мы видим, что оно почти совпадает с прежним уравнением: Y = 0,286X + 3,68.

Итак, коэффициент связи между обеими переменными может практически не измениться даже при большем разбросе точек.

Теперь проверим коэффициент 0,31 на статистическую значимость, для этого определим коэффициент корреляции Пирсона. Напоминаем его формулу:

Снова строим таблицу, в которой присутствуют необходимые элементы формулы (табл. 17.7).

Таблица 17.7

x

y

xy

x2

y2

1

1

1

1

1

1

2

1

6,5

6,5

1

42,25

3

2

1,5

3

4

2,25

4

3

7

21

9

49

5

3

2

6

9

4

6

3

7

21

9

49

7

4

3

12

16

9

8

4

6

24

16

36

9

4

4

16

16

64

10

5

7

35

25

49

11

6

3

18

36

9

12

6

9

54

36

81

13

7

3

21

49

9

14

7

8

56

49

64

15

8

5

40

64

25

16

8

8

64

64

64

17

9

3

27

91

9

18

9

8

72

81

64

19

10

5

50

100

25

20

10

8

89

100

64

 = 110

 = 105

 = 636,5

 = 776

 = 719,5

Определяем коэффициент Пирсона:

_________________________________

Rxy = (20х636,5 – 11550) : √(20х776 - 12100) х (20х719,5 – 11025) =

____________________________ _________

= (12730 – 11550) : √(15520 – 12100) х (14390 – 11025) = 1180 : √3420 х 3365 = 1180 : √11508300 = 1180 : 3392,4 = 0,348.

Выбираем уровень значимости 0,05, количество степеней свободы равно 18, в таблице коэффициента корреляции (табл. 17.4) этим данным соответствует число 0,4438. У нас же получилось 0,348. Следовательно, наш новый коэффициент связи 0,31 не является статистически значимым. Уравнением Y = 0,31X + 3,5 мы выразили всего лишь случайную связь.

Даже если бы мы претендовали на 1 ошибку в 10 случаях, наш коэффициент связи все равно являлся бы статистически незначимым, так как таблица коэффициента корреляции дает в этом случае число 0,3783, которое больше получившегося у нас коэффициента Пирсона.

Сделаем вывод. Увеличение разброса точек снижает вероятность получения статистически значимого коэффициента связи между переменными. Можно сказать иначе, коэффициент Пирсона измеряет степень близости точек к линии, выражающей связь между интервальными переменными.

Проведя соответствующие расчеты, несложно показать, что в случае, когда все точки лежат точно на прямой, коэффициент Пирсона равен единице.