Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм

.pdf
Скачиваний:
47
Добавлен:
19.08.2013
Размер:
773.37 Кб
Скачать

-80-

54. Проверка гипотез о законе распределения

Критерий согласия 2 (Пирсона)

До сих пор мы рассматривали гипотезы, относящиеся к отдельным параметрам распределения случайной величины, причём закон распределения предполагался известным. Однако во многих практических задачах закон распределения случайной величины неизвестен, т. е. является гипотезой, которая требует статистической проверки.

Обозначим через X исследуемую случайную величину. Пусть требуется проверить гипотезу H0 о том, что случайная величина

подчиняется закону распределения F (x). Для проверки гипотезы

произведём выборку, состоящую из п независимых наблюдений над случайной величиной X . По выборке можно построить эмпирическое распределение F * (x) исследуемой случайной величины. Срав-

нение эмпирического F * (x) и теоретического распределений производится с помощью специально подобранной случайной величины -

критерия согласия. Существует несколько критериев согласия: 2 Пирсона, Колмогорова, Смирнова и др. Критерий согласия Пирсона - наиболее часто употребляемый критерий для проверки гипотезы о законе распределения.

Рассмотрим этот критерий. Разобьём всю область изменения X на l интервалов 1 ,2 ,L,l и подсчитаем количество элементов

mi , попавших в каждый из интервалов i . Предполагая известным теоретический закон распределения F (x), всегда можно определить pi (вероятность попадания случайной величины X в интервал i ), тогда теоретические частоты можно рассчитать по формуле n pi .

Если эмпирические частоты сильно отличаются от теоретических, то проверяемую гипотезу H0 следует отвергнуть, в противном случае -

принять.

Сформулируем критерий, который бы характеризовал степень расхождения между эмпирическими и теоретическими частотами. В литературе по математической статистике доказывается, что стати-

2

(mi n pi )2

имеет распределение

2

с k = l r 1

стика =

 

 

n pi

степенями свободы. Здесь r - число параметров распределения F (x).

-81-

Правило применения критерия 2сводится к следующему. Рассчитав теоретические частоты n pi и вычислив значение 2p , затем выбрав

уровень значимости критерия α , по таблице находим 2 (k ;α). Если2p > 2 (k ;α), то гипотезу H0 отвергают, если 2p 2 (k ;α), то

гипотезу принимают или, другими словами нет оснований отвергнуть гипотезу о том, что генеральная совокупность подчинена закону распределения F (x). В заключение отметим, что необходимым услови-

ем применения критерия Пирсона является наличие в каждом из интервалов по меньшей мере 5-10 наблюдений. Если количество наблюдений мало, то нужно объединить интервалы, содержащие частоты менее 5.

Пример 48. На телефонной станции производились наблюдения над числом X неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты: 3; 1; 3; 1; 4; 2; 2; 4; 0; 3; 0; 2; 2; 0; 2; 1; 4; 3; 3; 1; 4; 2; 2; 1; 1; 2; 1; 0; 3; 4; 1; 3; 2; 7; 2; 0; 0; 1; 3; 3; 1; 2; 4; 2; 0; 2; 3; 1; 2; 5; 1; 1; 0; 1; 1; 2; 2; 1; 1; 5. Определить выбо-

рочную среднюю и дисперсию неправильных соединений в минуту и проверить выполнение основного условия для распределения Пуас-

сона[M (x)=σ 2 ]. Найти теоретическое распределение Пуассона и проверить степень согласия теоретического и эмпирического распре-

делений по критерию 2 Пирсона при уровне значимости α = 0,05 . Решение. Упорядочим результаты наблюдений, записав их в

таблицу:

xi

0

1

2

3

4

5

6

7

mi

8

17

16

10

6

2

0

1

Найдём

x = n1 xi mi = 601 (0 8 +1 17 +2 16+3 10+4 6 +5 2 +6 0 +7 1)=2.

Вычислим выборочную дисперсию по формуле S2 = x2 (x)2, где x2 =n1 xi2 mi =601 (0 8+1 17+4 16+9 10+16 6+25 2+36 0+49 1)=6,1,

-82-

тогда S 2 (x)= 6,14 = 2,1. Необходимое условие для распределения

Пуассона практически выполняется. Запишем теоретический закон распределения Пуассона, используя вместо математического ожида-

ния его оценку x : P(m)=2mm!e2. Найдём теоретические частоты:

=n P(0)=60

20

 

e

2

 

=n P(1)=60

2

e

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m0

 

 

 

 

 

 

8,1; m1

 

 

 

16,24;

 

 

 

0!

 

 

 

 

1

 

 

 

 

 

 

22

 

 

 

 

 

 

 

 

 

 

23

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

m2

= n P(2)= 60

 

 

 

 

e

 

16,24; m3 = n P(3)= 60

 

 

 

 

 

e

 

 

10,62

;

2!

 

 

3!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

 

2

 

 

 

 

 

 

25

 

 

 

 

2

 

 

 

m4

= n P(4)= 60

 

 

 

 

e

 

5,41; m5 = n P(5)=

60

 

 

 

 

 

e

 

 

2,17 ;

 

4!

 

 

5!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m6′ = n P(6)= 60

26

e

2 0,72; m7′ = n P(7)=

60

 

27

e2

 

0,2 .

 

 

 

 

 

 

 

 

 

6!

 

 

 

 

 

 

 

 

 

 

 

 

7!

 

 

 

 

 

 

 

 

Так как последних три интервала содержат частоты менее пяти, то объединим их с предыдущим. Получим

 

 

 

 

 

 

 

m i

8

 

17

 

16

10

 

 

9

 

 

 

 

 

 

 

 

 

m'i

8,1

 

16,2

 

16,2

10,6

 

 

8,5

 

 

Вычислим значение

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(mi mi)2

(8,18)2

(17 16,2)2

(16

16,2)2

 

p =

mi

=

 

 

+

 

 

 

+

 

 

 

 

+

8,1

16,2

 

 

 

16,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

(10 10,6)2

+

(9 8,5)2 0,11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10,6

 

8,5

 

 

 

 

 

 

 

 

 

 

 

 

Примем уровень значимости α = 0,05. Количество интервалов после объединения l = 5. По выборке вычислен один параметр, которым определяется закон Пирсона - математическое ожидание, следовательно: r =1. Поэтому число степеней свободы k = l r 1 = 5 11 = 3. По таблице (см. приложение табл.4) находим

2 (3;0,05)= 7,8. Имеем 7,8>0,11, следовательно, нет оснований от-

вергнуть нулевую гипотезу или, другими словами, при уровне значимости α = 0,05 можно считать, что генеральная совокупность распределена по закону Пуассона.

-83-

Пример 49. Проверить гипотезу о нормальном распределении для следующего интервального ряда:

xi

12

16

20

24

28

32

mi

10

14

22

24

16

14

Решение. Найдём выборочное среднее по формуле

x= n1 xi mi =

=1001 (12 10 +16 14 +20 22 +24 24 +28 16 +32 14)= 22,56

и исправленную дисперсию по формуле S)2 =

n

 

 

(

 

)2

 

x2

, где

x

 

 

n 1

 

 

 

 

x2 = n1 xi mi =

=1001 (122 10 +162 14 +202 22 +242 24 +282 16 +322 14)=

=545,28 S) =10099 (545,28 22,562 )36,693 S) 6,0575.

Найдём теоретические частоты по формулам:

 

 

n h

x

 

 

 

 

1222,56

 

 

 

 

i

x

 

 

 

m

)

 

ϕ

 

)

 

66

ϕ

 

= 66 ϕ(1,74)66

0,0878

5,8,

 

 

 

 

1

 

S

 

 

 

S

 

 

 

6,0575

 

 

 

 

 

 

 

 

 

 

 

 

1622,56

66 ϕ(1,08)66 0,222714,7,

 

 

m2

66 ϕ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6,0575

 

 

 

 

 

 

m3

 

 

 

 

20 22,56

66 ϕ(0,42)66 0,3652 24,1,

 

66 ϕ

 

 

 

 

 

 

 

 

 

6,0575

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m4′ ≈ 66 ϕ 24 22,56 66 ϕ(0,24)66 0,3876 25,6,

6,0575

m5

 

28 22,56

 

 

66 ϕ(0,90)66 0,2661 17,6,

66 ϕ

 

 

 

6,0575

 

 

 

 

 

m6

 

32 22,56

 

 

66 ϕ(1,56)66 0,1182 7,8.

66 ϕ

 

 

 

6,0575

 

 

 

 

 

 

-84-

Найдём 2p по формуле

 

2

 

(mi mi)2

 

(10

5,8)2

 

(14 14,7)2

 

(22

24,1)2

 

p =

mi

=

 

 

 

+

 

 

+

 

 

+

5,8

14

,7

 

24,1

 

 

 

 

 

 

 

 

 

+

 

(24 25,6)2

+

(16 17,6)2

 

+ (14 7,8)2

8,43

 

 

 

 

 

 

 

 

 

 

 

 

 

25,6

 

 

17,6

 

 

7,8

 

 

 

 

 

Число степеней свободы равно 6-3=3, следовательно, при уровне значимости α = 0,05 имеем по таблице 2кр(3;0,05)= 7,8 , а при уровне

значимости α = 0,01 имеем по таблице 2кр(3;0,01)=11,3. Таким образом, при уровне значимости α = 0,05 нулевую гипотезу отвергаем, а при уровне значимости α = 0,01 у нас нет оснований отвергнуть нулевую гипотезу.

55.Выборочный коэффициент корреляции и его свойства

Вреальном мире многие явления природы происходят в обстановке действия многочисленных факторов, влияние каждого из них ничтожно, а число их велико. В этом случае связь теряет свою однозначность, и изучаемая физическая система переходит не в определенное состояние, а в одно из возможных для неё состояний. Здесь речь может идти лишь о статистической связи. Знание статистической зависимости между случайными переменными имеет большое практическое значение: с её помощью можно прогнозировать значение случайной переменной в предположении, что независимая переменная примет определённое значение.

Статистические связи между переменными можно изучать методом корреляционного и регрессионного анализа. Основная задача корреляционного анализа - выявление связи между случайными переменными путём точечной и интервальной оценки парных коэффициентов корреляции, вычисления и проверки значимости коэффициентов корреляции. Корреляционный анализ позволяет оценить функцию регрессии одной случайной величины на другую. Предпосылки корреляционного анализа следующие: 1) переменные величины должны быть случайными; 2) случайные величины должны иметь нормальное распределение.

Выборочный коэффициент корреляции находится по формуле

-85-

rв = (xi (x)) (y(i ) y)

n S x S y

Выборочный коэффициент корреляции оценивает тесноту линейной связи.

Свойства выборочного коэффициента корреляции:

1. Коэффициент корреляции принимает значения на интервале

[1;1].

Доказательство. Докажем справедливость утверждения для дискретных переменных. Запишем явно неотрицательное выражение

 

1 n xi x

 

 

yi y

2

 

 

 

 

 

 

 

 

i=1

 

±

 

 

 

0 . Возведём выражение под знаком сум-

 

n

S(x)

 

S(y)

 

 

 

 

 

1 n (xi x)2

 

2 n (xi x)(yi y)

 

1 n (yi y)2

мы в квадрат

 

i=1 S 2 (x)

±

 

i=1 S(x)S(y)

+

 

i=1 S 2 (y) .

n

n

n

Первое и третье слагаемые равны единице по определению дисперсии. Таким образом: 1±rв +1 0, откуда 1 rв 1.

2. Выборочный коэффициент корреляции не зависит от выбора

 

начала точки отсчёта и единицы измерения, то есть для любых

 

a1 ,b1 ,a2 ,b2 выполнено равенство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rв(a1x +b1 ;a2 x +b2 )= rв(x; y).

 

3.

Выборочный коэффициент

можно

 

вычислять по формуле

 

r

=

xy x y

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(x)S(y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство. По определению

 

 

 

 

 

 

 

 

 

1

(xi x)(yi

y)

1

(xi yi xyi yxi +n x y)

 

 

 

 

 

 

 

r

=

n

 

 

 

 

=

n

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

S(x)S(y)

в

 

 

 

 

S(x)S(y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x y x y + x y

 

 

 

x y

 

 

 

 

 

 

 

 

 

 

xy

 

xy

 

 

 

 

 

 

 

 

=

 

 

 

 

 

=

 

.

 

 

 

 

 

 

 

 

 

 

 

S(x)S(y)

 

S(x)S(y)

 

Пример 50. Вычислить выборочный коэффициент корреляции по следующим данным:

xi

2

2

3

5

yi

4

6

6

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-86-

 

 

 

 

 

 

 

 

 

 

Решение. Вычислим x =

1

 

xi =

1

(2 +2 +3 +5)= 3;

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

4

 

 

 

1

 

 

 

 

 

 

 

 

=

x2 =

(4 +4 +9 +25)=10,5; y =

(4 +6 +6 +8)= 6;

 

 

 

 

x2

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

i

4

 

 

 

 

 

 

 

 

 

4

 

 

=

 

1

(16 +36 +36 +64)= 38;

 

=

1

xi

yi =

1

(8 +12 +18 +40)=19,5;

y2

 

xy

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

4

 

 

S 2 (x)=

x2

x2 =10,5 9 =1,5; S 2 (y)=

y2

y2 = 38 36 = 2;

 

 

 

 

 

 

x y

=19,5 18 = 1,5 0,866.

r =

 

 

 

 

xy

в

 

 

S 2 (x)S 2 (y)

3

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

56. Метод вычисления выборочного коэффициента корреляции для вариационных рядов

Для вычисления выборочного коэффициента корреляции строят корреляционную таблицу. Для этого разбиваем каждый вариационный ряд на интервальный. Затем находятся входящие в формулу для вычисления выборочного коэффициента корреляции параметры.

Пример 51. По данным наблюдений над случайными величинами X и Y получена выборка, приведённая в таблице

№ X

Y № X

Y № X

Y № X

Y

1

7,1

10,0

14

14,8

35,3

27

10,9

18,2

40

16,1

30,1

2

9,5

6,7

15

17,2

36,3

28

11,4

18,7

41

18,2

27,2

3

11,0

14,0

16

19,2

37,4

29

12,3

17,6

42

19,1

30,9

4

12,3

15,1

17

22,3

38,0

30

13,2

18,1

43

17,9

35,1

5

11,8

24,2

18

17,2

40,2

31

13,1

24,1

44

18,7

36,1

6

14,1

19,9

19

19,9

42,4

32

13,6

21,3

45

12,4

17,6

7

15,1

24,3

20

20,1

44,5

33

13,7

19,8

46

12,5

18,6

8

14,7

22,2

21

21,7

42,4

34

14,6

24,1

47

12,7

19,2

9

16,1

21,0

22

8,5

12,2

35

14,2

21,3

48

14,1

26,2

10

13,1

30,1

23

9,7

12,4

36

15,2

25,2

49

14,6

27,4

11

13,8

28,1

24

10,2

12,5

37

16,1

21,1

50

14,9

30,1

12

16,9

30,3

25

11,1

12,9

38

17,2

24,6

 

 

 

13

19,1

27,3

26

11,3

16,1

39

18,0

23,3

 

 

 

Найдём оптимальные длины интервалов и количество интервалов, используя формулу Стэрджеса. Для переменной Х наименьшее значение - 7,1 наибольшее - 22,3, тогда оптимальное число интервалов равно 7 с шагом, равным 2,2, при этом получаем такие интервалы:

[7,1;9,3),[9,3;11,5),[11,5;13,7),[13,7;15,9), [15,9;18,1),

-87-

[18,1;20,3), [20,3;22,5). Для переменной У минимальное значение - 6,7

наибольшее - 44,5, тогда оптимальное число интервалов 6 с шагом, равным 6,3. Получаем интервалы

[6,7;13,0), [13,0;19,3),[19,3;25,6),[25,6;31,9), [31,9;38,2),[38,2;44,5]. Рас-

пределим наблюдения по полученным интервалам получим корреляционную таблицу. В таблицу вместо интервалов запишем их середины

У

 

 

 

Х

 

 

 

ny

8,2

10,4

12,6

14,8

17,0

19,2

21,4

 

 

9,85

2

4

 

 

 

 

 

6

16,15

 

4

6

 

 

 

 

10

22,45

 

 

3

7

4

 

 

14

28,75

 

 

1

4

2

3

 

10

35,05

 

 

 

1

2

2

1

6

41,35

 

 

 

 

1

1

2

4

nx

2

8

10

12

9

6

3

50

Для упрощения

 

расчётов

перейдём

к

условным

вариантам

ui =

 

xi C x

=

 

xi 14,8

и vi =

yi C y

=

 

yi 22,45

.

Составим рас-

 

 

 

hx

 

2

,2

 

 

hy

 

 

6,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чётную таблицу.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

nv

 

vi nv

nvvi2

 

 

 

 

 

-3

 

 

-2

 

-1

 

0

 

1

 

2

 

 

 

3

 

 

 

-2

 

 

 

 

2

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

-12

 

24

 

-1

 

 

 

 

 

 

 

4

 

6

 

 

 

 

 

 

 

 

 

 

 

10

 

 

-10

 

10

 

0

 

 

 

 

 

 

 

 

 

 

3

 

7

 

4

 

 

 

 

 

 

 

14

 

 

0

 

0

 

1

 

 

 

 

 

 

 

 

 

 

1

 

4

 

2

 

3

 

 

 

 

 

10

 

 

10

 

10

 

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

2

 

 

 

1

 

6

 

 

12

 

24

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

 

 

2

 

4

 

 

12

 

36

 

nu

 

 

 

 

2

 

 

8

 

10

12

 

9

 

6

 

 

 

3

 

50

 

 

12

 

104

 

nuui

 

-6

 

 

-16

-10

0

 

9

 

12

 

 

9

 

 

 

 

-2

 

 

 

nuui2

 

18

 

 

32

 

10

0

 

9

 

24

 

 

27

 

 

 

 

120

 

 

 

v

i

 

 

 

 

-2

 

 

-1,5

 

-0,5

0,5

 

1

 

53

 

 

83

 

 

 

 

 

 

 

 

nuui

v

i

 

12

 

 

24

 

5

 

0

 

9

 

20

 

 

24

 

 

 

 

94

 

 

 

-88-

Для вычисления выборочного коэффициента корреляции используем

формулу

r

 

 

=

 

uv u

v

,

 

где

u =

1

n

u

=

1

(2)= −0,04;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

S2(u)S2(v)

 

 

 

 

 

 

n

 

u

i

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

2,4 (0,04)2 1,549;

 

 

 

=

n u2 =

= 2,4;

 

S(u)= u2

u2 =

 

u2

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

u

i

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

=

 

104

=2,08;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

=

 

=0,24; v

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

94

 

 

S(v)=

 

 

 

v2

(

v

)2 =

 

 

2,080,242 1,422;

 

 

=

nuui

v

i =

=1,88;

 

 

 

 

 

 

 

uv

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

u

v

 

 

 

 

 

1,88 +0,04 0,24

 

 

 

 

 

 

 

 

 

 

50

 

r =

 

uv

 

 

 

0,854.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(u)S(v)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

1,549 1,422

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

57. Проверка гипотезы о значимости коэффициента корреляции

На практике коэффициент корреляции r обычно неизвестен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции rв. Равенство нулю выборочного

коэффициента корреляции ещё не свидетельствует о равенстве нулю самого коэффициента корреляции, а следовательно, о некоррелированности случайных величин Х и У. Чтобы выяснить, находятся ли случайные величины в корреляционной зависимости, нужно проверить значимость выборочного коэффициента корреляции rв, то есть

установить, достаточна ли его величина для обоснованного вывода о наличии корреляционной связи. Для этого проверяют нулевую гипотезу H0 : r = 0. Предполагается наличие двухмерного нормального

распределения случайных переменных; объём выборки может быть

любым. Вычисляют статистику t = r

n 2

, которая имеет распре-

в

1r 2

 

 

в

 

деление Стьюдента с k = n 2 степенями свободы. Для проверки нулевой гипотезы по уровню значимости α и числу степеней свободы k находят по таблице распределения Стьюдента критическое значе-

-89-

ние tα ,k . Если t tα ,k , то нулевую гипотезу об отсутствии корреля-

ционной связи между переменными Х и У следует отвергнуть. Переменные считают зависимыми. При t < tα ,k , нет оснований отверг-

нуть нулевую гипотезу.

В случае значимого выборочного коэффициента корреляции есть смысл построить доверительный интервал для коэффициента корреляции r . Однако для этого нужно знать закон распределения выборочного коэффициента корреляции rв. Плотность вероятности

выборочного коэффициента корреляции имеет сложный вид, поэтому прибегают к специально подобранным функциям от выборочного коэффициента корреляции, которые сводятся к хорошо изученным распределениям, например к нормальному или Стьюдента. Чаще всего для подбора функции применяют преобразование Фишера. Вычис-

 

 

1

 

1

+rв

 

 

 

ляют статистику

z =

 

 

, где rв = th z

- гиперболический тан-

 

 

 

 

 

1

 

2 ln

r

 

 

 

 

 

 

в

 

 

генс от z . Распределение статистики z хорошо аппроксимируется

нормальным

 

 

 

 

 

распределением

 

 

с

 

параметрами

M (z)=

1

 

1

+r

 

 

r

 

σ 2

 

1

 

 

 

 

 

 

 

 

 

ln

 

 

 

 

 

+

 

 

 

,

=

 

 

 

. В этом случае доверитель-

2

1

 

2(n 1)

n

3

 

 

r

 

 

z

 

 

 

 

 

 

ный интервал для r

имеет вид th z1 < r < th z2 . Величины z1 и z2 на-

ходятся по формулам z = 1 ln1+rв

 

 

zα ; z

2

= 1 ln1+rв +

zα

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

1

r

 

 

n 3

2 1r

n 3

 

 

 

 

 

 

1

α

 

 

 

 

 

 

 

 

в

 

 

 

 

в

 

 

где Ф(z

)=

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 52. Проверить значимость выборочного коэффициента корреляции из примера 51 и найти доверительный интервал с надёж-

ностью 0,95 для него.

 

 

 

 

 

Решение. Для

проверки значимости

найдём

статистику

t = r

n 2 = 0,854

48

11,37 . По

уровню

значимости

в

1r 2

10,8542

 

 

 

 

в

 

 

 

 

α = 0,05 и числу степеней свободы k = 48 найдём tα ,k = 2,009 (см. приложение табл.3). Так как t tα ,k , то нулевую гипотезу об отсут-

ствии корреляционной связи между переменными Х и У следует отвергнуть. Следовательно, выборочный коэффициент корреляции зна-

Соседние файлы в предмете Высшая математика