Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерный практикум по статистике

.pdf
Скачиваний:
160
Добавлен:
01.04.2015
Размер:
2.27 Mб
Скачать

Места студентов в рейтинге, составленном преподавателями выпускающей кафедры перед началом производственной практики, распределились согласно табл. 3.10.1.

Т а б л и ц а 3.10.1

Места

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

Студенты

А

Б, В

Г

Д

Е

Ж

З, И, К

Л

М

 

 

 

 

 

 

 

 

 

 

 

 

 

По окончании производственной практики сотрудники базовой организации, в которой проходила производственная практика данных студентов, составили (независимо от преподавателей выпускающей кафедры) рейтинг практикантов (табл. 3.10.2).

Т а б л и ц а 3.10.2

Места

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

Студенты

В

Б

А

Г

Д

Е, Ж,

И

К

М

Л

 

 

 

 

 

 

 

 

 

 

 

 

 

Выясним, согласуются ли мнения выпускающей кафедры и базовой организации относительно положения студентов в рейтинге.

Рейтинги студентов, построенные выпускающей кафедрой и базовой организацией, сведем в табл. 3.10.3. В случае связанных рангов, когда несколько объектов, по мнению эксперта, равнозначны (например, в данном случае, по мнению выпускающей кафедры, студенты Б и В имеют одинаковые способности и делят в рейтинге выпускающей кафедры места со второго по третье), этим объектам присваивается одинаковый ранг, равный среднему арифметическому из рангов, которые они имели бы, будучи различными (в данном случае в рейтинге выпускающей кафедры студенты Б и В получают одинаковые ранги (2 + 3)/2 = 2,5).

Т а б л и ц а 3.10.3

Ранги в рейтингах

 

 

 

 

 

 

Студенты

 

 

 

 

 

 

А

Б

В

Г

Д

Е

Ж

З

И

К

Л

М

 

 

 

 

выпускающей кафедры, xi(1)

 

1

2,5

2,5

4

5

6

 

7

9

9

9

11

12

базовой организации, xi(2)

 

3

2

1

4

5

7

 

7

7

9

10

12

11

 

xi(1) xi(2)

 

–2

0,5

1,5

0

0

–1

 

0

2

0

–1

–1

1

(x(1)

x(2) )2

 

4

0,25

2,25

0

0

1

 

0

4

0

1

1

1

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для

 

измерения

тесноты

связи

 

между

ранжировками

X(1) = (x(1)

,x(1),…,x(1) ) и X(2)

= (x(2),x(2),…,x(2) ) , где N — объем генеральной со-

1

2

N

 

1

2

N

 

 

 

 

 

 

 

 

 

вокупности (число всех студентов), используют ранговый коэффициент

корреляции

Спирмэна r(С) (X(1), X(2) ) , выборочная оценка которого

(С)

(X

(1)

, X

(2)

)

в случае отсутствия в обеих рассматриваемых ранжировках

ˆr

 

 

связанных рангов (т. е. когда два объекта оказываются равнозначными в

ранжировке) рассчитывается по формуле

ˆr

(X

 

, X

 

) = 13

n

xi

) ,

(1)

(2)

(xi

(С)

 

 

6

(1)

(2)

2

n n i=1

где n — объем выборки (число студентов, отобранных для ранжировки).

101

В случае н а л и ч и я с в я з а н н ы х р а н г о в связанным объектам приписываются одинаковые средние ранги, и для первой ранжировки определяется величина

 

 

m(1)

 

N(1) =

1

((nk(1) )3 - nk(1) ),

 

 

 

 

12 k=1

 

где m(1) — число групп связанных рангов в первой ранжировке, а n(1)

 

 

k

 

число элементов (рангов), входящих в k-ю группу связанных рангов (в случае отсутствия связанных рангов, очевидно, N(1) = 0). Аналогично рассчитывается величина N(2) для второй ранжировки.

Выборочная оценка рангового коэффициента корреляции Спирмэна в случае наличия связанных рангов вычисляется по формуле

 

 

 

 

 

 

 

1

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n3 - n) - (xi(1)

- xi(2) )2 - N(1) - N(2)

ˆr

(X

 

, X

 

) =

 

6

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

.

(С)

 

(1)

 

(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

(n

3

- n) - 2N

(1)

 

1

(n

3

- n) - 2N

(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка гипотезы H0: r(С) (X(1), X(2) ) = 0 при альтернативной гипотезе

H1: r(С) (X(1), X(2) ) ¹ 0 производится с использованием статистики

=ˆr(С) n - 2 Tn2 1- (ˆr(С) )2 ,

которая в предположении справедливости гипотезы H0 при n > 10 имеет распределение Стьюдента с n – 2 степенями свободы. Если значение |Tn–2| оказывается больше критической точки tα; n2 , то гипотеза H0 отвергается на

уровне значимости a и принимается гипотеза H1.

В примере в первой ранжировке два студента имеют ранг 2,5 и три студента имеют ранг 9, поэтому

N(1) = (23 - 2) + (33 - 3) = 2,5 ;

12

во второй ранжировке три студента имеют ранг 7, поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N(2)

=

(33 - 3)

= 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

Окончательно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

(123

-12) - (4 + 0,25 + 2,25 + 0 + 0 +1+ 0 + 4 + 0 +1+1+1) - 2,5 - 2

ˆ

(

 

 

 

 

)

 

6

r

(С)

 

X

(1)

, X

(2)

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

3

 

 

 

 

 

1

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(12

-12) -

2×2,5

 

(12

-12) - 2

×2

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

267

 

= 0,948,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

281×282

 

 

 

 

 

 

что свидетельствует о высокой степени согласованности ранжировок.

102

Значение статистики T10 равно

0,94812 2 = 9,42,

10,9482

критическая точка tα; n2 = t0,05;122 = 2,23 , поэтому гипотеза H0: r(С) (X(1), X(2) ) = 0

о несогласованности мнений преподавателей выпускающей кафедры и сотрудников базовой организации относительно способностей студентов к практической деятельности отвергается.

Для измерения тесноты связи между ранжировками X(1) и X(2) также применяется ранговый коэффициент корреляции Кендалла τ(X(1), X(2) ),

выборочная оценка которого в случае

о т с у т с т в и я с в я з а н н ы х

р а н г о в вычисляется как

 

 

ˆτ(X(1), X(2) ) = 1

4ν

,

n(n 1)

 

 

где ν — минимальное число обменов соседних элементов последовательности

ˆ

 

 

 

) , необходимое для того, чтобы она стала упорядочена

X

(2)

(2)

(2)

(2)

 

= (x1

,x2

,…,xn

 

 

 

 

 

ˆ

 

 

 

) .

так же, как последовательность X

(1)

(1)

(1)

(1)

 

= (x1

,x2

,…,xn

Для удобства расчета (как ручного, так и компьютерного) величины ν

необходимо перенумеровать попавшие в выборку объекты в порядке, опре-

 

 

 

 

 

 

 

ˆ

 

 

 

ˆ

ˆ

 

 

 

деляемом последовательностью X

(1)

, тогда ранжировки X

(1)

и X

(2)

перейдут

 

 

 

 

 

 

 

ɶ(1)

= (1,2,

…, n) и

ɶ

(2)

ɶ(2)

ɶ(2)

ɶ(2)

 

 

 

 

 

 

соответственно в X

X

= (x1

, x2 ,…, xn ), при этом

 

 

 

 

 

 

 

 

 

 

 

n1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν = ∑ ∑ νkl ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k=1 l=k+1

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ɶ(1)

ɶ(1)

ɶ(2)

ɶ(2)

 

 

 

 

 

 

 

 

 

ɶ

(2)

,

 

 

1,

если xk

< xl

, а xk

> xl

, т. е. нарушен порядок последовательности X

 

ν

kl

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

в противном случае.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В случае н а л и ч и я

с в я з а н н ы х р а н г о в

элементы ранжировок

Xɶ(1) и Xɶ(2) могут повторяться.

При этом способ расчета ν остается тем же,

что и при отсутствии связанных рангов, а формула для выборочной оценки рангового коэффициента корреляции Кендалла принимает вид

 

 

 

 

 

1

4ν + 2(U(1)

+ U(2) )

 

 

 

 

ˆτ(X(1), X(2) ) =

 

 

 

 

 

n(n 1)

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

U

(1)

 

2

U

(2)

 

 

 

 

 

 

1

 

 

 

n(n 1)

n(n 1)

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

m(1)

 

(nk(1) 1),

 

 

 

 

U(1) =

nk(1)

 

 

 

 

 

 

 

 

 

 

 

 

 

2 k=1

 

 

 

 

 

 

 

 

 

103

а числа m(1) и nk(1) определяются так же, как и при вычислении рангового ко-

эффициента корреляции Спирмэна (величина U(2) рассчитывается для вто-

рой ранжировки аналогичным образом).

В рассматриваемом примере для расчета ˆt(X(1), X(2) ) перенумеровы-

вать студентов в соответствии с их рейтингом, составленном преподавателями, не нужно, так как они уже пронумерованы именно в этом порядке.

Вычислим n:

νАБ = 1; νАВ = 1;νАГ = 0;νАД = 0; νАЕ = 0;

νАЖ = 0;

νАЗ = 0;

νАИ = 0;

νАК = 0;

νАЛ = 0;

νАМ = 0;

νБВ = 0;νБГ = 0; νБД = 0; νБЕ = 0;

νБЖ = 0;

νБЗ = 0;

νБИ = 0;

νБК = 0;

νБЛ = 0;

νБМ = 0;

νВГ = 0; νВД = 0; νВЕ = 0;

νВЖ = 0;

νВЗ = 0;

νВИ = 0;

νВК = 0;

νВЛ = 0;

νВМ = 0;

νГД = 0; νГЕ = 0;

νГЖ = 0;

νГЗ = 0;

νГИ = 0;

νГК = 0;

νГЛ = 0;

νГМ = 0;

νДЕ = 0; νДЖ = 0;

νДЗ = 0;

νДИ = 0;

νДК = 0;

νДЛ = 0;

νДМ = 0;

 

νЕЖ = 0; νЕЗ = 0;

νЕИ = 0;

νЕК = 0;

νЕЛ = 0;

νЕМ = 0;

 

 

νЖЗ = 0; νЖИ = 0;

νЖК = 0;

νЖЛ = 0;

νЖМ = 0;

 

 

 

νЗИ = 0;

νЗК = 0;

νЗЛ = 0;

νЗМ = 0;

 

 

 

 

νИК = 0; νИЛ = 0;

νИМ = 0;

 

 

 

 

 

νКЛ = 0; νКМ = 0;

 

 

 

 

 

 

νЛМ = 1,

поэтому n = 3.

Особо обратим внимание на то, что значение νБВ = 0 : поскольку в пер-

вой ранжировке студенты Б и В имеют одинаковые ранги, мы не можем считать, что у элементов Б и В во второй ранжировке нарушен порядок!

В первой ранжировке два студента имеют ранг 2,5 и три студента имеют ранг 9, поэтому

U(1) = 2(2 1) + 3(3 1) = 8 = 4 ;

2 2 во второй ранжировке три студента имеют ранг 7, поэтому

U(2) = 3(3 1) = 6 = 3 .

2 2

Таким образом, выборочная оценка рангового коэффициента корреляции Кендалла

 

 

 

 

 

 

 

 

1-

4×3 + 2(4 + 3)

 

 

 

 

 

 

106

 

 

 

 

 

 

 

ˆt(X

 

 

 

) =

 

 

 

12(12 -1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

106

 

 

(1)

, X

(2)

 

 

 

 

 

 

 

 

 

 

=

 

132

 

 

=

 

= 0,848 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

3

 

 

124

×

126

124×126

 

 

 

 

 

 

1

- 2×

 

 

 

1- 2

×

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12(12 -1)

12(12

-1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

132 132

 

 

 

 

 

 

что свидетельствует о достаточно высокой степени согласованности мнений независимых экспертов (преподавателей выпускающей кафедры и сотрудников базовой организации) относительно способностей студентов к практической деятельности.

104

Проверка гипотезы H0: t(X(1), X(2) ) = 0 при альтернативной гипотезе

H1: t(X(1), X(2) ) ¹ 0 производится с использованием статистики

Z =ˆt(X(1), X(2) ) 9n(n -1) ,

2(2n + 5)

которая в предположении справедливости гипотезы H0 при n > 10 распре-

делена приблизительно по стандартному нормальному закону. Если значение |Z| оказывается больше числа z(1−α)/2 , определяемого уравнением

F0 (z(1−α)/2 ) =

 

1

 

z(1−α )/2

et2 /2dt =

1- a

 

 

 

,

 

 

 

 

2p

2

 

 

0

 

 

где F0 — функция Лапласа, то гипотеза H0 отвергается на уровне значимости a

ипринимается гипотеза H1.

Взадаче значение статистики Z равно

 

0,848

 

9×12×11

 

= 0,848

 

594

 

= 3,84,

 

 

2(2×12 + 5)

29

 

 

 

 

 

 

 

 

 

 

критическая

точка

z(1−α)/2 = z(10,05)/2 = z0,475

= 1,96,

поэтому

гипотеза

H0: t(X(1), X(2) ) = 0 о несогласованности мнений преподавателей выпускаю-

щей кафедры и сотрудников базовой организации относительно способностей студентов к практической деятельности отвергается.

Теперь воспользуемся пакетом SPSS для вычисления оценок ранговых

коэффициентов корреляции и проверки соответствующих гипотез. Введем в рабочий лист SPSS два столбца, соответствующие двум ранжировкам, соответствующие переменные назовем «x_1» и «x_2» (рис. 3.10.1).

 

x_1

x_2

1

1

3

2

2,5

2

3

2,5

1

4

4

4

5

5

5

6

6

7

7

7

7

8

9

7

9

9

9

10

9

10

11

11

12

12

12

11

Рис. 3.10.1. Числовые данные для программы «Bivariate Correlations»

Обратимся (с помощью выбора пункта «Correlate | Bivariate…» меню «Statistics») к программе «Bivariate Correlations» (рис. 3.10.2), выбрав для анализа переменные «x_1» и «x_2» («Variables») и указав, что необходимо вычислить оценки ранговых коэффициентов корреляции Спирмена («Spearman») и Кендалла («Kendall’s tau-b»), а проверка значимости должна быть проведена с двусторонней альтернативой («Test of Significance: Two-tailed»).

105

Рис. 3.10.2. Окно ввода данных программы «Bivariate Correlations»

Результаты работы программы (рис. 3.10.3) содержат оценки ранговых коэффициентов корреляции ˆτ(X(1), X(2) ) = 0,848 и ˆr(С) (X(1), X(2) ) = 0,948 (в строках «Correlation Coefficient»), а также рассчитанные уровни значимости (P-значения) гипотез H0: t(X(1), X(2) ) = 0 (при альтернативе H0: t(X(1), X(2) ) ¹ 0 ) и H0: r(С) (X(1), X(2) ) = 0 (при альтернативе H0: r(С) (X(1), X(2) ) ¹ 0) [в строках «Sig. (2-tailed)»]. Оба эти P-значения оказались меньше принятого уровня значимости α = 0,05, что говорит о значимости коэффициентов ˆτ и ˆr(С) .

Nonparametric Correlations

Correlations

 

 

 

X_1

X_2

Kendall's

X_1

Correlation Coefficient

1

0,848**

 

 

Sig. (2-tailed)

 

0,000211

 

 

N

12

12

 

X_1

Correlation Coefficient

0,848**

1

 

 

Sig. (2-tailed)

0,000211

 

 

 

N

12

12

Spearman's rho

X_1

Correlation Coefficient

1

0,948**

 

 

Sig. (2-tailed)

 

0,0000026

 

 

N

12

12

 

X_1

Correlation Coefficient

0,948**

1

 

 

Sig. (2-tailed)

0,0000026

 

 

 

N

12

12

**. Correlation is significant at the 0,01 level (2-tailed).

Рис. 3.10.3. Результаты работы программы «Bivariate Correlations»

3.11. П р и м е р о ц е н к и с в я з и м е ж д у п о р я д к о в о й и к а т е г о р и з о в а н н о й

с л у ч а й н ы м и в е л и ч и н а м и

Места студентов по результатам университетской олимпиады по математической статистике распределились согласно табл. 3.11.1 (буквой «д» обозначены девушки, а буквой «ю» — юноши).

106

Т а б л и ц а 3.11.1

Место

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Пол студента

ю

ю

д

ю

д

д

ю

ю

ю

д

ю

Д

ю

д

Д

Выясним, кто показывает более высокие результаты — юноши или девушки.

Воспользуемся ранговыми коэффициентами корреляции, предварительно преобразовав дихотомический признак «пол студента» в ранговый, приписав восьми юношам их средний ранг (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8)/8 = 4,5, а семи девушкам — их средний ранг (9 + 10 + 11 + 12 + 13 + 14 + 15)/7 = 12 (табл. 3.11.2).

Т а б л и ц а 3.11.2

Ранги в рейтингах

 

 

 

 

 

 

Пол студентов

 

 

 

 

 

 

ю

ю

д

ю

д

д

ю

ю

ю

д

ю

д

ю

д

д

 

 

по месту на олимпиаде, xi(1)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

по полу, xi(2)

4,5

4,5

12

4,5

12

12

4,5

4,5

4,5

12

4,5

12

4,5

12

12

x(1)

x(2)

–3,5

–2,5

–9

–0,5

–7

–6

2,5

3,5

4,5

–2

6,5

0

8,5

2

3

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi(1)

xi(2) )2

12,25

6,25

81

0,25

49

36

6,25

12,2520,25

4

42,25

0

72,25

4

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для измерения тесноты связи между данными ранжировками воспользуемся вначале ранговым коэффициентом корреляции Спирмэна. Вычислим его оценку:

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

3

-7)

 

 

 

840

 

 

 

 

(xi(1)

- xi(2) )2

= 355, N(1)

= 0, N(2) =

(8

- 8) + (7

 

=

= 70 ,

 

 

 

12

 

 

12

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

(153

-15)

- 355 - 0 -70

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

9 3

 

ˆ

 

 

 

 

=

 

 

 

 

6

 

 

 

 

 

=

= 0,278 ,

r

(С)

 

X

(1)

, X

(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

56

 

 

 

 

 

 

 

1

3

-15)

- 2×0

 

1

3

-15) - 2

×70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(15

 

 

(15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т. е., судя по выборке, связь, хоть и незначительная, между номером места и полом студента, при этом чем больше номер места, тем больше ранг студента по признаку «пол», а поскольку мы девушкам приписывали более

высокий ранг по полу, чем юношам, то это означает, что девушки занимают места с большими номерами, т. е. более низкие места.

Можно ли считать, что и в генеральной совокупности связь между номером места и полом студента существует? Проверим гипотезу H0: r(С) (X(1), X(2) ) = 0

при альтернативе H1: r(С) (X(1), X(2) ) ¹ 0. Статистика Tn–2 примет значение

0,27815 - 2 =1,04 , 1- 0,282

критическая точка (на 5%-ном уровне значимости) t0,05;152= 2,16 , поэтому нет оснований отвергнуть гипотезу H0: r(С) (X(1), X(2) ) = 0 о несогласованности

места студента на олимпиаде и его пола, т. е. в генеральной совокупности связь между номером места и полом студента не подтверждается.

107

Вычислим теперь оценку рангового коэффициента корреляции Кендалла. Предоставляем студенту проверить, что n =19, U(1) = 0, U(2) = 49 и

ˆt(X(1), X(2) ) = 37030 = 0,235 .

Проверим гипотезу H0: t(X(1), X(2) ) = 0 при альтернативе H1: t(X(1), X(2) ) ¹ 0 . Наблюдаемое значение статистики Z равно

0,235 9×15(15 -1) = 0,235×3 3 =1,22 ,

2(2×15 + 5)

критическая точка (на 5%-ном уровне значимости) z(1−α)/2 = z(10,05)/2 = z0,475 = = 1,96, поэтому гипотеза H0: t(X(1), X(2) ) = 0 о несогласованности места сту-

дента на олимпиаде и его пола не отвергается.

Рассчитанный c помощью программы «Bivariate Correlations» пакета SPSS уровень значимости гипотез H0r(С) (X(1), X(2) ) = 0 и H0: t(X(1), X(2) ) = 0

(при двусторонних альтернативах) составил соответственно 0,315 и 0,298. Таким образом, связь между ранговым и дихотомическим признаками

не является значимой.

3.12. П р и м е р о ц е н к и с в я з и м е ж д у т р е м я п о р я д к о в ы м и с л у ч а й н ы м и в е л и ч и н а м и

В конкурсе «Мисс Университет» участвовали десять девушек. Оценки за конкурс, выставленные четырьмя экспертами, сведены в табл. 3.12.1.

Выясним, насколько согласованным является мнение жюри.

 

 

 

 

 

 

 

Т а б л и ц а

3.12.1

Ранги в рейтингах

 

 

 

Номера участниц

 

 

 

 

1

2

3

4

5

6

7

8

9

 

10

 

 

первого эксперта

1

2

3,5

3,5

5

9

6

9

7

 

9

второго эксперта

3

4,5

2

1

6

9,5

4,5

9,5

7

 

8

третьего эксперта

3

2

4

1

5

10

7

8

6

 

9

четвертого эксперта

2

1

4

3

6

10

6

9

8

 

6

Для измерения статистической связи между несколькими ранговыми переменными используется коэффициент конкордации W (X(1), X(2),…, X(m) ) ,

выборочная оценка которого вычисляется по формуле

 

 

 

 

 

 

 

n

 

m (k)

 

m(n +1) 2

 

 

 

 

 

 

 

 

∑ ∑xi

-

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

(m)

 

=

 

 

=

 

 

 

(1)

 

(2)

 

 

i 1

k 1

 

 

 

 

W(X

 

, X

 

,…, X

 

) =

 

 

 

 

 

 

 

,

 

 

 

1

 

 

 

 

m

 

 

 

 

 

 

 

 

 

m2(n3 - n) - mN(k)

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

k=1

 

 

где m — число анализируемых ранговых переменных (сравниваемых упорядочиваний, в данном случае — число экспертов m = 4), n — объем вы-

108

борки (число оцениваемых объектов, в данном случае n = 10), x(ik) — значение k-й переменной на i-м элементе выборки (в данном случае — мнение k- го эксперта о выступлении i-й участницы), а поправочные коэффициенты N(k) рассчитываются по той же формуле

 

1

m(k)

((nt(k) )3 nt(k) ),

N(k) =

 

 

12 t=1

 

что и для рангового коэффициента корреляции Спирмэна (m(k) — число групп связанных рангов в k-й ранжировке, а nt(k) — число элементов (рангов), входящих в t-ю группу связанных рангов).

Коэффициент конкордации (как и его оценка) может принимать значения из отрезка [0; 1], причем W (X(1), X(2),…, X(m) ) = 1 тогда и только тогда,

когда все ранжировки (мнения всех экспертов) совпадают; в случае, когда

мнения экспертов различаются, 0 W (X(1), X(2),…, X(m) ) < 1.

 

 

 

 

 

 

 

Расчет

 

оценки

 

коэффициента

 

 

конкордации

проиллюстрируем

табл. 3.12.2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поправочные коэффициенты

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N(1) =

(23 2) + (33 3)

 

= 2,5, N(2)

=

(23 2) + (23 2)

= 1, N(3)

= 0, N(4) =

(33 3)

= 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

3.12.2

 

Ранги в рейтингах

 

 

 

 

 

 

 

 

 

 

 

Номера участниц

 

 

 

 

 

 

 

 

1

2

 

 

 

3

 

 

 

 

4

 

 

5

6

7

8

 

9

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

первого эксперта, x(1)

 

1

2

 

 

 

3,5

 

 

3,5

 

5

9

6

9

 

7

9

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

второго эксперта, x(2)

 

3

4,5

 

 

2

 

 

 

 

1

 

 

6

9,5

4,5

9,5

 

7

8

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

третьего эксперта, x(3)

 

3

2

 

 

 

4

 

 

 

 

1

 

 

5

10

7

8

 

6

9

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

четвертого эксперта, x(4)

 

2

1

 

 

 

4

 

 

 

 

3

 

 

6

10

6

9

 

8

6

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi(k)

 

 

 

9

9,5

 

 

13,5

 

 

8,5

 

22

38,5

23,5

35,5

 

28

32

 

 

 

k=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

m(n +1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi(k)

 

 

 

–13

–12,5

–8,5

 

–13,5

 

0

16,5

1,5

13,5

 

6

10

 

 

 

 

 

 

 

 

 

 

k=1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

(k)

 

m(n +1) 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

169

156,25

72,25

182,25

 

0

272,25

2,25

182,25

36

100

 

 

2

 

 

 

k=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Окончательно получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1)

, X

(2)

,

X

(3)

, X

(4)

) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W(X

 

 

 

 

 

 

 

 

 

 

 

 

 

= (169 + 156,25 + 72,25 + 182,25 + 0 + 272,25 + 2,25 + 182,25 + 36 + 100) = 0,91. 121 42(103 10) 4(2,5 + 1+ 0 + 2)

109

Проверка статистической значимости коэффициента конкордации (т. е.

проверка гипотезы H : W

(X(1)

, X(2),…, X(m) ) = 0 при альтернативной гипотезе

 

 

0

 

 

 

H : W (X(1)

, X(2)

,…, X(m) ) > 0 ) производится с использованием статистики

1

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

χn1

= m(n -1)W ,

которая в предположении справедливости гипотезы H0 при n > 7 распреде-

лена приблизительно по закону χ2 с n – 1 степенью свободы. Если наблюдаемое значение статистики χ2n1 оказывается больше критической точки c2α; n1 , то гипотеза H0 отвергается на уровне значимости a и принимается гипотеза H1.

В задаче значение статистики χ29 составило

4(10 – 1)0,91 = 32,7,

что больше критической точки c2α; n1 = c20,05; 9 = 16,91, поэтому множественная

ранговая связь признается значимой, т. е. мнения экспертов можно признать согласованными.

3.13. П р и м е р о ц е н к и с в я з и м е ж д у д в у м я к а т е г о р и з о в а н н ы м и с л у ч а й н ы м и в е л и ч и н а м и

и о ц е н к и з а в и с и м о с т и о д н о й в е л и ч и н ы о т д р у г о й

В результате проведенного опроса учащихся девятых классов городских общеобразовательных школ относительно их планов о дальнейшем обучении и фактической реализации этих планов получена комбинационная таблица, представленная в табл. 3.13.1.

Требуется выяснить, зависимы или не зависимы величины X и Y, а

также вычислить значения коэффициентов связи и зависимости.

Т а б л и ц а 3.13.1

Планы опрошенных (Х)

 

Фактическое распределение (Y)

 

 

 

 

 

 

 

1. 10-й класс

2. Колледж

3. Лицей

И т о г о

1.

10-й класс

120

40

5

165

2.

Колледж

10

35

10

55

3.

Лицей

15

25

40

80

И т о г о

145

100

55

300

Проверим на уровне значимости a = 0,05 гипотезу о независимости

двух изучаемых величин (признаков): «планы опрошенных» и «фактическое распределение», т. е.

H0 : {"i, j pij = pi p j}

против альтернативной гипотезы

H1 : {$i0, j0 pi0j0 ¹ pi p j для i =1,2,…, r, j =1,2,…, s} .

110