Компьютерный практикум по статистике
.pdfМеста студентов в рейтинге, составленном преподавателями выпускающей кафедры перед началом производственной практики, распределились согласно табл. 3.10.1.
Т а б л и ц а 3.10.1
Места |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Студенты |
А |
Б, В |
Г |
Д |
Е |
Ж |
З, И, К |
Л |
М |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
По окончании производственной практики сотрудники базовой организации, в которой проходила производственная практика данных студентов, составили (независимо от преподавателей выпускающей кафедры) рейтинг практикантов (табл. 3.10.2).
Т а б л и ц а 3.10.2
Места |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Студенты |
В |
Б |
А |
Г |
Д |
Е, Ж, |
И |
К |
М |
Л |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
Выясним, согласуются ли мнения выпускающей кафедры и базовой организации относительно положения студентов в рейтинге.
Рейтинги студентов, построенные выпускающей кафедрой и базовой организацией, сведем в табл. 3.10.3. В случае связанных рангов, когда несколько объектов, по мнению эксперта, равнозначны (например, в данном случае, по мнению выпускающей кафедры, студенты Б и В имеют одинаковые способности и делят в рейтинге выпускающей кафедры места со второго по третье), этим объектам присваивается одинаковый ранг, равный среднему арифметическому из рангов, которые они имели бы, будучи различными (в данном случае в рейтинге выпускающей кафедры студенты Б и В получают одинаковые ранги (2 + 3)/2 = 2,5).
Т а б л и ц а 3.10.3
Ранги в рейтингах |
|
|
|
|
|
|
Студенты |
|
|
|
|
|
||||
|
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
||||
|
|
|
|
|||||||||||||
выпускающей кафедры, xi(1) |
|
1 |
2,5 |
2,5 |
4 |
5 |
6 |
|
7 |
9 |
9 |
9 |
11 |
12 |
||
базовой организации, xi(2) |
|
3 |
2 |
1 |
4 |
5 |
7 |
|
7 |
7 |
9 |
10 |
12 |
11 |
||
|
xi(1) − xi(2) |
|
–2 |
0,5 |
1,5 |
0 |
0 |
–1 |
|
0 |
2 |
0 |
–1 |
–1 |
1 |
|
(x(1) |
− x(2) )2 |
|
4 |
0,25 |
2,25 |
0 |
0 |
1 |
|
0 |
4 |
0 |
1 |
1 |
1 |
|
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для |
|
измерения |
тесноты |
связи |
|
между |
ранжировками |
|||||||||
X(1) = (x(1) |
,x(1),…,x(1) ) и X(2) |
= (x(2),x(2),…,x(2) ) , где N — объем генеральной со- |
||||||||||||||
1 |
2 |
N |
|
1 |
2 |
N |
|
|
|
|
|
|
|
|
|
вокупности (число всех студентов), используют ранговый коэффициент
корреляции |
Спирмэна r(С) (X(1), X(2) ) , выборочная оценка которого |
|||||
(С) |
(X |
(1) |
, X |
(2) |
) |
в случае отсутствия в обеих рассматриваемых ранжировках |
ˆr |
|
|
связанных рангов (т. е. когда два объекта оказываются равнозначными в
ранжировке) рассчитывается по формуле
ˆr |
(X |
|
, X |
|
) = 1− 3 |
n |
− xi |
) , |
(1) |
(2) |
∑(xi |
||||||
(С) |
|
|
6 |
(1) |
(2) |
2 |
n − n i=1
где n — объем выборки (число студентов, отобранных для ранжировки).
101
В случае н а л и ч и я с в я з а н н ы х р а н г о в связанным объектам приписываются одинаковые средние ранги, и для первой ранжировки определяется величина
|
|
m(1) |
|
N(1) = |
1 |
∑((nk(1) )3 - nk(1) ), |
|
|
|
||
|
12 k=1 |
|
|
где m(1) — число групп связанных рангов в первой ранжировке, а n(1) |
— |
||
|
|
k |
|
число элементов (рангов), входящих в k-ю группу связанных рангов (в случае отсутствия связанных рангов, очевидно, N(1) = 0). Аналогично рассчитывается величина N(2) для второй ранжировки.
Выборочная оценка рангового коэффициента корреляции Спирмэна в случае наличия связанных рангов вычисляется по формуле
|
|
|
|
|
|
|
1 |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(n3 - n) - ∑(xi(1) |
- xi(2) )2 - N(1) - N(2) |
||||||||||||||
ˆr |
(X |
|
, X |
|
) = |
|
6 |
|||||||||||||||
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
. |
|||||||
(С) |
|
(1) |
|
(2) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
(n |
3 |
- n) - 2N |
(1) |
|
1 |
(n |
3 |
- n) - 2N |
(2) |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
6 |
|
|
6 |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Проверка гипотезы H0: r(С) (X(1), X(2) ) = 0 при альтернативной гипотезе
H1: r(С) (X(1), X(2) ) ¹ 0 производится с использованием статистики
=ˆr(С) n - 2 Tn−2 1- (ˆr(С) )2 ,
которая в предположении справедливости гипотезы H0 при n > 10 имеет распределение Стьюдента с n – 2 степенями свободы. Если значение |Tn–2| оказывается больше критической точки tα; n−2 , то гипотеза H0 отвергается на
уровне значимости a и принимается гипотеза H1.
В примере в первой ранжировке два студента имеют ранг 2,5 и три студента имеют ранг 9, поэтому
N(1) = (23 - 2) + (33 - 3) = 2,5 ;
12
во второй ранжировке три студента имеют ранг 7, поэтому |
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N(2) |
= |
(33 - 3) |
= 2 . |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
|
|
|
|
|
|
|
|
|||
|
|
Окончательно |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
1 |
(123 |
-12) - (4 + 0,25 + 2,25 + 0 + 0 +1+ 0 + 4 + 0 +1+1+1) - 2,5 - 2 |
|||||||||||||||||
ˆ |
( |
|
|
|
|
) |
|
6 |
||||||||||||||||||||
r |
(С) |
|
X |
(1) |
, X |
(2) |
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
3 |
|
|
|
|
|
1 |
3 |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(12 |
-12) - |
2×2,5 |
|
(12 |
-12) - 2 |
×2 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
6 |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
= |
267 |
|
= 0,948, |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
281×282 |
|
|
|
|
|
|
что свидетельствует о высокой степени согласованности ранжировок.
102
Значение статистики T10 равно
0,94812 − 2 = 9,42,
1− 0,9482
критическая точка tα; n−2 = t0,05;12−2 = 2,23 , поэтому гипотеза H0: r(С) (X(1), X(2) ) = 0
о несогласованности мнений преподавателей выпускающей кафедры и сотрудников базовой организации относительно способностей студентов к практической деятельности отвергается.
Для измерения тесноты связи между ранжировками X(1) и X(2) также применяется ранговый коэффициент корреляции Кендалла τ(X(1), X(2) ),
выборочная оценка которого в случае |
о т с у т с т в и я с в я з а н н ы х |
||
р а н г о в вычисляется как |
|
|
|
ˆτ(X(1), X(2) ) = 1− |
4ν |
, |
|
n(n −1) |
|||
|
|
где ν — минимальное число обменов соседних элементов последовательности
ˆ |
|
|
|
) , необходимое для того, чтобы она стала упорядочена |
||||||
X |
(2) |
(2) |
(2) |
(2) |
||||||
|
= (x1 |
,x2 |
,…,xn |
|||||||
|
|
|
|
|
ˆ |
|
|
|
) . |
|
так же, как последовательность X |
(1) |
(1) |
(1) |
(1) |
||||||
|
= (x1 |
,x2 |
,…,xn |
Для удобства расчета (как ручного, так и компьютерного) величины ν
необходимо перенумеровать попавшие в выборку объекты в порядке, опре-
|
|
|
|
|
|
|
ˆ |
|
|
|
ˆ |
ˆ |
|
|
|
|||
деляемом последовательностью X |
(1) |
, тогда ранжировки X |
(1) |
и X |
(2) |
перейдут |
||||||||||||
|
|
|
||||||||||||||||
|
|
|
|
ɶ(1) |
= (1,2, |
…, n) и |
ɶ |
(2) |
ɶ(2) |
ɶ(2) |
ɶ(2) |
|
|
|
|
|
|
|
соответственно в X |
X |
= (x1 |
, x2 ,…, xn ), при этом |
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
n−1 |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ν = ∑ ∑ νkl , |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
k=1 l=k+1 |
|
|
|
|
|
|
|
|
||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ɶ(1) |
ɶ(1) |
ɶ(2) |
ɶ(2) |
|
|
|
|
|
|
|
|
|
ɶ |
(2) |
, |
|
|
1, |
если xk |
< xl |
, а xk |
> xl |
, т. е. нарушен порядок последовательности X |
|
||||||||||
ν |
kl |
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0, |
в противном случае. |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
В случае н а л и ч и я |
с в я з а н н ы х р а н г о в |
элементы ранжировок |
||||||||||||||
Xɶ(1) и Xɶ(2) могут повторяться. |
При этом способ расчета ν остается тем же, |
что и при отсутствии связанных рангов, а формула для выборочной оценки рангового коэффициента корреляции Кендалла принимает вид
|
|
|
|
|
1− |
4ν + 2(U(1) |
+ U(2) ) |
|
|
|
|
|||||
ˆτ(X(1), X(2) ) = |
|
|
|
|
|
n(n −1) |
|
|
|
, |
||||||
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
1− 2 |
U |
(1) |
|
− 2 |
U |
(2) |
|
|
|||||
|
|
|
|
1 |
|
|
|
|||||||||
n(n −1) |
n(n −1) |
|||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
1 |
m(1) |
|
(nk(1) −1), |
|
|
|
|
|||||
U(1) = |
∑nk(1) |
|
|
|
|
|||||||||||
|
|
|
|
|
||||||||||||
|
|
|
|
2 k=1 |
|
|
|
|
|
|
|
|
|
103
а числа m(1) и nk(1) определяются так же, как и при вычислении рангового ко-
эффициента корреляции Спирмэна (величина U(2) рассчитывается для вто-
рой ранжировки аналогичным образом).
В рассматриваемом примере для расчета ˆt(X(1), X(2) ) перенумеровы-
вать студентов в соответствии с их рейтингом, составленном преподавателями, не нужно, так как они уже пронумерованы именно в этом порядке.
Вычислим n:
νАБ = 1; νАВ = 1;νАГ = 0;νАД = 0; νАЕ = 0; |
νАЖ = 0; |
νАЗ = 0; |
νАИ = 0; |
νАК = 0; |
νАЛ = 0; |
νАМ = 0; |
νБВ = 0;νБГ = 0; νБД = 0; νБЕ = 0; |
νБЖ = 0; |
νБЗ = 0; |
νБИ = 0; |
νБК = 0; |
νБЛ = 0; |
νБМ = 0; |
νВГ = 0; νВД = 0; νВЕ = 0; |
νВЖ = 0; |
νВЗ = 0; |
νВИ = 0; |
νВК = 0; |
νВЛ = 0; |
νВМ = 0; |
νГД = 0; νГЕ = 0; |
νГЖ = 0; |
νГЗ = 0; |
νГИ = 0; |
νГК = 0; |
νГЛ = 0; |
νГМ = 0; |
νДЕ = 0; νДЖ = 0; |
νДЗ = 0; |
νДИ = 0; |
νДК = 0; |
νДЛ = 0; |
νДМ = 0; |
|
|
νЕЖ = 0; νЕЗ = 0; |
νЕИ = 0; |
νЕК = 0; |
νЕЛ = 0; |
νЕМ = 0; |
|
|
|
νЖЗ = 0; νЖИ = 0; |
νЖК = 0; |
νЖЛ = 0; |
νЖМ = 0; |
|
|
|
|
νЗИ = 0; |
νЗК = 0; |
νЗЛ = 0; |
νЗМ = 0; |
|
|
|
|
νИК = 0; νИЛ = 0; |
νИМ = 0; |
|
|
|
|
|
|
νКЛ = 0; νКМ = 0; |
|
|
|
|
|
|
|
νЛМ = 1, |
поэтому n = 3.
Особо обратим внимание на то, что значение νБВ = 0 : поскольку в пер-
вой ранжировке студенты Б и В имеют одинаковые ранги, мы не можем считать, что у элементов Б и В во второй ранжировке нарушен порядок!
В первой ранжировке два студента имеют ранг 2,5 и три студента имеют ранг 9, поэтому
U(1) = 2(2 −1) + 3(3 −1) = 8 = 4 ;
2 2 во второй ранжировке три студента имеют ранг 7, поэтому
U(2) = 3(3 −1) = 6 = 3 .
2 2
Таким образом, выборочная оценка рангового коэффициента корреляции Кендалла
|
|
|
|
|
|
|
|
1- |
4×3 + 2(4 + 3) |
|
|
|
|
|
|
106 |
|
|
|
|
|
|
|
|||||||||
ˆt(X |
|
|
|
) = |
|
|
|
12(12 -1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
106 |
|
|
||||
(1) |
, X |
(2) |
|
|
|
|
|
|
|
|
|
|
= |
|
132 |
|
|
= |
|
= 0,848 , |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
4 |
|
|
3 |
|
|
124 |
× |
126 |
124×126 |
|||||||||||||||||||
|
|
|
|
|
|
1 |
- 2× |
|
|
|
1- 2 |
× |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
12(12 -1) |
12(12 |
-1) |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
132 132 |
|
|
|
|
|
|
что свидетельствует о достаточно высокой степени согласованности мнений независимых экспертов (преподавателей выпускающей кафедры и сотрудников базовой организации) относительно способностей студентов к практической деятельности.
104
Проверка гипотезы H0: t(X(1), X(2) ) = 0 при альтернативной гипотезе
H1: t(X(1), X(2) ) ¹ 0 производится с использованием статистики
Z =ˆt(X(1), X(2) ) 9n(n -1) ,
2(2n + 5)
которая в предположении справедливости гипотезы H0 при n > 10 распре-
делена приблизительно по стандартному нормальному закону. Если значение |Z| оказывается больше числа z(1−α)/2 , определяемого уравнением
F0 (z(1−α)/2 ) = |
|
1 |
|
z(1−α )/2 |
e−t2 /2dt = |
1- a |
|
|
|
|
∫ |
, |
|||||
|
|
|
|
|||||
2p |
2 |
|||||||
|
|
0 |
|
|
где F0 — функция Лапласа, то гипотеза H0 отвергается на уровне значимости a
ипринимается гипотеза H1.
Взадаче значение статистики Z равно
|
0,848 |
|
9×12×11 |
|
= 0,848 |
|
594 |
|
= 3,84, |
|
|
|
2(2×12 + 5) |
29 |
|
||||||||
|
|
|
|
|
|
|
|
|
|||
критическая |
точка |
z(1−α)/2 = z(1−0,05)/2 = z0,475 |
= 1,96, |
поэтому |
гипотеза |
H0: t(X(1), X(2) ) = 0 о несогласованности мнений преподавателей выпускаю-
щей кафедры и сотрудников базовой организации относительно способностей студентов к практической деятельности отвергается.
Теперь воспользуемся пакетом SPSS для вычисления оценок ранговых
коэффициентов корреляции и проверки соответствующих гипотез. Введем в рабочий лист SPSS два столбца, соответствующие двум ранжировкам, соответствующие переменные назовем «x_1» и «x_2» (рис. 3.10.1).
|
x_1 |
x_2 |
1 |
1 |
3 |
2 |
2,5 |
2 |
3 |
2,5 |
1 |
4 |
4 |
4 |
5 |
5 |
5 |
6 |
6 |
7 |
7 |
7 |
7 |
8 |
9 |
7 |
9 |
9 |
9 |
10 |
9 |
10 |
11 |
11 |
12 |
12 |
12 |
11 |
Рис. 3.10.1. Числовые данные для программы «Bivariate Correlations»
Обратимся (с помощью выбора пункта «Correlate | Bivariate…» меню «Statistics») к программе «Bivariate Correlations» (рис. 3.10.2), выбрав для анализа переменные «x_1» и «x_2» («Variables») и указав, что необходимо вычислить оценки ранговых коэффициентов корреляции Спирмена («Spearman») и Кендалла («Kendall’s tau-b»), а проверка значимости должна быть проведена с двусторонней альтернативой («Test of Significance: Two-tailed»).
105
Рис. 3.10.2. Окно ввода данных программы «Bivariate Correlations»
Результаты работы программы (рис. 3.10.3) содержат оценки ранговых коэффициентов корреляции ˆτ(X(1), X(2) ) = 0,848 и ˆr(С) (X(1), X(2) ) = 0,948 (в строках «Correlation Coefficient»), а также рассчитанные уровни значимости (P-значения) гипотез H0: t(X(1), X(2) ) = 0 (при альтернативе H0: t(X(1), X(2) ) ¹ 0 ) и H0: r(С) (X(1), X(2) ) = 0 (при альтернативе H0: r(С) (X(1), X(2) ) ¹ 0) [в строках «Sig. (2-tailed)»]. Оба эти P-значения оказались меньше принятого уровня значимости α = 0,05, что говорит о значимости коэффициентов ˆτ и ˆr(С) .
Nonparametric Correlations
Correlations
|
|
|
X_1 |
X_2 |
Kendall's |
X_1 |
Correlation Coefficient |
1 |
0,848** |
|
|
Sig. (2-tailed) |
|
0,000211 |
|
|
N |
12 |
12 |
|
X_1 |
Correlation Coefficient |
0,848** |
1 |
|
|
Sig. (2-tailed) |
0,000211 |
|
|
|
N |
12 |
12 |
Spearman's rho |
X_1 |
Correlation Coefficient |
1 |
0,948** |
|
|
Sig. (2-tailed) |
|
0,0000026 |
|
|
N |
12 |
12 |
|
X_1 |
Correlation Coefficient |
0,948** |
1 |
|
|
Sig. (2-tailed) |
0,0000026 |
|
|
|
N |
12 |
12 |
**. Correlation is significant at the 0,01 level (2-tailed).
Рис. 3.10.3. Результаты работы программы «Bivariate Correlations»
3.11. П р и м е р о ц е н к и с в я з и м е ж д у п о р я д к о в о й и к а т е г о р и з о в а н н о й
с л у ч а й н ы м и в е л и ч и н а м и
Места студентов по результатам университетской олимпиады по математической статистике распределились согласно табл. 3.11.1 (буквой «д» обозначены девушки, а буквой «ю» — юноши).
106
Т а б л и ц а 3.11.1
Место |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Пол студента |
ю |
ю |
д |
ю |
д |
д |
ю |
ю |
ю |
д |
ю |
Д |
ю |
д |
Д |
Выясним, кто показывает более высокие результаты — юноши или девушки.
Воспользуемся ранговыми коэффициентами корреляции, предварительно преобразовав дихотомический признак «пол студента» в ранговый, приписав восьми юношам их средний ранг (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8)/8 = 4,5, а семи девушкам — их средний ранг (9 + 10 + 11 + 12 + 13 + 14 + 15)/7 = 12 (табл. 3.11.2).
Т а б л и ц а 3.11.2
Ранги в рейтингах |
|
|
|
|
|
|
Пол студентов |
|
|
|
|
|
|
||||
ю |
ю |
д |
ю |
д |
д |
ю |
ю |
ю |
д |
ю |
д |
ю |
д |
д |
|||
|
|
||||||||||||||||
по месту на олимпиаде, xi(1) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
||
по полу, xi(2) |
4,5 |
4,5 |
12 |
4,5 |
12 |
12 |
4,5 |
4,5 |
4,5 |
12 |
4,5 |
12 |
4,5 |
12 |
12 |
||
x(1) |
− x(2) |
–3,5 |
–2,5 |
–9 |
–0,5 |
–7 |
–6 |
2,5 |
3,5 |
4,5 |
–2 |
6,5 |
0 |
8,5 |
2 |
3 |
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(xi(1) |
− xi(2) )2 |
12,25 |
6,25 |
81 |
0,25 |
49 |
36 |
6,25 |
12,2520,25 |
4 |
42,25 |
0 |
72,25 |
4 |
9 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для измерения тесноты связи между данными ранжировками воспользуемся вначале ранговым коэффициентом корреляции Спирмэна. Вычислим его оценку:
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
3 |
-7) |
|
|
|
840 |
|
|
|||||
|
|
∑(xi(1) |
- xi(2) )2 |
= 355, N(1) |
= 0, N(2) = |
(8 |
- 8) + (7 |
|
= |
= 70 , |
|||||||||||||||||||||
|
|
|
12 |
|
|
12 |
|
||||||||||||||||||||||||
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
(153 |
-15) |
- 355 - 0 -70 |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
( |
|
|
|
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
9 3 |
|
||||||||||
ˆ |
|
|
|
|
= |
|
|
|
|
6 |
|
|
|
|
|
= |
= 0,278 , |
||||||||||||||
r |
(С) |
|
X |
(1) |
, X |
(2) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
56 |
|
||||||||
|
|
|
|
|
|
1 |
3 |
-15) |
- 2×0 |
|
1 |
3 |
-15) - 2 |
×70 |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
(15 |
|
|
(15 |
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
6 |
6 |
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
т. е., судя по выборке, связь, хоть и незначительная, между номером места и полом студента, при этом чем больше номер места, тем больше ранг студента по признаку «пол», а поскольку мы девушкам приписывали более
высокий ранг по полу, чем юношам, то это означает, что девушки занимают места с большими номерами, т. е. более низкие места.
Можно ли считать, что и в генеральной совокупности связь между номером места и полом студента существует? Проверим гипотезу H0: r(С) (X(1), X(2) ) = 0
при альтернативе H1: r(С) (X(1), X(2) ) ¹ 0. Статистика Tn–2 примет значение
0,27815 - 2 =1,04 , 1- 0,282
критическая точка (на 5%-ном уровне значимости) t0,05;15−2= 2,16 , поэтому нет оснований отвергнуть гипотезу H0: r(С) (X(1), X(2) ) = 0 о несогласованности
места студента на олимпиаде и его пола, т. е. в генеральной совокупности связь между номером места и полом студента не подтверждается.
107
Вычислим теперь оценку рангового коэффициента корреляции Кендалла. Предоставляем студенту проверить, что n =19, U(1) = 0, U(2) = 49 и
ˆt(X(1), X(2) ) = 37030 = 0,235 .
Проверим гипотезу H0: t(X(1), X(2) ) = 0 при альтернативе H1: t(X(1), X(2) ) ¹ 0 . Наблюдаемое значение статистики Z равно
0,235 9×15(15 -1) = 0,235×3 3 =1,22 ,
2(2×15 + 5)
критическая точка (на 5%-ном уровне значимости) z(1−α)/2 = z(1−0,05)/2 = z0,475 = = 1,96, поэтому гипотеза H0: t(X(1), X(2) ) = 0 о несогласованности места сту-
дента на олимпиаде и его пола не отвергается.
Рассчитанный c помощью программы «Bivariate Correlations» пакета SPSS уровень значимости гипотез H0:ˆr(С) (X(1), X(2) ) = 0 и H0: t(X(1), X(2) ) = 0
(при двусторонних альтернативах) составил соответственно 0,315 и 0,298. Таким образом, связь между ранговым и дихотомическим признаками
не является значимой.
3.12. П р и м е р о ц е н к и с в я з и м е ж д у т р е м я п о р я д к о в ы м и с л у ч а й н ы м и в е л и ч и н а м и
В конкурсе «Мисс Университет» участвовали десять девушек. Оценки за конкурс, выставленные четырьмя экспертами, сведены в табл. 3.12.1.
Выясним, насколько согласованным является мнение жюри.
|
|
|
|
|
|
|
Т а б л и ц а |
3.12.1 |
|||
Ранги в рейтингах |
|
|
|
Номера участниц |
|
|
|
|
|||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
10 |
|
|
|
||||||||||
первого эксперта |
1 |
2 |
3,5 |
3,5 |
5 |
9 |
6 |
9 |
7 |
|
9 |
второго эксперта |
3 |
4,5 |
2 |
1 |
6 |
9,5 |
4,5 |
9,5 |
7 |
|
8 |
третьего эксперта |
3 |
2 |
4 |
1 |
5 |
10 |
7 |
8 |
6 |
|
9 |
четвертого эксперта |
2 |
1 |
4 |
3 |
6 |
10 |
6 |
9 |
8 |
|
6 |
Для измерения статистической связи между несколькими ранговыми переменными используется коэффициент конкордации W (X(1), X(2),…, X(m) ) ,
выборочная оценка которого вычисляется по формуле
|
|
|
|
|
|
|
n |
|
m (k) |
|
m(n +1) 2 |
|
||
|
|
|
|
|
|
|
∑ ∑xi |
- |
|
|
|
|||
|
|
|
|
|
|
|
2 |
|
||||||
|
|
|
|
|
(m) |
|
= |
|
|
= |
|
|
|
|
(1) |
|
(2) |
|
|
i 1 |
k 1 |
|
|
|
|
||||
W(X |
|
, X |
|
,…, X |
|
) = |
|
|
|
|
|
|
|
, |
|
|
|
1 |
|
|
|
|
m |
|
|||||
|
|
|
|
|
|
|
|
m2(n3 - n) - m∑N(k) |
|
|||||
|
|
|
|
|
|
|
12 |
|
||||||
|
|
|
|
|
|
|
|
|
|
k=1 |
|
|
где m — число анализируемых ранговых переменных (сравниваемых упорядочиваний, в данном случае — число экспертов m = 4), n — объем вы-
108
борки (число оцениваемых объектов, в данном случае n = 10), x(ik) — значение k-й переменной на i-м элементе выборки (в данном случае — мнение k- го эксперта о выступлении i-й участницы), а поправочные коэффициенты N(k) рассчитываются по той же формуле
|
1 |
m(k) |
((nt(k) )3 − nt(k) ), |
|
N(k) = |
∑ |
|||
|
||||
|
12 t=1 |
|
что и для рангового коэффициента корреляции Спирмэна (m(k) — число групп связанных рангов в k-й ранжировке, а nt(k) — число элементов (рангов), входящих в t-ю группу связанных рангов).
Коэффициент конкордации (как и его оценка) может принимать значения из отрезка [0; 1], причем W (X(1), X(2),…, X(m) ) = 1 тогда и только тогда,
когда все ранжировки (мнения всех экспертов) совпадают; в случае, когда
мнения экспертов различаются, 0 W (X(1), X(2),…, X(m) ) < 1. |
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
Расчет |
|
оценки |
|
коэффициента |
|
|
конкордации |
проиллюстрируем |
||||||||||||||||||||||||
табл. 3.12.2. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Поправочные коэффициенты |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
N(1) = |
(23 − 2) + (33 − 3) |
|
= 2,5, N(2) |
= |
(23 − 2) + (23 − 2) |
= 1, N(3) |
= 0, N(4) = |
(33 − 3) |
= 2 . |
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
12 |
|
|
|
|
|
|
|
|
|
|
|
12 |
|
|
|
|
|
|
|
|
|
12 |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
3.12.2 |
|||||
|
Ранги в рейтингах |
|
|
|
|
|
|
|
|
|
|
|
Номера участниц |
|
|
|
|
|
|
||||||||||||||
|
|
1 |
2 |
|
|
|
3 |
|
|
|
|
4 |
|
|
5 |
6 |
7 |
8 |
|
9 |
10 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
первого эксперта, x(1) |
|
1 |
2 |
|
|
|
3,5 |
|
|
3,5 |
|
5 |
9 |
6 |
9 |
|
7 |
9 |
|
|||||||||||||
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
второго эксперта, x(2) |
|
3 |
4,5 |
|
|
2 |
|
|
|
|
1 |
|
|
6 |
9,5 |
4,5 |
9,5 |
|
7 |
8 |
|
|||||||||||
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
третьего эксперта, x(3) |
|
3 |
2 |
|
|
|
4 |
|
|
|
|
1 |
|
|
5 |
10 |
7 |
8 |
|
6 |
9 |
|
||||||||||
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
четвертого эксперта, x(4) |
|
2 |
1 |
|
|
|
4 |
|
|
|
|
3 |
|
|
6 |
10 |
6 |
9 |
|
8 |
6 |
|
||||||||||
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑xi(k) |
|
|
|
9 |
9,5 |
|
|
13,5 |
|
|
8,5 |
|
22 |
38,5 |
23,5 |
35,5 |
|
28 |
32 |
|
|||||||||||
|
|
k=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
m(n +1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑xi(k) − |
|
|
|
–13 |
–12,5 |
–8,5 |
|
–13,5 |
|
0 |
16,5 |
1,5 |
13,5 |
|
6 |
10 |
|
|||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
k=1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
(k) |
|
m(n +1) 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
∑xi |
− |
|
|
|
|
|
169 |
156,25 |
72,25 |
182,25 |
|
0 |
272,25 |
2,25 |
182,25 |
36 |
100 |
|
||||||||||||||
|
2 |
|
|
||||||||||||||||||||||||||||||
|
k=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
Окончательно получаем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
(1) |
, X |
(2) |
, |
X |
(3) |
, X |
(4) |
) = |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
W(X |
|
|
|
|
|
|
|
|
|
|
|
|
|
= (169 + 156,25 + 72,25 + 182,25 + 0 + 272,25 + 2,25 + 182,25 + 36 + 100) = 0,91. 121 42(103 −10) − 4(2,5 + 1+ 0 + 2)
109
Проверка статистической значимости коэффициента конкордации (т. е.
проверка гипотезы H : W |
(X(1) |
, X(2),…, X(m) ) = 0 при альтернативной гипотезе |
|||
|
|
0 |
|
|
|
H : W (X(1) |
, X(2) |
,…, X(m) ) > 0 ) производится с использованием статистики |
|||
1 |
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
χn−1 |
= m(n -1)W , |
которая в предположении справедливости гипотезы H0 при n > 7 распреде-
лена приблизительно по закону χ2 с n – 1 степенью свободы. Если наблюдаемое значение статистики χ2n−1 оказывается больше критической точки c2α; n−1 , то гипотеза H0 отвергается на уровне значимости a и принимается гипотеза H1.
В задаче значение статистики χ29 составило
4(10 – 1)0,91 = 32,7,
что больше критической точки c2α; n−1 = c20,05; 9 = 16,91, поэтому множественная
ранговая связь признается значимой, т. е. мнения экспертов можно признать согласованными.
3.13. П р и м е р о ц е н к и с в я з и м е ж д у д в у м я к а т е г о р и з о в а н н ы м и с л у ч а й н ы м и в е л и ч и н а м и
и о ц е н к и з а в и с и м о с т и о д н о й в е л и ч и н ы о т д р у г о й
В результате проведенного опроса учащихся девятых классов городских общеобразовательных школ относительно их планов о дальнейшем обучении и фактической реализации этих планов получена комбинационная таблица, представленная в табл. 3.13.1.
Требуется выяснить, зависимы или не зависимы величины X и Y, а
также вычислить значения коэффициентов связи и зависимости.
Т а б л и ц а 3.13.1
Планы опрошенных (Х) |
|
Фактическое распределение (Y) |
|
||
|
|
|
|
||
|
|
1. 10-й класс |
2. Колледж |
3. Лицей |
И т о г о |
1. |
10-й класс |
120 |
40 |
5 |
165 |
2. |
Колледж |
10 |
35 |
10 |
55 |
3. |
Лицей |
15 |
25 |
40 |
80 |
И т о г о |
145 |
100 |
55 |
300 |
Проверим на уровне значимости a = 0,05 гипотезу о независимости
двух изучаемых величин (признаков): «планы опрошенных» и «фактическое распределение», т. е.
H0 : {"i, j pij = pi p j}
против альтернативной гипотезы
H1 : {$i0, j0 pi0j0 ¹ pi p j для i =1,2,…, r, j =1,2,…, s} .
110