Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по статистике_часть2 _2012.docx
Скачиваний:
6
Добавлен:
26.09.2019
Размер:
59.65 Кб
Скачать

Понятие меры связи

Для измерения силы связи разработаны специальные коэффициенты, называемые мерами связи. Коэффициентов существует столько же, сколько и моделей связи, т. е. для каждой модели связи существует свой коэффициент.

Общие свойства мер связи

  1. Значения коэффициентов изменяются в интервале [0;1] для ненаправленных связей, и [-1;1] – для направленных.

  2. Значения коэффициентов, равное нулю, может свидетельствовать

а) об отсутствии связи между признаками

б) о том, что выбранная модель не соответствует характеру

связи

  1. Значение коэффициента связи близкое к 1 свидетельствует о наличии сильной ненаправленной или сильной положительной связи.

  2. Значение коэффициента близкое к –1 свидетельствует о наличии сильной отрицательной связи.

  3. Значение коэффициента равное 1 или –1 свидетельствует о наличии полной связи в терминах выбранной модели.

  4. Выборочное значение коэффициента является статистически значимым, если по нему можно заключить, что значение коэффициента для генеральной совокупности будет отличаться от нуля.

Примеры наиболее распространенных моделей статистической связи

Таблица сопряженности

Таблица частот представляет собой совместное распределение двух переменных.

Строки таблицы образуются значениями одной переменной.

Столбцы таблицы образуются значениями второй переменной.

В клетке таблицы (на пересечении строки и столбца) указывается частота совместного появления соответствующих значений.

Суммы частот по строке или по столбцу называются маргинальными частотами.

Распределения маргинальных частот представляют собой одномерные распределения переменных.

В таблице сопряженности могут быть представлены как абсолютные, так и относительные частоты (по отдельности или одновременно).

Для определения силы связи в таблице сопряженности используются следующие коэффициенты:

  • для двух номинальных или порядковых переменных сила связи измеряется с помощью коэффициента контингенции (С), либо коэффициента Крамера (V)

  • для двух дихотомических переменных теснота связи может измеряться с помощью коэффициента Фи (Ф)

Тема 10. Меры парной связи, основанные на рангах

Опр. Ранжирование — это процедура упорядочивания любых объектов по возрастанию или убыванию некоторого их свойства при условии, что они этим свойством обладают.

Например, можно ранжировать респондентов по степени удовлетворенности чем-то, по их политической активности, по их материальному положению. Можно ранжировать государства по уровню жизни, по уровню рождаемости, по уровню безработицы и т. д.. Профессии — по престижности, товары — по предпочтению потребителей.

Объектами ранжирования являются те объекты, которые непосредственно упорядочиваются.

Основание ранжирования или (ранжирующий признак) — это то свойство, по которому объекты упорядочиваются.

В результате ранжирования получаем ранжированный ряд, в котором каждому объекту приписывается ранг.

Ранг — это место объекта в ранжированном ряду.

Число мест и соответственно число рангов равно числу объектов.

Ранжированные ряды могут быть двух видов:

  1. Каждый объект имеет значение признака, отличное от значений признака для других объектов, тогда каждому объекту ранжированного ряда соответствует свой собственный, отличный от другого ранг.

  2. Несколько объектов имеют одинаковые значения признака, тогда этим объектам в ранжированном ряду соответствуют одинаковые ранги, рассчитываемые по определенной формуле. В этом случае ранжированный ряд называется ранжированным рядом со связанными рангами.

Пример 1: В качестве ранжируемых объектов выступают 9 государств. Рассматриваются 2 признака:

1. (Х) показатель качества жизни (коэффициент).

2. (У) уровень безработицы, измеряемый в %.

Необходимо проранжировать государства по двум выделенным признакам.

Государства

А

Б

В

Г

Д

Е

Ж

З

И

(Х) Качество жизни

6,8

7,0

6,5

5,9

4,6

5,7

4,5

5,8

4,0

(У) Уровень безработицы

20,3

18,0

19,8

23,4

21

25

21,6

20,8

24

Ранги по (Х)

2

1

3

4

7

6

8

5

9

Ранги по (У)

7

9

8

3

5

1

4

6

2

Ранги присваиваются в порядке убывания значения признака, т. е. 1 соответствует н6аибольшему значению, а 9 — наименьшему.

Пример 2. Ранжированный ряд со связанными рангами.

Для семи работников предприятия определялся показатель удовлетворенности работой (индекс). Необходимо проранжировать работников предприятия по их удовлетворенности работой.

Работники

А

Б

В

Г

Д

Е

Ж

Удовлетворенность работой (индекс)

0,57

0,35

0,35

0,28

0,41

0,41

0,41

Ранги

1

5,5

5,5

7

3

3

3

Работники (Б и В) и (Д, Е, Ж) имеют одинаковые показатели удовлетворенности работой, следовательно, им необходимо присвоить связанные ранги.

Для индекса 0,41 (Д, Е, Ж) ранг рассчитывается следующим образом:

(2+3+4)/3 = 3.

Для индекса 0,35 (Б и В) ранг рассчитывается следующим образом:

(5+6)/2=5,5.

Всего семь объектов, значит, в ранжированном ряду должно быть семь рангов.

Установление наличия связи для двух и более ранжированных радов осуществляется с помощью ранговых коэффициентов связи.

Опр. Ранговыми коэффициентами связи называются меры связи, позволяющие вычислять степень согласованности в ранжировании одних и тех же объектов по двум различным основаниям или по двум различным признакам.

Существует несколько коэффициентов (мер связи), предназначенных для изучения степени согласованности ранжированных рядов.

Наиболее распространенным является коэффициент ранговой корреляции Спирмена.

Допустим, что N объектов могут быть упорядочены как по признаку Х, так и по признаку У.

Пусть Rxi – ранг i-го объекта по признаку Х

Ryi – ранг i-го по признаку У, тогда

di = Rxi - Ryi — мера несовпадения рангов.

Коэффициент ранговой корреляции Спирмена будет иметь вид:

6 ∑ di 2

ρ = 1– ----------------

N (N2 -1)

Примеры

Пример 1.

Государства

А

Б

В

Г

Д

Е

Ж

З

И

(Х) Качество жизни

6,8

7,0

6,5

5,9

4,6

5,7

4,5

5,8

4,0

(У) Уровень безработицы

20,3

18,0

19,8

23,4

21

25

21,6

20,8

24

Ранги по (Х)

2

1

3

4

7

6

8

5

9

Ранги по (У)

7

9

8

3

5

1

4

6

2

|di |

5

8

5

1

2

5

4

1

7

di2

25

64

25

1

4

25

16

1

49

di2 = 210,

 = 1– 6*210/ 9(81 – 1) = – 0,75

Связь существует, связь сильная и обратная.

Осуществим проверку статистической гипотезы о значимости коэффициента ранговой корреляции Спирмена для ГС.

Коэффициент значим, если его значение для генеральной совокупности отлично от нуля.

H0 :  = 0

H1 : 0

Вычислим статистику критерия

по формуле статистического критерия tH = ρ(n -2)/(1 - 2)

tH = –0,75  (9–2)/(1 – 0,752) = -2,65

Определим значения критической точки по статистической таблице распределения t-Стьюдента при  = 0,05.

Число степеней свободы определим по формуле df= n-2

t кр = t (0,975;7) = 2,36

|tH | > t кр подтвердилась H1 и коэффициент значим для ГС

Коэффициент

Опр. Коэффициент  — это разность между вероятностями правильного и неправильного порядка для двух наблюдений, извлеченных из совокупности случайно, при условии, что связанные ранги отсутствуют.

Возьмем пару объектов.

Ранги соответствующие первому объекту обозначим (i1 j1)

Ранги соответствующие второму объекту обозначим (i2 j2), тогда коэффициент  – Гудмана и Краскала имеет вид:

S – D

= ———— , где

S + D

S – общее число пар объектов с согласующимся порядком по обоим объектам.

i1 > i2 и j1 > j2

i1 < i2 и j1 < j2

D – общее число пар объектов с несогласующимся порядком по обоим объектам.

i1 > i2 и j1 < j2

i1 < i2 и j1 > j2

Пример 2.

Имеются данные об удовлетворенности учебой (Х) и уверенностью в дальнейшем трудоустройстве (У) для студентов 6-ти гуманитарных специальностей.

психологи

социологи

историки

политологи

культурол

Филологи

(Х) Удовлетворенность учебой (индекс)

2,45

2,5

3,8

3,1

1,8

2,0

(У) Уверенность в трудоустр. (индекс)

0,66

0,78

0,4

0,5

0,44

0,38

Ранг по Х

4

3

1

2

6

5

Ранг по У

2

1

5

3

4

6

Для расчета коэффициента  необходимо упорядочить объекты по возрастанию рангов по Х или по У.

Упорядочим объекты по возрастанию рангов признака У.

социологи

психологи

политологи

Культур.

историки

филологи

Ранг по Х

3

4

2

6

1

5

Ранг по У

1

2

3

4

5

6

S= 3+ 2+ 2+ 0 +1= 8

D = 2+ 2+ 1 +2+ 0= 7

= (S–D)/(S+D) = (8-7)/(8+7) = 0,07 Связь прямая, но очень слабая.

Осуществим проверку статистической гипотезы о значимости коэффициента  для ГС.

Коэффициент значим, если его значение для генеральной совокупности отлично от нуля.

H0 : = 0

H1 :  0

Вычислим статистику критерия

по формуле статистического критерия ZH = (S+D)/n(1 - 2)

ZH = *(S+D)/n(1 - 2)= 0,07*15/6(1-0,072)= 0,11

Определим значения критической точки по статистической таблице стандартного нормального распределения  = 0,05.

Zкр.= 1,96

|ZH | < Z кр подтвердилась H0 и коэффициент незначим для ГС

Задачи для самостоятельного решения:

Задача 1. Имеются данные опроса 10 респондентов об уровне их занятий бегом и уровне самооценке. Замеры производились по 20-ти балльной шкале. Предполагается, что между этими оценками существует достаточно сильная связь.

Необходимо:

  • проранжировать объекты по Х и по У;

  • рассчитать коэффициент Спирмена и проинтерпретировать его;

  • проверить значимость полученного коэффициента для генеральной совокупности.

Оля

Игорь

Нина

Валя

Света

Антон

Сергей

Ира

Нат.

Юля

(Х) Уровень занятий бегом

18

17

15

12

10

9

8

8

5

1

(У) Уровень самооценки

15

18

12

16

6

10

8

7

5

2

Ранг по Х

Ранг по У

|di |

di2

Задача 2.

Имеются данные опроса 7 работников об уровне удовлетворенности работой и уровне удовлетворенности зарплатой.

Необходимо:

  • проранжировать объекты по Х и по У;

  • рассчитать коэффициент Спирмена и проинтерпретировать его;

  • проверить значимость полученного коэффициента для генеральной совокупности.

Работники

А

Б

В

Г

Д

Е

Ж

(Х) Удовлетворенность работой (индекс)

0,57

0,35

0,35

0,28

0,41

0,41

0,41

(У) Удовлетворенность зарплатой (индекс)

0,45

0,56

0,2

0,35

0,5

0,3

0,7

Ранги по Х

Ренги по У

|di |

di2

Задача 3.

Вычислить коэффициент  для двух ранжированных рядов.

Показатель IQ

100

101

120

115

112

108

118

106

Оценка теста по математике

15

18

20

17

13

11

19

12

Проверить значимость полученного коэффициента.