Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Корреляционный анализ.docx
Скачиваний:
65
Добавлен:
17.02.2016
Размер:
369.12 Кб
Скачать
  1. Корреляционный анализ неколичественных переменных

В· практических задачах все чаще требуетсяизмерение связей неколичественных переменных – номинальных (атрибутивных, качественных) и ранговых переменных. Это вызваноповышением внимания к изучению социальных процессов, где великадоля нечисловой информации.Развитие конкурентных рынков способствовало разработке методикпостроения рейтингов фирм, банков, учебных заведений и т. д.

Значения номинальных переменных (например: пол, вид, цвет) являются нечисловыми, они означают принадлежность к некоторым классам и не могут быть упорядочены или непосредственно использованы в вычислениях.

Ранговые или порядковые переменные занимают промежуточное положение между количественными и номинальными переменными: их значения упорядочены (состояние больного, степень предпочтения), но не могут быть с уверенностью измерены и сопоставлены количественно. В отличие от количественных данных не позволяют судить о том, насколько больше или меньше выражено качество, поэтому не допускает применения арифметических операций.

  1. Корреляционный анализ ранговых переменных

Кроме ранговых переменных этими методами может быть измерена корреляционная связь между количественными данными, которые не прошли проверку на нормальность. Такие количественные данные можно проранжировать и работать уже с ранжированными данными.

Преобразование количественных данных в порядковые (ранжированные).

  1. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате.

  2. Далее нужно упорядочить данные по возрастанию (если первый ранг присваивается самому маленькому значению) или по убыванию (если первый ранг присваивается самому большому значению). Если встречаются одинаковые значения, то им присваивается СРЕДНИЙ РАНГ.  Формулы расчёта: складываем по порядку ранги повторяющихся значений и делим на количество повторяющихся значений. 

Например, предположим, что наши количественные данные не прошли проверку на нормальность. Следовательно, рассчитывать для них линейный коэффициент корреляции и эмпирическое корреляционное отношение нельзя.

Переведем количественные данные Х и Yв ранговые данныеXиY- присвоим каждому числу его ранг, т.е. его место с начала ряда.

№ п/п

x

y

ранг X()

1

27,068

172,17

1

2

29,889

200,9

2

3

33,158

232,1

3

4

34,444

231,83

4

5

37,299

246,53

5

6

37,554

236,99

6

7

37,755

233,4

7

8

37,909

256,43

8

9

38,348

261,89

9

10

39,137

259,36

10

11

40,37

253,62

11

12

46,298

278,87

12

№ п/п

x

y

ранг Y()

ранг X()

1

27,068

172,17

1

1

2

29,889

200,9

2

2

4

34,444

231,83

3

4

3

33,158

232,1

4

3

7

37,755

233,4

5

7

6

37,554

236,99

6

6

5

37,299

246,53

7

5

11

40,37

253,62

8

11

8

37,909

256,43

9

8

10

39,137

259,36

10

10

9

38,348

261,89

11

9

12

46,298

278,87

12

12

Если бы среди переменных встречались одинаковые числа, то ранги выглядели бы так:

№ п/п

x

y

ранг X ()

ранг Y()

1

27,068

172,17

1

1

2

29,889

200,9

2

2

3

33,158

232,1

3

4

4

34,444

231,83

4

3

7

37,75

233,4

6,5

5

6

37,75

236,99

6,5

6

5

37,75

246,53

6,5

7

8

37,75

256,43

6,5

9

9

38,348

261,89

9

11

10

39,137

259,36

10

10

11

40,37

253,62

11

8

12

46,298

278,87

12

12

Числа, которые имеют порядковые ранги 5, 6, 7, 8 – одинаковые. Следовательно, они одинаково значимы должны иметь одинаковый средний ранг.

Он рассчитывается следующим образом:

.

Для наших данных

= 6,5