Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Раздел 6 Корреляционный анализ (неполный конспе...doc
Скачиваний:
6
Добавлен:
21.11.2019
Размер:
267.26 Кб
Скачать

§5. Коэффициент взаимной сопряженности.

Для определения степени сопряженности между качественными признаками с числами вариант, большими двух, служит коэффициент взаимной сопряженности или полихорический показатель связи, предложенный К. Пирсоном: ,

где – величина , в которой fxy обозначает частоты в клетках многопольной корреляционной таблицы, а fx и fy – суммы частот по строкам и столбцам той же таблицы; N = fx + fy – общая сумма частот, или объем выборки.

Пирсоновский коэффициент взаимной сопряженности (С) имеет один существенный недостаток: его значение значительно зависит от количества вариант коррелируемых качественных признаков.

Учитывая этот недостаток, А.А. Чупров внес поправки в формулу и получил следующее выражение:

.

Здесь К – коэффициент взаимной сопряженности Чупрова; nx и ny – численность групп по строкам и столбцам многопольной таблицы; N – объем выборки. Остальные символы объяснены выше. Нулевую гипотезу отвергают, если для принятого уровня значимости и числа степеней свободы.

Задача. Исследовалась зависимость между цветом волос и цветом глаз у человека. Результаты наблюдений приведены в таблице. Можно ли считать, что между этими показателями есть связь?

Цвет глаз

Цвет волос

Блондины

Шатены

Рыжие

Голубые

170

80

5

Серые

70

152

8

Карие

68

340

7

Решение.

§6. Частная корреляция.

Название впервые было использовано в работе Д.Юла в 1907 году. Смысл состоит в следующем: очень часто 2 переменные коррелируют друг с другом только за счет того, что обе они согласованно изменяются под влиянием третьей. На самом деле связи между ними нет, но статистически это выявляется.

Для вычисления частной корреляции используется формула:

,

где - коэффициент линейной корреляции между переменными X и Y, - коэффициент линейной корреляции между переменными X и Z, - коэффициент линейной корреляции между переменными Y и Z.

Если Z линейно коррелирует с X и Y, то частная корреляция при любом фиксированном значении Z.

Аналогично можно построить частные корреляционные зависимости XZ(Y) и YZ(X). Для оценки достоверности коэффициентов используется также коэффициент Стьюдента с числом степеней свободы .

Замечания:

§7. Выбор метода корреляционного анализа экспериментальных данных

При решении задачи оценки взаимосвязи между исследуемыми переменными нередко возникает вопрос: какому показателю следует отдать предпочтение? Ответ на этот вопрос не может быть однозначным. Дело в том, что параметрический пирсоновский коэффициент корреляции достаточно точно характеризует линейную связь, когда коррелируемые при­знаки x и y имеют нормальное или логнормальное распределение, т. е. такое, при котором не сама случайная величина, а логарифмы ее значений распределяются нормально. Коэффициент корреляции рангов характеризует корреляционную связь независимо от закона распределения. И все же, если коррелируемые признаки распределяются нормально, предпочтение следует отдавать пирсоновскому коэффициенту корреляции, как более мощному показателю связи между переменными y и x, по сравнению с коэффициентом Спирмена. В тех случаях, когда коррелируемые признаки не распределяются нормально, необходимо исследовать непараметрические показатели связи.

Коэффициент ранговой корреляции Спирмена и другие непараметрические показатели независимы от закона распределения и в этом их большая ценность. Они позволяют измерять тесноту сопряженности между такими признаками, которые не поддаются непосредственному измерению, но могут быть выражены баллами или другими условными единицами, позволяющими ранжировать выборку. Ценность коэффициента корреляции рангов заключается также в том, что он позволяет быстро оценивать взаимосвязь между признаками независимо от закона распределения.