Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
101
Добавлен:
10.06.2015
Размер:
414.21 Кб
Скачать

Коэффициент взаимной сопряженности Пирсона

(рассчитывается на основе показателя ):

, (7)

где n – число единиц наблюдения.

Если ввести обозначение , то (7) запишется так:

, (8)

причем можно рассчитатьсамостоятельно, без расчета :

. (9)

Пример (по табл. 9.4):

.

Коэффициент взаимной сопряженности Чупрова

(рассчитывается на основе показателя ):

= , (10)

где и– соответственно число строк и граф в таблице.

Всегда <, поэтому рассчитыватьдля таблицы «четырех полей » не рекомендуется, т.к. он будет больше.

3.4. Изучение тесноты связи между двумя количественными признаками

Связь между количественными признаками измеряется через их вариацию. Измерить зависимость (связь) между двумя коррелирующими величинами – значит определить, насколько вариация результативного признака обусловлена вариацией факторного признака.

В качестве показателей тесноты связи между количественными признаками наиболее часто используются линейный коэффициент корреляции, коэффициенты корреляции рангов, эмпирическое корреляционное отношение, теоретическое корреляционное отношение, коэффициент Фехнера.

3.4.1. Линейный коэффициент корреляции

Линейный коэффициент корреляции применим лишь в случае линейной зависимости между признаками.

Если форма связи между х и у не определена, его рассчитывают с целью получить ответ на вопрос, можно ли считать зависимость линейной.

Линейный коэффициент корреляции может быть построен на основе отклонений индивидуальных значений х и у от соответствующей средней величины, причем учитываются не только знаки, но и значения отклонений () и () (ср. скоэффициентом Фехнера), выраженные для сопоставимости в единицах среднего квадратического отклонения каждого признака, т.е. как нормированные отклонения t:

и ,

где , соответственно среднее квадратическое отклонение в ряду х и у.

Линейный коэффициент корреляции представляет собой среднюю величину из произведений нормированных отклонений для х и у:

(11)

или

. (12)

Величина называетсяковариацией, поэтому другое определение r такое:

Линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений.

В литературе встречаются и другие формы записи формулы для r; все они получены путем соответствующих несложных преобразований формулы (11). Эти формулы, в частности, следующие:

, (11, а)

, (11, б)

, (11, в)

, (11, г)

где коэффициент регрессии в уравнении связи.

Линейный коэффициент корреляции может принимать следующие значения:

, (13)

причем знак определяется в ходе решения (см. (11,а)):

а) >, тоr имеет знак «+» прямая связь между х и у;

б) <, тоr имеет знак «» обратная связь между х и у;

в) =, тоr =0, что означает в одних случаях отсутствие связи между х и у, в других случаях отсутствие линейной взаимосвязи между х и у;

г) |r| = 1 функциональная зависимость между х и у (следовательно всякое промежуточное значение |r| от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной).

Проверка коэффициента корреляции на значимость (существенность).

1). n > 50.

Вычисляется средняя ошибка коэффициента корреляции:

, (14)

если , тоr считается значимым (существенным), а связь – реальной.

При вероятности 0,997, для которой коэффициент доверия t=3, доверительные границы r составят:

.

1). n < 30.

А. Вычисляется средняя ошибка коэффициента корреляции (при n < 30):

(14)

и значимость r проверяется на основе t-критерия Стьюдента. При этом выдвигается и проверяется нуль-гипотеза оравенстве r нулю, т.е. об отсутствии связи между х и у в генеральной совокупности.

Б. Определяется расчетное значение критерия:

. (15)

В. Из таблиц с заданными параметрами (с уровнем значимости = 0,05 и числом степеней свободы=n – 2) находят .

Г. Сопоставляют с:

  • если >, то нулевая гипотезаотвергается и линейный коэффициент r считается значимым, а связь между х и у – реальной;

  • если <, то нулевая гипотезане отвергается и линейный коэффициент r считается незначимым, т.е. считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно.

Соседние файлы в папке регрессия_Лекции_10-11