Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Анализ взаимосвязей.doc
Скачиваний:
19
Добавлен:
29.03.2015
Размер:
160.26 Кб
Скачать

Определение тесноты связи в зависимости от величины коэффициента корреляции

Величина коэффициента корреляции

Характер связи

До 0,3

0,3 - 0,5

0,5 - 0,7

0,7 - 1,0

Практически отсутствует

Слабая

Умеренная

Сильная

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением факторного признака увеличивается и результативный, и наоборот, с уменьшением факторного признака уменьшается и результативный признак (чем выше квалификация рабочего, тем выше уровень производительности); при обратной увеличение факторного признака приводит к уменьшению результативного (чем выше производительность труда, тем ниже себестоимость продукции).

По аналитическому выражению выделяют связи прямолинейные и нелинейные. Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, степенной, показательной и т.д.), то такую связь называют нелинейной.

Коэффициент парной корреляции является случайной величиной. С уменьшением числа наблюдений надежность коэффициента корреляции падает. С увеличением числа наблюдений (свыше 500) распределение коэффициента корреляции r (не превышающее 0,9) стремится к нормальному.

Значимость коэффициента корреляции можно проверить по общему правилу проверки статистических гипотез:

– если tрtкр, нулевую гипотезу о том, что между X и Y отсутствует корреляционная связь (то есть r = 0), нельзя отклонить на заданном уровне значимости .

– если tрtкр, нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля (r  0), то есть между X и Y существует линейная корреляционная зависимость.

Расчетное значение критерия tр (формула 1) подчиняется закону распределения Стьюдента с (n - 2) степенями свободы:

. (1)

Критическое значение tкр определяется по таблице распределения Стьюдента по уровню значимости  и числу степеней свободы k = n - 2.

Регрессионный анализ заключается в определении аналитического выражения связи. Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму

Уравнение регрессии позволяет определить, каким в среднем будет значение результативного признака Y при том или ином значении факторного признака X, если остальные факторы, влияющие на Y и не связанные с X, рассматривались неизменными.

К задачам регрессионного анализа относятся:

1) установление формы зависимости;

2) определение функции регрессии;

3) оценка неизвестных значений зависимой переменной (то есть прогнозирование).

По аналитическому выражению различают прямолинейную и криволинейную связи. Криволинейная форма связи может выражаться различными кривыми, из которых простейшими являются парабола второго порядка и гипербола.

Прямолинейная связь имеет место, когда с возрастанием (убыванием) значений X значения Y увеличиваются (уменьшаются) более или менее равномерно. В этом случае уравнение связи записывается так:

yx = a0 + a1x , (2)

где a1 – это коэффициент регрессии, показывающий, на сколько единиц изменится в среднем Y при изменении X на 1 единицу. Если a1  0, то наблюдается положительная связь (то есть при увеличении X Y также увеличивается), если a1  0, связь отрицательная;

a0 – свободный член уравнения регрессии. Его интерпретация зависит от того, какой смысл имеют изучаемые признаки.

По аналитическому выражению различают прямолинейную и криволинейную связи. Криволинейная форма связи может выражаться различными кривыми, из которых простейшими являются парабола второго порядка и гипербола.

В многофакторном регрессионном анализе на основе коэффициентов регрессии нельзя сказать, какой из факторных признаков оказывает наибольшее влияние на результативный признак, так как коэффициенты регрессии между собой несопоставимы.

Различия в единицах измерения факторов устраняют с помощью частных коэффициентов эластичности (формула 3):

Эi = ai  (xi / yi) , (3)

где ai – коэффициент регрессии при i-ом факторе;

xi – среднее значение i-го фактора;

yi – среднее значение изучаемого показателя.

В практике статистических исследований приходится иногда анализировать тесноту связи между альтернативными признаками, представленными только группами с противоположными (взаимоисключающими) характеристиками. Для определения тесноты связи таких качественных признаков применяются коэффициенты ассоциации и контингентации (см. табл.1). При исследовании связи числовой материал располагают в виде таблиц сопряженности:

A

b

a + b

C

d

c + d

a + c

b + d

a + b + c + d

Коэффициент контингентации всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если коэффициент ассоциации  0,5 или коэффициент контингентации  0,3.

В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам, например, рангам.

Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.

Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Данные ранги называют связными. Среди непараметрических методов оценки тесноты связи наибольшее значение имеет коэффициент Спирмена. Этот коэффициент может быть использован для определения тесноты связи как между количественными, так и между качественными признаками, при условии, что их значения упорядочены по степени возрастания или убывания.

Коэффициент корреляции рангов Спирмена рассчитывается в случае, когда нет связных рангов по формуле 4:

Коэффициент корреляции рангов Спирмена = (4)

где di² – квадрат разности рангов;

n – число пар рангов (число наблюдений).

Значимость коэффициента корреляции рангов Спирмена проверяется на основе t-критерия Стьюдента.

Задача: Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлекательность гостиницы в зависимости от ее расстояния до пляжа. С этой целью по 14 гостиницам города была выяснена среднегодовая наполняемость номеров и расстояние в километрах до пляжа.

Расстояние, км.

0,1

0,1

0,2

0,3

0,4

0,4

0,5

0,6

0,7

0,7

0,8

0,8

0,9

0,9

Наполняемость, %

92

95

96

90

89

86

90

83

85

80

78

76

72

75

Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при  = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Сделайте прогноз, какова будет наполняемость гостиницы, если расстояние до пляжа 1 км.