Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
119
Добавлен:
31.05.2015
Размер:
2.62 Mб
Скачать

1. Тема: Элементы корреляционного анализа

2. Актуальность темы: корреляционный анализ – это статистический метод, который изучает связь между явлениями природы.

3. Цель занятия: закрепить понятия статистической и корреляционной зависимости. Приобрести навыки в нахождении и проверке значимости выборочного коэффициента линейной корреляции.

3.1. Целевые задачи:

знать: понятие статистической зависимости, тесноты связи, корреляционной зависимости. Уравнения регрессии. Коэффициент линейной корреляции и его основные свойства.

уметь: решать задачи на нахождение коэффициента линейной корреляции.

4. Краткие сведения из теоретического курса Понятие корреляционной зависимости

Две случайные величины могут быть связаны либо функциональной, либо статистической зависимостью, либо быть независимыми. Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действия случайных факторов. Статистической называется зависимость, при которой изменение одной величины влечет за собой изменение другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой, в этом случае статистическую зависимость называется корреляционной.

Корреляционную зависимость Y от Х можно описать с помощью уравнения вида , где– условное математическое ожидание величиныY, соответствующее данному значению х; х – отдельные значения величины Х; f(x) – некоторая функция. Данное уравнение называется уравнением регрессии Y на Х.

Обратную корреляционную связь Х на Y, если она существует можно описать: . Функцииf(x) и называется соответственно регрессиямиy на Х и Х на Y, а их графики – линиями регрессии. В зависимости от вида уравнений регрессии и формы соответствующих линий регрессии говорят о различной форме корреляционной зависимости между изучаемыми величинами – линейной, квадратической и т. д.

Коэффициент линейной корреляции. Понятие тесноты связи

Для полного описания корреляционной связи недостаточно найти форму корреляционной зависимости между величинами.

Целесообразно оценивать степень (тесноту) связи числами, характеризующими «коэффициент полезного действия» выделенного фактора аналогично коэффициенту полезного действия в физике. В случаях, когда изменение У полностью обусловлено изменением только фактора Х, приписывают такой связи факторов Х и У значение 1, отсутствию – 0, а в промежуточных случаях – значение менее 1. Понятие тесноты связи можно рассмотреть графически (рис10.1):

Рис. 10.1. Корреляционные поля точек

В каждом из этих случаев сила связи одинакова, однако разброс отдельных значений Y, соответствующих одним и тем же значениям X, относительно их среднего значения больше на втором рисунке.

Для количественной характеристики тесноты линейной корреляционной связи между двумя величинами Х и Y вводится понятие коэффициента линейной корреляции, определяемого соотношением:

,

где х, у – средние квадратические отклонения.

Свойства коэффициента линейной корреляции

1. Коэффициент корреляции двух независимых случайных величин равен нулю.

2. Коэффициент корреляции двух величин, связанных линейной функциональной зависимостью равен 1 в случае возрастающей зависимости и – 1 в случае убывающей.

3. Абсолютная величина коэффициент корреляции не превышает 1.

На практике имеют дело с ограниченным объемом выборки пар значений величин Х и У, получаемых в результате наблюдений. Первоначально составляется корреляционная таблица, в которую записываются все возможные значения х и у.

Х

х1

х2

хn

У

y1

y2

yn

Построив в прямоугольной системе координат точки (х, ), по характеру их расположения можно определить форму корреляционной зависимости величины У от Х, если эта зависимость наблюдается. Таким образом, графическое изображение полученных результатов позволяет высказать предположение о той или иной форме корреляционной зависимости.

В этих случаях, когда между величинами наблюдается линейная корреляционная зависимость для описания корреляционных зависимостей между величинами Х и У по результатам выборочных наблюдений вводят выборочное уравнение линейной регрессии У на Х и Х на У:

где и– выборочные коэффициенты регрессии, имеющие смысл выборочных оценок соответственно коэффициентов А и С. Для нахождения выборочных коэффициентов регрессии по результатам наблюдений применяется метод наименьших квадратов, позволяющий получить такие параметрыиb (иd), чтобы сумма квадратов отклонений была бы наименьшей. По величине коэффициентов регрессии судят о силе корреляционной связи между изучаемыми величинами. (чем больше коэффициент , тем сильнее изменяется среднее значение величины У при изменении Х, значит сильнее корреляционная связь).

Для оценки тесноты связи между случайными величинами по результатам наблюдений используется выборочный коэффициент корреляции

,

где ;;;

; .

Между выборочным коэффициентом корреляции и коэффициентами регрессии существует связь: или .

Для расчета коэффициента корреляции удобно пользоваться расчетными таблицами или проводить расчеты на компьютере.

Если , то говорят, что связь между двумя величинами слабая;

– умеренная связь;

– значительная связь;

– достаточно тесная;

– сильная связь;

– очень сильная связь.

Решение задач

1.Для изучении взаимного влияния зарплаты и текучести работников на пяти однотипных фирмах с одинаковым числом работников проведены измерения уровня месячной зарплаты Х и числа уволившихся Y в течение года:

Х, тыс. руб.

10

15

20

25

30

Y

50

35

20

20

15

Найти выборочный коэффициент корреляции.