- •Элементы корреляционного анализа
- •Введение
- •Двумерная корреляционная модель
- •Проверка значимости истинного коэффициента корреляции
- •Интервальное оценивание коэффициента корреляции
- •Индивидуальные задания
- •Обозначения и наименования признаков:
- •Образец выполнения индивидуального задания
- •Библиографический список.
- •Приложение 1. Таблица Фишера-Йейтса (фрагмент).
- •Приложение 2. Таблица z-преобразований Фишера
- •Приложение 3. Таблица значений функции ф(t).
- •Элементы корреляционного анализа
- •1997., Протокол , и одобрены
- •654080, Новокузнецк, ул. Кирова,42.
Двумерная корреляционная модель
Рассмотрим случай изучения корреляционной зависимости между двумя признаками x и y. Построение двумерной корреляционной модели предполагает, что данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по двумерному нормальному закону.
Основными задачами корреляционного анализа являются: оценка параметров двумерной нормально распределенной генеральной совокупности (генеральные средняя, дисперсия, коэффициент корреляции); проверка значимости истинного коэффициента корреляции; построение доверительного интервала для истинного коэффициента корреляции в случае его значимости.
Дополнительная задача корреляционного анализа (являющаяся основной в регрессионном анализе), состоит в оценке уравнения регрессии.
Плотность двумерного нормального закона распределения случайной величины (X,Y) имеет вид:
(1)
где
и определяется пятью параметрами:
MX = mx - математическое ожидание случайной величины X;
MY = my - математическое ожидание случайной величины Y;
DX = s2x - дисперсия X;
DY = s2y - дисперсия Y;
- парный коэффициент корреляции.
Для оценки пяти параметров двумерной корреляционной модели извлечем из генеральной совокупности (X, Y) случайную выборку объема n:
( x1, y1 ) , ( x2, y2 ) , ¼ , ( xn, yn ) .
Обработку данных будем производить, пользуясь следующей таблицей:
Таблица 1
X |
Y |
X2 |
Y2 |
XY |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
xi |
yi |
x2i |
y2i |
xiyi |
· |
· |
· |
· |
· |
· |
· |
· |
· |
· |
Sx |
Sy |
Sx2 |
Sy2 |
Sxy |
Точечные оценки генеральных параметров mx, my, s2x, s2y, r вычислим по формулам:
- оценка для mx;
- оценка для my; (2)
- оценка для s2x;
- оценка для s2y;
- оценка для r.
Полученные оценки являются состоятельными, а и также обладают свойствами несмещенности и эффективности.
Парный коэффициент корреляции r в силу своих свойств является одним из самых распространенных способов измерения взаимосвязи между случайными величинами в генеральной совокупности. Для выборочных данных используется эмпирическая мера связи r.
Коэффициент корреляции - величина безразмерная, что позволяет сопоставлять его для разных статистических рядов. Величина его лежит в пределах от -I до I. Значение r = ± I свидетельствует о наличии линейной функциональной зависимости между рассматриваемыми признаками x и y. Если r = 0 , можно сделать вывод, что линейная связь между X и Y отсутствует, однако это не означает, что они статистически независимы. В этом случае не отрицается возможность существования иной формы зависимости между переменными. Положительный знак коэффициента корреляции свидетельствует о прямой линейной зависимости, т.е. с увеличением x увеличивается и y, а отрицательный знак - об обратной линейной зависимости. Чем ближе значение ïr ï к единице, тем связь теснее, приближение ïr ï к нулю означает ослабление линейной зависимости между переменными X и Y.
На практике при изучении зависимости между двумя случайными величинами используют поле корреляции, с помощью которого при минимальных затратах труда и времени можно установить наличие корреляционной зависимости. Поле корреляции представляет собой диаграмму, на которой изображается совокупность значений двух признаков. Варианты распределения точек (xi , yi) на поле корреляции показаны на рис. 1-4.
Y Y
X X
Рис. 1. r = + 0.5 Рис. 2. r = - 0.3
Y Y
X X
Рис. 3. r = + 1 Рис. 4. r = 0
На рис. 1 точки разбросаны не случайно, а имеют тенденцию стабилизироваться в определенном направлении. Чем больше x, тем в общем случае больше y. Линейность этой связи выражается величиной коэффициента корреляции, который в данном случае приблизительно равен + 0.5. На рис. 2 схематично показано поле корреляции при отрицательном коэффициенте корреляции. С ростом x y в среднем уменьшается, а по сравнению с рис. 1 данное поле более “размыто”. На рис. 3 все точки лежат на прямой. Каждому значению x можно однозначно поставить в соответствие значение y. Чем больше x, тем больше y. Следует отметить, что случаи, когда r = ± 1 на практике почти не встречаются. И наконец, на рис. 4 точки случайным образом разбросаны по координатной плоскости. По величине x нельзя сделать вывод об изменении y. Связь между x и y отсутствует, r = 0 или же незначимо отличается от нуля.