Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка-КА.doc
Скачиваний:
11
Добавлен:
08.05.2019
Размер:
130.05 Кб
Скачать

Двумерная корреляционная модель

Рассмотрим случай изучения корреляционной зависимости между двумя признаками x и y. Построение двумерной корреляционной модели предполагает, что данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по двумерному нормальному закону.

Основными задачами корреляционного анализа являются: оценка параметров двумерной нормально распределенной генеральной совокупности (генеральные средняя, дисперсия, коэффициент корреляции); проверка значимости истинного коэффициента корреляции; построение доверительного интервала для истинного коэффициента корреляции в случае его значимости.

Дополнительная задача корреляционного анализа (являющаяся основной в регрессионном анализе), состоит в оценке уравнения регрессии.

Плотность двумерного нормального закона распределения случайной величины (X,Y) имеет вид:

(1)

где

и определяется пятью параметрами:

MX = mx - математическое ожидание случайной величины X;

MY = my - математическое ожидание случайной величины Y;

DX = s2x - дисперсия X;

DY = s2y - дисперсия Y;

- парный коэффициент корреляции.

Для оценки пяти параметров двумерной корреляционной модели извлечем из генеральной совокупности (X, Y) случайную выборку объема n:

( x1, y1 ) , ( x2, y2 ) , ¼ , ( xn, yn ) .

Обработку данных будем производить, пользуясь следующей таблицей:

Таблица 1

X

Y

X2

Y2

XY

·

·

·

·

·

·

·

·

·

·

·

·

·

·

·

xi

yi

x2i

y2i

xiyi

·

·

·

·

·

·

·

·

·

·

Sx

Sy

Sx2

Sy2

Sxy

Точечные оценки генеральных параметров mx, my, s2x, s2y, r вычислим по формулам:

- оценка для mx;

- оценка для my; (2)

- оценка для s2x;

- оценка для s2y;

- оценка для r.

Полученные оценки являются состоятельными, а и также обладают свойствами несмещенности и эффективности.

Парный коэффициент корреляции r в силу своих свойств является одним из самых распространенных способов измерения взаимосвязи между случайными величинами в генеральной совокупности. Для выборочных данных используется эмпирическая мера связи r.

Коэффициент корреляции - величина безразмерная, что позволяет сопоставлять его для разных статистических рядов. Величина его лежит в пределах от -I до I. Значение r = ± I свидетельствует о наличии линейной функциональной зависимости между рассматриваемыми признаками x и y. Если r = 0 , можно сделать вывод, что линейная связь между X и Y отсутствует, однако это не означает, что они статистически независимы. В этом случае не отрицается возможность существования иной формы зависимости между переменными. Положительный знак коэффициента корреляции свидетельствует о прямой линейной зависимости, т.е. с увеличением x увеличивается и y, а отрицательный знак - об обратной линейной зависимости. Чем ближе значение ïr ï к единице, тем связь теснее, приближение ïr ï к нулю означает ослабление линейной зависимости между переменными X и Y.

На практике при изучении зависимости между двумя случайными величинами используют поле корреляции, с помощью которого при минимальных затратах труда и времени можно установить наличие корреляционной зависимости. Поле корреляции представляет собой диаграмму, на которой изображается совокупность значений двух признаков. Варианты распределения точек (xi , yi) на поле корреляции показаны на рис. 1-4.

Y Y

X X

Рис. 1. r = + 0.5 Рис. 2. r = - 0.3

Y Y

X X

Рис. 3. r = + 1 Рис. 4. r = 0

На рис. 1 точки разбросаны не случайно, а имеют тенденцию стабилизироваться в определенном направлении. Чем больше x, тем в общем случае больше y. Линейность этой связи выражается величиной коэффициента корреляции, который в данном случае приблизительно равен + 0.5. На рис. 2 схематично показано поле корреляции при отрицательном коэффициенте корреляции. С ростом x y в среднем уменьшается, а по сравнению с рис. 1 данное поле более “размыто”. На рис. 3 все точки лежат на прямой. Каждому значению x можно однозначно поставить в соответствие значение y. Чем больше x, тем больше y. Следует отметить, что случаи, когда r = ± 1 на практике почти не встречаются. И наконец, на рис. 4 точки случайным образом разбросаны по координатной плоскости. По величине x нельзя сделать вывод об изменении y. Связь между x и y отсутствует, r = 0 или же незначимо отличается от нуля.