Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Met1.doc
Скачиваний:
93
Добавлен:
05.12.2018
Размер:
2.43 Mб
Скачать

3.1. Корреляционный анализ

Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи: отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними; обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии.

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Ковариация между двумя переменными рассчитывается следующим образом:

,

где - фактические значения случайных переменных x и y,

. .

ковариация - это статистическая мера взаимодействия двух случайных переменных, таких, например, как доходности двух ценных бумаг. Положительное значение ковариации показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону.

Ковариация зависит от единиц, в которых измеряются переменные ..

Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции.

При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n –наблюдений; хik – i-ое наблюдение k-ой переменной. Основными средствами анализа данных являются парные коэффициенты корреляции, частные коэффициенты корреляции и множественные коэффициенты корреляции.

Коэффициент парной корреляции

Для двух переменных теоретический коэффициент корреляции определяется следующим образом:

.

где - дисперсии случайных переменных , а их ковариация.

Парный коэффициент корреляции является показателем тесноты связи лишь в случае линейной зависимости между переменными и обладает следующими основными свойствами:

Коэффициент корреляции принимает значение в интервале (-1,+1), или

|xy| < 1.

Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т.е.

 (α1X+β; α2Y+β)= xy,

где α1, α2,  - постоянные величины, причем α1>0, α2>0.

Случайные величины Х, Y, можно уменьшать (увеличивать) в α раз, а также вычитать или прибавлять к значениям одно и тоже число β - это не приведет к изменению коэффициента корреляции .

При = ±1 случайные величинысвязаны линейной зависимостью, т.е. .

При = 0 линейная корреляционная связь отсутствует.

В практических расчетах коэффициент корреляции генеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции r, так как выборочная совокупность переменных случайна, то в отличие от параметра , r – случайная величина. Оценкой коэффициента корреляции является выборочный парный коэффициент корреляции:

= , (3.1)

где - оценки дисперсий величин .

Для оценки значимости коэффициента корреляции применяет­ся t - критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:

(3.2)

Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.

Если tнабл > tкр, то полученное значение коэффициента корре­ляции признается значимым (то есть нулевая гипотеза, утвер­ждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми перемен­ными есть тесная статистическая взаимосвязь.

Если значение близко к нулю, связь между переменными слабая. Если случайные величины связаны положительной корреляцией, это означает, что при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если случайные величины связаны отрицательной корреляцией, это означает, что при возрастании одной случайной величины, другая имеет тенденцию в среднем убывать.

Коэффициенты парной корреляции используются для измерения силы линейных связей различных пар признаков из их множества. Для множества m признаков n наблюдений получают матрицу коэффициентов парной корреляции R.

(3.3)

Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим, в многомерном корреляционном анализе рассматривается две задачи:

  1. Определение тесноты связи одной случайной величины с совокупностью остальных (m – 1) величин, включенных в анализ;

  2. Определение тесноты связи между величинами при фиксировании или исключении влияния остальных k величин, при k<(m-2).

Эти задачи решаются с помощью коэффициентов множественной и частной корреляции, соответственно.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]