Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
корреляционный анализ 23 тираж..doc
Скачиваний:
17
Добавлен:
26.03.2016
Размер:
5.49 Mб
Скачать

2. Расчёт основных аналитических характеристик тесноты связи

2.1. Коэффициент ковариации

Примечание 1: коэффициент ковариации определяется как среднее произведений отклонений от выборочных средних значений ив соответствии с формулой (1),показывающей, что ковариация тем более значительна, чем больше высокое отклонение от сочетается с высоким отклонениемот для каждой пары из n точек данных:

cov (x y) = (1)

2.1.1. Открыть функцию КОВАР (рис. 3).

Рис. 3. Аргументы функции КОВАР

2.1.2. Рассчитать для своего варианта данных коэффициент ковариации, подставляя в «Массив 1» значения отклика Y, а в «Массив 2» - значения фактора X или наоборот (проверить, что результат от этого не изменится).

2.1.3. Открыть инструмент анализа данных «Ковариация» (рис. 4) и рассчитать ковариацию, подставляя во «Входной интервал» (в отличие от функции) общий массив значений отклика Y и фактора X. (Массив должен быть сплошным, то есть строки или столбцы, содержащие анализируемые данные, должны располагаться рядом). При этом следует указать, как расположены Y и X – по строкам или по столбцам, и поставить «галочку» в окне «Метки в первой строке», если значения Y и X озаглавлены слева или сверху.

Рис. 4. Инструмент анализа данных «Ковариация»

2.1.4. Сравнить значения ковариации, рассчитанные Вами с использованием функции КОВАР, и значения в «матрице ковариации», полученные с помощью инструмента анализа данных для всех сочетаний задаваемых строк или столбцов.

2.1.5. Сравнить Вашу величину ковариации с величинами ковариации, полученными другими студентами, и убедиться, что они могут принимать неограниченные значения по величине и размерности (при переходе к другой единице измерения, например, от метров к сантиметрам, значение ковариации также изменяется, см. формулу 1).

Примечание 2:

– обращение в нуль ковариации переменных X и Y является не достаточным, а только необходимым условием для суждения об их независимости;

– ненулевое значение ковариации говорит о некоторой связи СВ, но не позволяет судить о степени тесноты и достоверности этой связи.

2.2. Коэффициент парной корреляции

Примечание 3: коэффициент парной корреляции (обозначается r или ρ), называется также «коэффициентом линейной корреляции Пирсона» и определяет степень пропорциональности друг другу соответствующих значений переменных Y и X (формулы 2 и 3).

, (2)

,

(3)

где σx (Sx), σy (Sy) – среднеквадратические отклонения (СКО) генеральных совокупностей (или оценки СКО для выборок) переменных X и Y.

2.2.1. Открыть статистическую функцию КОРРЕЛ, аналогичную по своей структуре функции КОВАР, см. рис. 3.

2.2.2. Рассчитать для своего варианта данных коэффициент корреляции аналогично тому, как это сделано по п. 2.1.2, подставляя в «Массив 1» значения отклика Y, а в «Массив 2» – значения фактора X или наоборот (убедиться, что результат от этого не изменится).

2.2.3. Открыть статистическую функцию ПИРСОН (в последних версиях MS Excel следует использовать функцию PIRSON) и рассчитать коэффициент корреляции аналогично п. 2.2.2.

2.2.4. Открыть инструмент анализа данных «Корреляция».

2.2.5. Рассчитать коэффициент корреляции, используя инструмент анализа данных «Корреляция», аналогично п. 2.1.4. При выборе места выходного диапазона (см. рис. 4) указать «текущий лист» и ввести ссылку, указывающую левую верхнюю ячейку желаемого выходного диапазона.

2.2.6. Сравнить значения коэффициента корреляции, рассчитанные с использованием статистических функций КОРРЕЛЯЦИЯ, ПИРСОН и значения коэффициента корреляции в «матрице корреляций», полученной инструментом анализа данных «Корреляция». Сделать заключение по результатам сравнения.

2.2.7. Рассчитать СКОX и СКОY (функция СТАНДОТКЛ).

2.2.8. Проверить выполнение формулы (3), связывающей коэффициенты корреляции и ковариации, характеризующие степень линейной связи величин Х и Y (коэффициент корреляции равен ковариации двух переменных, делённой на произведение их стандартных отклонений, формула 3).

Примечание 4:

– коэффициент корреляции (как и коэффициент ковариации) показывает, в какой степени при возрастании одной СВ другая проявляет тенденцию также возрастать (или, наоборот, убывать). В первом случае (rxy > 0) СВ связаны «положительной корреляцией», во втором случае (rxy < 0) наблюдается «отрицательная корреляция»;

– значения безразмерного коэффициента корреляции (в отличие от коэффициента ковариации) колеблются в ограниченных рамках от –1 до +1; поэтому коэффициент корреляции r является более наглядной и чаще используемой характеристикой «тесноты» связи, чем коэффициент ковариации, изменяющийся от +∞ до –∞ и имеющий размерность, равную произведению размерностей величин X и Y;

– коэффициент корреляции, равный ±1, указывает на функци­ональную (причём линейную) зависимость между переменными.

2.3. Квадрат коэффициента корреляции (r2) и его значение

Примечание 5: коэффициент детерминации (R2) в общем случае представ­ляет собой множественный коэффициент корреляции в квад­рате и определяет, какая доля вариации результативного признака обусловлена изменением факторов, входящих в регрессионную модель [5, 10].

2.3.1. Открыть статистическую функцию КВПИРСОН (рис. 5), которая предназначена для расчёта квадрата коэффициента корреляции Пирсона r2, представляющего собой частный случай коэффициента детерминации R2 для парной линейной зависимости.

Рис. 5. Аргументы функции КВПИРСОН

Примечание 6: квадрат коэффициента корреляции r2 так же, как коэффициент детерминации R2, но в частном случае однофакторной зависимости характеризует, насколько хорошо модель описывает («аппроксимирует») экспериментальные точки. Чем больше r2 (изменяющийся, как и R2 от 0 до +1), тем больше результат (отклик) зависит от факторов, учитываемых регрессионной моделью, и тем меньше отклонения фактических значений отклика от значений, определяемых регрессионной моделью. Иначе: чем больше r2, тем больше общая дисперсия отклика определяется факторами, учитываемыми регрессионной моделью. Наоборот: чем меньше r2, тем меньше отклик зависит от факторов, учитываемых регрессионной моделью, а полная дисперсия отклика больше определяется действием случайных и неучтённых факторов [5, 10].

2.3.2. Подставляя массивы ячеек предиктора и отклика в «Известные_значения» x и y, получить значение r2. (Практическое использование коэффициента детерминации, показывающего степень аппроксимации экспериментальных точек аналитической зависимостью, особенно эффективно, когда эти аналитические зависимости можно оперативно изменять, подбирая оптимальную зависимость с максимальным коэффициентом r2, см. главу 5).