- •Часть 3
- •Лабораторная работа №3 Установление линейной корреляционной связи между двумя случайными величинами
- •§ 1.1. Краткие теоретические сведения
- •§ 1.2 План выполнения работы и алгоритм расчетов
- •§ 1.3 Образец выполнения лабораторной работы. «Установление линейной корреляционной связи между двумя случайными величинами».
- •§1.4 Контрольные вопросы
- •§ 1.5 Варианты заданий к лабораторной работе № 3
- •Рекомендуемая литература
- •Содержание
§ 1.2 План выполнения работы и алгоритм расчетов
X |
x1 |
x2 |
x3 |
x4 |
… |
xn |
Y |
y1 |
y2 |
y3 |
y4 |
… |
yn |
Исходные данные:
сгруппировать в виде корреляционной таблицы.
Корреляционная таблица
X Y |
x1 |
x2 |
x3 |
… |
xl |
Итого
|
y1 |
m11 |
m12 |
m13 |
… |
m1l |
|
y2 |
m21 |
m22 |
|
… |
m2l |
|
… |
… |
… |
… |
… |
… |
… |
yk |
mk1 |
mk2 |
mk3 |
… |
mkl |
myk |
Итого |
|
|
|
… |
|
|
где: x1, х2, … хl - наблюдаемые значения случайной величины X, расположенные в порядке возрастания;
y1, y2, … yk – значения случайной величины Y, расположенные в порядке возрастания;
mij – частота повторения пары значений хiyj в таблице исходных данных;
- частота повторения значения хi;
- частота повторения значения уj;
Оценить предварительно форму связи.
Для этого построить точечную диаграмму (корреляционное поле). В декартовой системе координат изобразить точками с координатами (хi, уj ) пары наблюдаемых величин X , У. По разбросу точек убедиться в том, что зависимость между X , У можно предположительно считать линейной. В случае линейной зависимости наблюдается небольшой разброс точек, их сгущение около некоторой прямой линии.
Для нахождения коэффициента линейной корреляции ( rв ) и коэффициентов линейной регрессии (ρy/x , ρx/y) выполнить промежуточные вычисления.
Найти:
Замечание. Для упорядочения расчетов корреляционную таблицу дополнить новыми строками и столбцами, все промежуточные вычисления также занести в таблицу.
Для упрощения расчетов можно перейти к условным вариантам
от хi к ui
от уj к vj
,
где Су , Сх – ложные нули,
hx , hy - величина шага между равноотстоящими вариантами.
Корреляционную таблицу записать в условных вариантах. Правило заполнения таблицы удобнее проследить на примере, который приводится в § 1.3.
Формулы для вычисления необходимых характеристик в условных вариантах аналогичны приведенным выше.
4. Вычислить коэффициент линейной корреляции rв. Определить силу (тесноту) и направление связи.
Формулы для вычисления rв в исходных вариантах:
Будем считать линейную корреляционную связь между случайными величинами:
слабой, если |rв| <0,3
средней, если 0,3 <|rв|<0,7
сильной, если | rв | > 0,7
5. Подсчитать возможную ошибку (σГ) при нахождении rв
6. Найти доверительный интервал коэффициента линейной корреляции генеральной совокупности (rг).
или
Значение t находится по таблице критических точек распределения Стьюдента для заданного уровня значимости ( α ) и числа степеней свободы ( k ).
Число степеней свободы вычисляется по формуле k = n – 2, где n – объем выборки. Уровень значимости для данных расчетов можно положить равным α = 0,05.
Нахождение
доверительного интервала для α
= 0,05 будет означать, что если случайные
величины линейно
Установить значимость выборочного коэффициента линейной корреляции. Т.е. выяснить линейная корреляционная связь случайная или неслучайная. Для этого необходимо определить значимо ли вычисленное числовое значение rв отличается от того значения коэффициента линейной корреляции генеральной совокупности, при котором линейная корреляционная связь отсутствует, т.е. от нуля.
Для
этого необходимо знать две величины: t
критическое и t
наблюдаемое.
Если | t
набл
|
< t
Если |
t
набл
|
> t
Наблюдаемое значение t находится по формуле:
Критическое значение находится по таблице критических точек распределения Стьюдента для заданного уровня значимости α и числа степеней свободы k = n – 2, аналогично тому, как это находилось в предыдущем пункте.
Замечание. Если число наблюдений велико (n>100) то можно считать, что случайные величины X и Y распределены нормально, и поэтому tкрит необходимо искать по таблице значений функции Лапласа Ф(x) при определенном уровне значимости α как значение ее аргумента, при котором выполняется условие:
Причем, если 100 < n < 500, то
Если n > 500, то
Вычислить коэффициенты линейной регрессии, предварительно перейдя от условных вариантов к первоначальным.
Формулы вычисления коэффициентов линейной регрессии:
Формулы перехода от условных вариантов к первоначальным:
Записать уравнения линейной регрессии:
Значение: Установление значимости коэффициентов линейной регрессии в данной работе не производится.
Наглядно убедиться в отсутствии грубой ошибки произведенных расчетов. Для этого в одной и той же системе координат построить график линейной регрессии (теоретической)
и эмпирическую линию регрессии.
Визуально сравнить величину отклонения второй линии от первой.
Эмпирическая линия регрессии строится по точкам с координатами: и представляет собой ломаную линию. ( - условная средняя по y, для соответствующей ).
Произвести - содержательную интерпретацию результатов корреляционного анализа.
На основании вычисленного значения коэффициента линейной корреляции (rв) указать между какими по содержанию величинами установлена корреляционная связь, какая она по силе и по направлению.
Указать предельные значения rв и объяснить их практический смысл.
Произвести содержательную интерпретацию результатов регрессионного анализа.
Отметим, что коэффициент линейной регрессии указывает насколько в среднем изменится Y при изменении X на одну величину измерения.
Свободный член уравнения особого содержательного смысла не имеет. Он указывает на некоторое исходное, начальное состояние изучаемого процесса.