Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
labor3_new.doc
Скачиваний:
13
Добавлен:
30.08.2019
Размер:
1.15 Mб
Скачать

§ 1.2 План выполнения работы и алгоритм расчетов

X

x1

x2

x3

x4

xn

Y

y1

y2

y3

y4

yn


  1. Исходные данные:

сгруппировать в виде корреляционной таблицы.

Корреляционная таблица

X

Y

x1

x2

x3

xl

Итого

y1

m11

m12

m13

m1l

y2

m21

m22

m2l

yk

mk1

mk2

mk3

mkl

myk

Итого

где: x1, х2, … хl - наблюдаемые значения случайной величины X, расположенные в порядке возрастания;

y1, y2, … yk – значения случайной величины Y, расположенные в порядке возрастания;

mij – частота повторения пары значений хiyj в таблице исходных данных;

- частота повторения значения хi;

- частота повторения значения уj;

  1. Оценить предварительно форму связи.

Для этого построить точечную диаграмму (корреляционное поле). В декартовой системе координат изобразить точками с координатами (хi, уj ) пары наблюдаемых величин X , У. По разбросу точек убедиться в том, что зависимость между X , У можно предположительно считать линейной. В случае линейной зависимости наблюдается небольшой разброс точек, их сгущение около некоторой прямой линии.

Для нахождения коэффициента линейной корреляции ( rв ) и коэффициентов линейной регрессии (ρy/x , ρx/y) выполнить промежуточные вычисления.

Найти:

Замечание. Для упорядочения расчетов корреляционную таблицу дополнить новыми строками и столбцами, все промежуточные вычисления также занести в таблицу.

Для упрощения расчетов можно перейти к условным вариантам

от хi к ui

от уj к vj

,

где Су , Сх – ложные нули,

hx , hy - величина шага между равноотстоящими вариантами.

Корреляционную таблицу записать в условных вариантах. Правило заполнения таблицы удобнее проследить на примере, который приводится в § 1.3.

Формулы для вычисления необходимых характеристик в условных вариантах аналогичны приведенным выше.

4. Вычислить коэффициент линейной корреляции rв. Определить силу (тесноту) и направление связи.

Формулы для вычисления rв в исходных вариантах:

Будем считать линейную корреляционную связь между случайными величинами:

  • слабой, если |rв| <0,3

  • средней, если 0,3 <|rв|<0,7

  • сильной, если | rв | > 0,7

5. Подсчитать возможную ошибку (σГ) при нахождении rв

6. Найти доверительный интервал коэффициента линейной корреляции генеральной совокупности (rг).

или

Значение t находится по таблице критических точек распределения Стьюдента для заданного уровня значимости ( α ) и числа степеней свободы ( k ).

Число степеней свободы вычисляется по формуле k = n – 2, где n – объем выборки. Уровень значимости для данных расчетов можно положить равным α = 0,05.

Нахождение доверительного интервала для α = 0,05 будет означать, что если случайные величины линейно 10оррелированны, то неизвестное значение коэффициента линейной корреляции генеральной совокупности будет находиться в найденном интервале с вероятностью 0,95. Однако обратное утверждение выполняется не всегда.

  1. Установить значимость выборочного коэффициента линейной корреляции. Т.е. выяснить линейная корреляционная связь случайная или неслучайная. Для этого необходимо определить значимо ли вычисленное числовое значение rв отличается от того значения коэффициента линейной корреляции генеральной совокупности, при котором линейная корреляционная связь отсутствует, т.е. от нуля.

Для этого необходимо знать две величины: t критическое и t наблюдаемое. Если | t набл | < t 11орр, то значение rв незначимо отличается от нуля и величины X и У линейно не 11оррелированны.

Если | t набл | > t 11орр , то значение rв отличается от нуля значимо и следовательно X и У действительно связаны линейной корреляционной зависимостью; вероятность этого события равна 0,95, если уровень значимости был α = 0,05.

Наблюдаемое значение t находится по формуле:

Критическое значение находится по таблице критических точек распределения Стьюдента для заданного уровня значимости α и числа степеней свободы k = n – 2, аналогично тому, как это находилось в предыдущем пункте.

Замечание. Если число наблюдений велико (n>100) то можно считать, что случайные величины X и Y распределены нормально, и поэтому tкрит необходимо искать по таблице значений функции Лапласа Ф(x) при определенном уровне значимости α как значение ее аргумента, при котором выполняется условие:

Причем, если 100 < n < 500, то

Если n > 500, то

  1. Вычислить коэффициенты линейной регрессии, предварительно перейдя от условных вариантов к первоначальным.

Формулы вычисления коэффициентов линейной регрессии:

Формулы перехода от условных вариантов к первоначальным:

  1. Записать уравнения линейной регрессии:

Значение: Установление значимости коэффициентов линейной регрессии в данной работе не производится.

  1. Наглядно убедиться в отсутствии грубой ошибки произведенных расчетов. Для этого в одной и той же системе координат построить график линейной регрессии (теоретической)

и эмпирическую линию регрессии.

Визуально сравнить величину отклонения второй линии от первой.

Эмпирическая линия регрессии строится по точкам с координатами: и представляет собой ломаную линию. ( - условная средняя по y, для соответствующей ).

  1. Произвести - содержательную интерпретацию результатов корреляционного анализа.

На основании вычисленного значения коэффициента линейной корреляции (rв) указать между какими по содержанию величинами установлена корреляционная связь, какая она по силе и по направлению.

Указать предельные значения rв и объяснить их практический смысл.

  1. Произвести содержательную интерпретацию результатов регрессионного анализа.

Отметим, что коэффициент линейной регрессии указывает насколько в среднем изменится Y при изменении X на одну величину измерения.

Свободный член уравнения особого содержательного смысла не имеет. Он указывает на некоторое исходное, начальное состояние изучаемого процесса.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]