- •Методика
- •5.5.9.2. Корреляционный анализ
- •Коэффициент корреляции для больших выборок Составление корреляционной решетки
- •Совместное вычисление коэффициента корреляции и корреляционного отношения между взвешенными рядами
- •Прямое и обратное корреляционное отношение
- •Корреляция рангов
- •5.5.9.3. Регрессионный анализ
- •Линейная регрессия
5.5.9.3. Регрессионный анализ
Любая форма корреляционной связи в общем виде выражается формулой у = f(х), то есть зависимая переменнаяуявляется функцией от независимой переменной – аргументах. Изменение функции при изменении одного (или нескольких) аргументов называется регрессией. Регрессия может быть выражена в виде таблицы, уравнения или графика.
Параметры регрессии выражают связь между величинами хи у двусторонне, то есть зависимостьуотхих оту. Исключение составляют временные ряды (ряды динамики), регрессия в которых является односторонней.
Задача исследований заключается в том, чтобы выразить зависимость функции уот аргумента (или аргументов)хформулой уравнения, что позволит предвидеть изменение упри изменениих.
Линейная регрессия
Она характеризует наиболее простой и распространенный тип зависимости, выраженный формулой
у = а·х + b, (__)
где а – размерный коэффициент, характеризующий скорость изменения функции упо мере изменения аргументах, то есть
а = (у2–у1) · (х2–х1) (рис.__);b– значениеуприх = 0.
Линейная связь может быть как положительной, так и отрицательной, когда соответственно коэффициент а > 0 и коэффициент корреляции r> 0 или а < 0 и r< 0 (рис.__).
Рис. 8. Линейная регрессия (уравнение прямой):
а – угловой коэффициент, характеризующий скорость изменения «у» при изменении «х»;
б – значение «у» при «х» = 0;
r– коэффициент кореляции.
Для вычисления коэффициентов уравнения прямой связи заполняют таблицы 15 и 16, вычисление производят с использованием уравнений (1) и (2) с последующей оценкой достоверности полученного уравнения прямой связи коррелируемых признаков.
Таблица 15
Расчет показателей для вычисления уравнения связи длины корневых систем (х) и высоты сеянцев (у)
х у |
4 |
6 |
8 |
10 |
12 |
14 |
16 |
18 |
n |
х/у |
12 |
|
|
|
|
1 |
|
|
|
1 |
12,00 |
11 |
|
|
1 |
|
1 |
|
|
1 |
3 |
12,67 |
10 |
|
|
|
|
|
|
|
|
– |
– |
9 |
|
|
|
|
|
2 |
1 |
1 |
4 |
15,50 |
8 |
1 |
|
|
2 |
|
1 |
|
1 |
5 |
11,20 |
7 |
1 |
1 |
2 |
3 |
1 |
6 |
1 |
|
15 |
11,20 |
6 |
1 |
6 |
8 |
|
6 |
4 |
2 |
|
27 |
9,78 |
5 |
2 |
6 |
2 |
1 |
4 |
3 |
2 |
|
20 |
9,60 |
4 |
2 |
6 |
3 |
5 |
5 |
3 |
|
1 |
25 |
9,52 |
n |
7 |
19 |
16 |
11 |
18 |
19 |
6 |
4 |
100 |
|
y/x |
4,43 |
5,11 |
5,94 |
5,64 |
5,89 |
6,26 |
6,33 |
8,00 |
|
|
Таблица 16
Расчет показателей для вычисления уравнения связи длины корней (х) и высоты сеянцев (у)
х |
у |
х2 |
у · х |
у/ |
у/-y |
(у/-y)2 |
18 |
8,00 |
324 |
144,00 |
7,26 |
–0,74 |
0,548 |
16 |
6,33 |
256 |
101,28 |
6,88 |
0,55 |
0,302 |
14 |
6,26 |
196 |
87,64 |
6,50 |
0,24 |
0,058 |
12 |
5,89 |
544 |
70,68 |
6,12 |
0,23 |
0,053 |
10 |
5,64 |
100 |
56,40 |
5,74 |
0,10 |
0,010 |
8 |
5,94 |
64 |
47,52 |
5,36 |
–0,58 |
0,336 |
6 |
5,11 |
36 |
30,66 |
4,98 |
–0,13 |
0,017 |
4 |
4,43 |
16 |
17,72 |
4,60 |
0,17 |
0,029 |
88 |
47,6 |
1136 |
555,90 |
47,44 |
–0,16 |
1,353 |
8 а0+ 88 а1 = 47,6
88 а0 + 1136 а1= 555,9
_88 а0 + 1136 а1= 555,9
88 а0 + 968 а1= 523,6
168 а1= 32,3
а1 == 0,1923; а0вычисляется, исходя из уравнения (1);
а0==== 3,84
Уравнение регрессии принимает вид:
у = а0 + а1х = 3,84 + 0,1923х
Ошибку уравнения регрессии вычисляют по формуле:
myx=, (51)
где myx – ошибка уравнения регрессии,
у– эмпирические значения функции,
у / – теоретические значения функции,
N– число точек эмпирической линии регрессии,n– число коэффициентов уравнения, включая свободный член.
myx== ± 0,47
Таким образом высоту сеянцев можно вычислить по формуле
у = 3,84 + 0,1923х с ошибкой ± 0,47
На основании рассчитанных частот у/ (табл. 16) строят график прямолинейной регрессии (рис. 13).
Точка пересеченных линий регрессии с осью ординат у = а0 = 3,84.
Основным параметром прямолинейной регрессии является а1, поэтому рекомендуется оценить достоверность его отличия от нуля; степень достоверности коэффициента а1отражает наличие или отсутствие корреляционной связи между признаками. Оценка достоверности производится поt– критерию Стьюдента по формуле:
t=, (55)
где t– величина критерия Стьюдента,
а1– коэффициент при аргументе в уравнении прямой линии,
– стандартное отклонение ряда аргумента,
ошибка уравнения,
N– объем выборки (число классов).
t=== 1,06
Вычисление представляется читателю. Если вычисленная величинаt-критерия меньше табличной, то связь междух, уи значениеа1, достоверны. Табличное значениеt-критерия на 5% уровне значимости при числе степеней свободы у =N– 2 составляет:
N10 20 30 40 50 60 70 80 90 100 200
t1,46 1,27 1,20 1,15 1,11 1,08 1,06 1,04 1,03 1,02 0,95.
Второй способ вычисления уравнения коэффициентов х0 и а1прямой связи применяется, если известны коэффициент корреляцииr и стандартные отклонениякоррелируемых рядов. Вычисление ведется по формуле:
а1=rxy (53)
Коэффициент а0вычисляют по использованному выше уравнению (1), когда было найдено значение а0= 3,84.
Выше рассмотрен порядок оценки тесноты парной прямолинейной и криволинейной связи с помощью коэффициента корреляции r, корреляционного отношенияηи показателя силы связи (взаимообусловленности изменчивости, детерминации) r2и порядок вычисления уравнения прямолинейной регрессии у = а0 + а1х.