Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методика. корреляционный анализ для магистров.docx
Скачиваний:
24
Добавлен:
03.06.2015
Размер:
1.16 Mб
Скачать

5.5.9.3. Регрессионный анализ

Любая форма корреляционной связи в общем виде выражается формулой у = f(х), то есть зависимая переменнаяуявляется функцией от независимой переменной – аргументах. Изменение функции при изменении одного (или нескольких) аргументов называется регрессией. Регрессия может быть выражена в виде таблицы, уравнения или графика.

Параметры регрессии выражают связь между величинами хи у двусторонне, то есть зависимостьуотхих оту. Исключение составляют временные ряды (ряды динамики), регрессия в которых является односторонней.

Задача исследований заключается в том, чтобы выразить зависимость функции уот аргумента (или аргументов)хформулой уравнения, что позволит предвидеть изменение упри изменениих.

Линейная регрессия

Она характеризует наиболее простой и распространенный тип зависимости, выраженный формулой

у = а·х + b, (__)

где а – размерный коэффициент, характеризующий скорость изменения функции упо мере изменения аргументах, то есть

а = (у2у1) · (х2х1) (рис.__);b– значениеуприх = 0.

Линейная связь может быть как положительной, так и отрицательной, когда соответственно коэффициент а > 0 и коэффициент корреляции r> 0 или а < 0 и r< 0 (рис.__).

Рис. 8. Линейная регрессия (уравнение прямой):

а – угловой коэффициент, характеризующий скорость изменения «у» при изменении «х»;

б – значение «у» при «х» = 0;

r– коэффициент кореляции.

Для вычисления коэффициентов уравнения прямой связи заполняют таблицы 15 и 16, вычисление производят с использованием уравнений (1) и (2) с последующей оценкой достоверности полученного уравнения прямой связи коррелируемых признаков.

Таблица 15

Расчет показателей для вычисления уравнения связи длины корневых систем (х) и высоты сеянцев (у)

х

у

4

6

8

10

12

14

16

18

n

х/у

12

1

1

12,00

11

1

1

1

3

12,67

10

9

2

1

1

4

15,50

8

1

2

1

1

5

11,20

7

1

1

2

3

1

6

1

15

11,20

6

1

6

8

6

4

2

27

9,78

5

2

6

2

1

4

3

2

20

9,60

4

2

6

3

5

5

3

1

25

9,52

n

7

19

16

11

18

19

6

4

100

y/x

4,43

5,11

5,94

5,64

5,89

6,26

6,33

8,00

Таблица 16

Расчет показателей для вычисления уравнения связи длины корней (х) и высоты сеянцев (у)

х

у

х2

у · х

у/

у/-y

/-y)2

18

8,00

324

144,00

7,26

–0,74

0,548

16

6,33

256

101,28

6,88

0,55

0,302

14

6,26

196

87,64

6,50

0,24

0,058

12

5,89

544

70,68

6,12

0,23

0,053

10

5,64

100

56,40

5,74

0,10

0,010

8

5,94

64

47,52

5,36

–0,58

0,336

6

5,11

36

30,66

4,98

–0,13

0,017

4

4,43

16

17,72

4,60

0,17

0,029

88

47,6

1136

555,90

47,44

–0,16

1,353

8 а0+ 88 а1 = 47,6

88 а0 + 1136 а1= 555,9

_88 а0 + 1136 а1= 555,9

88 а0 + 968 а1= 523,6

168 а1= 32,3

а1 == 0,1923; а0вычисляется, исходя из уравнения (1);

а0==== 3,84

Уравнение регрессии принимает вид:

у = а0 + а1х = 3,84 + 0,1923х

Ошибку уравнения регрессии вычисляют по формуле:

myx=, (51)

где myx – ошибка уравнения регрессии,

у– эмпирические значения функции,

у / – теоретические значения функции,

N– число точек эмпирической линии регрессии,n– число коэффициентов уравнения, включая свободный член.

myx== ± 0,47

Таким образом высоту сеянцев можно вычислить по формуле

у = 3,84 + 0,1923х с ошибкой ± 0,47

На основании рассчитанных частот у/ (табл. 16) строят график прямолинейной регрессии (рис. 13).

Точка пересеченных линий регрессии с осью ординат у = а0 = 3,84.

Основным параметром прямолинейной регрессии является а1, поэтому рекомендуется оценить достоверность его отличия от нуля; степень достоверности коэффициента а1отражает наличие или отсутствие корреляционной связи между признаками. Оценка достоверности производится поt– критерию Стьюдента по формуле:

t=, (55)

где t– величина критерия Стьюдента,

а1– коэффициент при аргументе в уравнении прямой линии,

– стандартное отклонение ряда аргумента,

ошибка уравнения,

N– объем выборки (число классов).

t=== 1,06

Вычисление представляется читателю. Если вычисленная величинаt-критерия меньше табличной, то связь междух, уи значениеа1, достоверны. Табличное значениеt-критерия на 5% уровне значимости при числе степеней свободы у =N– 2 составляет:

N10 20 30 40 50 60 70 80 90 100 200

t1,46 1,27 1,20 1,15 1,11 1,08 1,06 1,04 1,03 1,02 0,95.

Второй способ вычисления уравнения коэффициентов х0 и а1прямой связи применяется, если известны коэффициент корреляцииr и стандартные отклонениякоррелируемых рядов. Вычисление ведется по формуле:

а1=rxy (53)

Коэффициент а0вычисляют по использованному выше уравнению (1), когда было найдено значение а0= 3,84.

Выше рассмотрен порядок оценки тесноты парной прямолинейной и криволинейной связи с помощью коэффициента корреляции r, корреляционного отношенияηи показателя силы связи (взаимообусловленности изменчивости, детерминации) r2и порядок вычисления уравнения прямолинейной регрессии у = а0 + а1х.

320