Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

моделирование экосистем

.pdf
Скачиваний:
42
Добавлен:
13.02.2015
Размер:
1.07 Mб
Скачать

51

52

строчку 1) получилось в результате действий, которые приведены в табл.9.3.

Таблица 9.3.

Отклонение

Численности в клетках

Произведение nxyky

высот ку

таблицы nxy

 

- 5

I

- 5

- 4

6

- 24

- 3

I

- 3

- 2

I

- 2

Всего

9

- 34

Такие подсчеты делают по каждой строчке таблицы распределения, получая цифры пятого столбца (-34, -42. -27 и т.д.).

Внизу таблицы распределения, в пятой строке, подобным образом записывают суммы произведений каждого отклонения по диаметру на соответствующие численности, расположенные в клетках по столбцам таблицы. Например, число - 42 в строке 5 (внизу таблицы) получилось исходя из следующих расчетов (табл.9.4).

Таблица 9.4.

Отклонение

Численности в клетках

Произведение nxykх

диаметров кх

таблицы nxy

 

- 3

6

- 18

- 2

7

- 14

- 1

10

- 10

0

3

- 0

Всего

26

- 42

Данные столбца 6 получают путем перемножения цифровых значений пятого и второго столбцов, строчки 6 - путем перемножения цифр пятой и второй строчек. Суммы чисел столбца 6 и строчки 6 должны быть равны, что следует из способа образования этих сумм (в нашем примере

707).

Кроме того, должны быть равны итоги строчки 3 и столбца 5 (в нашем примере +89), строчки 5 и столбца 3 (в нашем примере -14).

Данные столбца 7 получаются путем возведения в квадрат цифровых значений пятого столбца, столбца 8 - путем деления цифровых значений седьмого столбца на численности первого. Далее подсчитывают сумму столбца 8. Аналогичным способом получают значения строчек 7, 8.

Убедившись в правильности подсчетов корреляционной таблицы и подсчитав необходимые итоговые данные столбцов и строчек, приступают к вычислению численных характеристик корреляционной таблицы.

53

Коэффициент корреляции

Коэффициент корреляции вычисляют по формуле

r

1/1

(9.1)

x y

 

 

где μ1/1 - первый центральный момент произведения двух статистических величин;

σx σy - неименованные средние квадратичные отклонения статистических величин х, у.

Первый центральный момент произведения двух статистических величин вычисляют по формуле

1/1 m1/1 m1xm1y

(9.2)

где m1/1 - первый начальный момент произведения двух статистических величин;

m1x, m1y - первые начальные моменты статистических величин х, y.

Первый начальный момент произведения двух статистических величин находят по формуле

m

nxykykx

(9.3)

 

1/1

n

 

 

 

где Σnxykykx - сумма произведений отклонений на численности; Σn - общая численность выборки.

Начальные моменты и среднее квадратичное отклонение определяют по формулам, которые приведены в работе 3 «Вычисление статистических показателей вариационного ряда и использованием начальных моментов по способу произведений».

Начальные моменты по диаметру х:

первый начальный момент m

 

nxkx

 

14

0,070

 

 

 

 

 

 

 

 

1x

 

 

 

 

n

200

 

 

 

 

 

 

 

второй начальный момент m2x

 

 

nxk2x

 

 

 

866

 

 

 

4,330

 

 

 

 

 

 

Начальные моменты по высоте y:

 

 

 

 

n

200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

первый начальный момент m

 

nyky

 

 

89

 

 

0,445

 

 

 

 

1y

 

 

 

 

n

200

 

 

 

 

 

 

 

 

 

 

 

второй начальный момент m2y

 

 

nyk2y

813

 

 

 

 

 

 

 

 

 

 

4,065

 

 

 

 

 

 

 

n

200

 

 

 

 

54

Вторые центральные моменты:

по диаметру 2x m2x m12x 4,33 0,072 4,325

по высоте 2y m2y m12y 4,065 0,4452 3,867

Первый начальный момент произведения двух статистических величин

m

nxykxky

 

707

3,535

 

 

1/1

n

200

 

 

 

Первый центральный момент произведения двух статистических величин

1/1 m1/1 m1xm1y 3,535 ( 0,07 0,445) 3,535 0,31 3,566

Среднее квадратичное отклонение по диаметру х:

неименованное x 2x 4,325 2,08

именованное x i 2x 34,325 6,24см

Среднее квадратичное отклонение по высоте y:

неименованное y 2y 3,867 1,97

именованное y i 2y 23,867 3,94см

Коэффициент корреляции диаметров и высот

r

1/1

 

3,566

 

3,566

0,87

x y

2,08 1,97

 

 

 

4,098

 

Основная ошибка коэффициента корреляции вычисляется по формуле

1 r2

(9.4)

mr

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

1 0,87

2

 

mr

 

 

 

 

0,017

 

 

 

 

 

200

 

 

 

Таким образом, коэффициент корреляции с основной ошибкой равен r±mr=0,87±0,017.

На основании коэффициента корреляции и основной ошибки определяют его достоверность: t1 = r : mr = 0,87 : 0,017 = 52 (достоверность очень высокая, так как t1 значительно больше четырех).

Корреляционное отношение

Если высота y зависит от диаметра х, корреляционное отношение вычисляют по формуле

2

1

 

1

 

nxyky 2

m2

 

(9.5)

 

 

 

 

 

 

 

 

 

 

 

 

n

 

y/ x

 

2y

n

 

x

1y

 

 

 

 

 

 

 

 

 

 

 

 

где μ2y - второй центральный момент по высоте μ2y=3,867;

55

Σnобщая численность выборки, Σn= 200;

nxyky 2 - итоговые данные столбца 8 (см. табл.9.2) равны 668,0; nx

m1y - первый начальный момент по высоте m1y=0,455.

Подставив цифровые значения в формулу (9.5), получим

2

1

 

1

 

2

0,809;

 

 

 

 

y/ x

0,809 0,90

y/ x

 

 

 

668,0 0,445

 

3,867

200

 

 

 

 

 

 

 

 

Основная ошибка корреляционного отношения вычисляется по

 

1 2

1 0,90

2

 

формуле m

 

 

 

 

 

 

 

 

0,013

 

 

 

 

 

 

 

 

 

200

 

 

 

n

 

 

 

Таким образом, корреляционное отношение с основной ошибкой равно η±mη=0,90±0,013. Величина его достоверна, так как показатель достоверности t1 =0,90 : 0,013 = 69. что значительно больше четырех.

Коэффициент (индекс) детерминации

Коэффициент детерминации показывает долю изменений зависимой переменной y в соответствии с изменением независимой переменной х. Он получается путем возведения в квадрат коэффициента корреляции (при линейной зависимости) или корреляционного отношения (при криволинейной форме связи). В нашем примере корреляционное отношение η=0,90. Коэффициент детерминации Д=η2=0,902=0,81. Значение коэффициента Д означает, что у 81% деревьев высота изменяется в зависимости от диаметра, у остальных 19% деревьев изменение высот обусловлено другими причинами.

Мера линейности

 

Меру линейности вычисляют по формуле

 

2 r2

(9.6)

Для нашего случая мера линейности 0,902 0,872

0,05

Основную ошибку меры линейности приближенно можно опреде-

лить по формуле

 

 

 

 

 

 

m

 

 

(9.7)

n

 

 

 

где Σnсумма численностей.

56

Основная ошибка меры линейности изучаемой совокупности

m 0,05 0,00025 0,0158

200

Чтобы судить о линейности изучаемой связи, находят отношение меры линейности к ее основной ошибке. Если это отношение больше трех, то с вероятностью, близкой к единице, можно утверждать, что корреляция криволинейная. При значениях отношения меры линейности к ее основной ошибке меньше трех вероятность правильности вывода о криволинейности понижается. Это можно видеть из данных табл.9.5.

Таблица 9.5. Оценка достоверности криволинейности

Отношение φ : mξ

1,0

1,65

1,96

2,58

3,0

3,29

 

 

 

 

 

 

 

 

Вероятность правильности

0,68

0,90

0,95

0,99

0,997

0,999

вывода о криволинейности

 

 

 

 

 

 

 

В менее ответственных исследованиях границей прямолинейной и криволинейной связей можно принять отношение ξ : mξ=2, когда вероятность правильности о криволинейности составляет 0,95 (в 95 испытаниях из 100 вывод о криволинейности зависимости подтвердится), что бывает иногда достаточным. Чем меньше величина меры линейности, тем более точные результаты дает линейное уравнение.

Для нашего примера находим отношение ξ : mξ=0,05 : 0,0158 = 3,2. Следовательно, связь диаметра с высотой выражается некоторой

кривой линией. Вероятность правильности вывода о криволинейности очень высокая, близкая к единице. Линейность не доказана, линейное корреляционное уравнение составлять нельзя. Отметим, что мера линейности и критерий t=ξ : mξ не дают исчерпывающего ответа о выборе уравнения, позволяют лишь с определенной степенью вероятности судить о форме регрессии (прямолинейная она или криволинейная). Указание на криволинейный характер регрессии обязывает вести поиск вида уравнения среди различных функций, характеризующих наиболее точно данную криволинейную зависимость.

Показатель криволинейности

Показатель криволинейности определяется по формуле

Kp

2

r

2

(9.8)

1 r2

 

 

 

 

57

При Кр=0 имеем строго прямолинейную зависимость двух признаков. При Кр=1 криволинейный характер связи достигает максимального предела.

Для нашего случая криволинейность равна

Kp 2 r2 1 r2

Линейное корреляционное уравнение

Если связь между двумя статистическими величинами линейная (графически выражается прямой линией), составляется корреляционное уравнение

 

 

~

y

 

(9.9)

 

 

y My r

 

(x Mx )

 

~

x

 

 

 

 

где

- вероятное значение зависимого признака;

 

y

 

 

Мy, Мx - средние значения статистических величин y

и x;

 

r - коэффициент корреляции;

 

 

σy, σx - средние квадратичные отклонения двух статистических величин (именованное, то есть с учетом величины интервала);

x - независимый признак.

В формулу (9.9) все показатели подставляются в тех единицах измерения, в которых они определяются. Действия производят над их абсолютными величинами, без учета единиц измерения. Ответ получают в единицах измерения зависимой величины y.

В формуле (9.9) выражение r y R есть коэффициент регрессии.

x

Коэффициент регрессии показывает, на сколько единиц изменится зависимый признак y, если независимый признак х изменится на единицу.

Для корреляционного уравнения определяется основная ошибка

my y

1 r

2

(9.10)

~

 

 

 

Основная ошибка корреляционного уравнения показывает величину ошибки, которую мы делаем, определяя на основании корреляционного уравнения вероятное среднее значение зависимого признака у, исходя из показателей независимого признака х.

58

9.2. Вычисление коэффициента корреляции и корреляционного отношения малой выборки

Для характеристики тесноты связи двух взаимосвязанных статистических величин малой выборки обычно вычисляют коэффициент корреляции и реже корреляционное отношение.

Исходными данными для данной работы являются диаметры и высоты двадцати деревьев, взятых из выборочной совокупности (200 деревьев) методом случайного отбора (каждое десятое). В примере из табл.1.1 берут диаметр и высоту каждого десятого дерева.

Для вычисления коэффициента корреляции диаметры и вы-

соты двадцати деревьев записывают в табл.9.6 (rp.2,3), вычисляют средние значения диаметра и высоты:

средний диаметр Mx

 

xj

 

 

 

454,5

22,7см

n

20

 

 

 

 

 

средняя высота My

yj

 

 

428,1

 

 

 

 

 

 

 

 

21,4см

n

 

 

20

 

 

 

 

 

 

 

Таблица 9.6. Вычисление коэффициента корреляции для малой выборки

№ п/п

Признаки

 

Центральные отклонения

 

xj

yj

xj-Mx

yj-My

αβ

α2

β2

 

1

2

3

4

5

6

7

8

1

15,0

15,1

-7,7

-6,3

48,51

59,29

39,69

2

19,5

21,0

-3,2

-0,4

1,28

10,24

0,16

3

15,0

16,0

-7,7

-5,4

41,58

59,29

29,16

4

18,0

17,4

-4,7

-4,0

18,80

22,09

16,00

5

19,5

21,7

-3,2

0,3

-0,96

10,24

0,09

6

23,5

23,0

0,8

1,6

1,28

0,64

2,56

7

36,0

29,5

13,3

8,1

107,73

176,89

65,61

8

19,0

17,8

-3,7

-3,6

13,32

13,69

12,96

9

21,5

22,4

-1,2

1,0

-1,20

1,44

1,00

10

22,0

23,8

-0,7

2,4

-1,68

0,49

5,76

11

32,0

25,0

9,3

3,6

33,48

86,49

12,96

12

26,0

22,7

3,3

1,3

4,29

10,89

1,69

13

18,0

16,0

-4,7

-5,4

25,38

22,09

29,16

14

22,5

23,6

-0,2

2,2

-0,44

0,04

4,84

15

21,0

22,5

-1,7

1,1

-1,87

2,89

1,21

16

23,5

22,6

0,8

1,2

0,96

0,64

1,44

17

36,0

26,5

13,3

5,1

67,83

176,89

26,01

18

15,5

16,0

-7,2

-5,4

38,88

51,84

29,16

19

32,0

26,0

9,3

4,6

42,78

86,49

21,16

20

19,0

19,5

-3,7

-1,9

7,03

13,69

3,61

Всего

454,5

428,1

+0,5

+0,1

446,89

806,25

304,23

59

Далее находят центральные отклонения по диаметру и высоте (гр.4,5), то есть разность между вариантами и средним значением признака. Сумма центральных отклонений должна равняться нулю. Но при округлении среднего значения до десятых она может оказаться больше или меньше нуля. Величина этой невязки не должна превышать ±0,5. В графе 6 вычисляют произведение центральных отклонений, а в графах 7, 8 соответственно квадраты центральных отклонений по диаметру и высоте.

Коэффициент корреляции малой выборки вычисляется по формуле

r (9.11)

2 2

где α - центральное отклонение по диаметру; β - центральное отклонение по высоте.

Подставляя цифровые значения в формулу (9.11), получим коэффициент корреляции:

r

 

446,89

 

 

446,89

0,90

 

 

 

 

 

 

806,25 304,23

495,2

 

Основная ошибка коэффициента корреляции малой выборки

mr 1 r2 1 0,902 0,042

n 20

Таким образом, коэффициент корреляции с основной ошибкой равен r±mr=0,90±0,042. Несмотря на небольшое количество единиц выборки, коэффициент корреляции оказался достоверным, так как показатель достоверности больше четырех:

t1

 

r

 

0,90

21

mr

0,042

 

 

 

 

Поэтому можно считать доказанным, что между диаметрами и высотами существует высокая связь.

Для вычисления корреляционного отношения малой выборки исходными данными возьмем 20 соотношений диаметров и высот (см.табл.9.6). Независимый признак х в нашем примере является диаметр, зависимый y – высота деревьев. Сгруппируем 20 деревьев по четырехсантиметровым ступеням толщины и поместим их в табл.9.7.

В скобках табл.9.7 приведены предельные значения диаметров ступеней толщины. Например, ступень 16 см имеет предельные диаметры 1417,9 см, ступень 20, соответственно, 18-21,9 и т.д.

Для вычисления корреляционного отношения определяют среднюю высоту всей выборки H=428,1 : 20 = 21,4 и условную среднюю высоту для

60

каждой ступени толщины в отдельности. Например, для ступени толщины 16 см условная средняя высота

hусл 15,1 16,0 16,0 47,1 15,7см 3 3

Таблица 9.7. Вычисление корреляционного отношения для малой выборки

Ступени

Высота

Средняя высота, м

 

Отклонения

 

ступени

всей вы-

 

 

 

 

толщины

дерева h,

α=H-h

α2

Δ=h-hусл

2

толщины

борки H

d, см

м

hусл

 

 

 

 

 

 

 

 

 

 

 

 

16

15,1

 

 

6,3

39,69

-0,6

0,36

(14-17,9)

16,0

15,7

 

5,4

29,16

0,3

0,09

 

16,0

 

 

5,4

29,16

0,3

0,09

20

21,0

 

 

0,4

0,16

1,2

1,44

(18-21,9)

17,4

 

 

4,0

16,00

-2,4

5,76

 

21,7

 

 

-0,3

0,09

1,9

3,61

 

17,8

19,8

 

3,6

12,96

-2,0

4,00

 

22,4

 

 

-1,0

1,00

2,6

6,76

 

16,0

 

 

5,4

29,16

-3,8

14,44

 

22,5

 

21,4

-1,1

1,21

2,7

7,29

 

19,5

 

1,9

3,61

-0,3

0,09

24

23,0

 

 

-1,6

2,56

-0,2

0,04

(22-25,9)

23,8

23,2

 

-2,4

5,76

0,6

0,36

 

23,6

 

 

-2,2

4,84

0,4

0,16

 

22,6

 

 

-1,2

1,44

-0,6

0,36

28

22,7

22,7

 

-1,3

1,69

0

0

(26-29,9)

 

 

 

 

 

 

 

32

25,0

25,5

 

-3,6

12,96

-0,5

0,25

(30-33,9)

26,0

 

 

-4,6

21,16

0,5

0,25

36

29,5

28,0

 

-8,1

65,61

1,5

2,25

(34-37,9)

26,5

 

 

-5,1

26,01

-1,5

2,25

Всего

428,1

-

-

-0,1

304,23

-

49,85

Затем определяют центральные отклонения по высоте, то есть находят разность между средней высотой всей совокупности деревьев (20 штук) и высотой каждого дерева, например:

первое центральное отклонение

α1 = 21,4 – 15,1 = 6,3

второе центральное отклонение

α1 = 21,4 – 16,0 = 5,4

Далее вычисляют отклонения высот каждого дерева от среднего значения высоты данной ступени толщины (условной средней высоты ступени толщины). Например:

для ступени толщины 16 отклонения высот равны

1 = 15,1 – 15,7 = - 0,6;

2 = 16,0 - 15,7 = 0,3;

3 = 16,0 - 15,7 = 0,3;

для ступени толщины 20 отклонения высот равны