Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

моделирование экосистем

.pdf
Скачиваний:
42
Добавлен:
13.02.2015
Размер:
1.07 Mб
Скачать

61

4 = 21,0 – 19,8 = 1.2;

5 = 17,4 - 19,8 = -2,4; 6 = 21,7 – 19,8 = 1,9 и т.д.

Значения α, необходимо возвести в квадрат, а затем найти сумму квадратов.

Сумма центральных отклонений высот Σα должна равняться нулю, но вследствие округления высот до десятых эта сумма может отличаться от нуля. В нашем примере она равна -0,1. Сумма центральных отклонений высот в пределах ступеней толщины также должна быть равна нулю. Но по той же причине эта сумма может несколько отличаться от нуля.

Корреляционное отношение при малом числе наблюдений вычисляется по формуле

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(9.12)

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

где

α - центральное отклонение, α = H - h;

 

- отклонение вариант от условного среднего значения по у, при

 

независимой переменной х.

 

 

 

 

 

 

 

 

 

 

 

Применительно к нашему примеру корреляционное отношение равно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

304,23 49,85

 

 

 

 

 

 

0,914

 

 

 

 

 

 

0,836

 

304,23

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Основная ошибка корреляционного отношения для малой выборки

вычисляется по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 2

 

 

 

 

M

 

 

 

 

 

(9.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

равна

Для нашего примера основная ошибка корреляционного отношения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0,9142

 

 

 

 

 

 

 

M

 

 

 

 

 

 

 

 

0,037

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, корреляционное отношение с основной ошибкой равно ηy/x ± mη = 0,914 ±0,037. Достоверность t = η : mη = 0,914 : 0,037 = 25.

Корреляционное отношение достоверно, так как t > 4.

В заключение следует ответить на следующие вопросы:

1.Какие показатели характеризуют корреляционную связь между статистическими величинами ?

2.Что такое коэффициент корреляции, для чего он служит?

3.Что такое корреляционное отношение, для чего оно служит?

4.Как вычисляется мера линейности, для чего она служит?

62

10. ПОКАЗАТЕЛИ МЕРЫ СВЯЗИ МЕЖДУ КАЧЕСТВЕННЫМИ ПРИЗНАКАМИ

При статистических наблюдениях не все признаки явлений можно подсчитать, взвесить или измерить. Это относится к таким неизмеримым признакам как цвет, всхожесть, состояние. Иногда можно только отметить наличие или отсутствие признака. На практике часто приходится определять связь как между двумя качественными, так и между качественными и количественными признаками. Для этого вычисляют показатели меры связи, которые носят различные названия .

10.1. Вычисление коэффициента сходства между двумя качественными признаками

Коэффициент сходства вычисляют в тех случаях, когда при наблюдении отмечается наличие или отсутствие изучаемого признака или признак принимает только два значения, Вычислим коэффициент сходства между обилием урожая и качеством семян.

По данным А.А.Молчанова, в урожайный год на 100 семян ели приходится 68 шт. полнозернистых и 32 шт. пустых. В неурожайный год на 100 семян ели приходится 24 шт. полнозернистых и 76 шт. пустых. Требуется установить тесноту связи между качеством семян и обилием урожая. Данные сведем в табл.10.1.

Таблица 10.1.Вычисление коэффициента сходства

Год

 

Количество семян

Всего

Полнозернистые

Пустые

 

 

 

Урожайный год

n1

= 68

n2 = 32

N1= 100

Неурожайный год

n3

= 24

n4 = 76

N1

= 100

Всего

N3 =92

N4 = 108

N1

= 200

Коэффициент сходства вычисляется по формуле

 

A

n1n4 n2n3

 

,

(10.1)

 

 

 

 

 

 

 

 

N1N2N3N4

 

где n1, n2, n3, n4 - численности противоположных признаков.

Подставив цифровые значения в формулу (10.1), получим коэффициент сходства:

Исходные данные для выполнения данной работы студенты получают при проведении экспериментальных работ в научно студенческих кружках и дипломном проектировании. Для математической обработки таких материалов и подготовлена эта работа.

63

A

 

68 76

24 32

 

 

5168 768

 

 

4400

0,44

 

 

 

 

 

 

 

 

 

100 100

92 108

 

 

99360000

9966

 

Основная ошибка коэффициента сходства вычисляется по формуле

1 A

2

,

(10.2

mA

 

 

 

 

 

 

N

 

 

 

 

 

где N - общая численность выборочной совокупности.

Для нашего примера основная ошибка коэффициентов сходства

mA 1 0,442 0,806 0,057

200 14,1

Достоверность коэффициента сходства

t A 0,44 9 mA 0,057

Коэффициент сходства достоверен, так как t1>4. Следовательно, связь между обилием урожая и качеством семян доказана. Она прямая, умеренная. Семена необходимо собирать в урожайные годы, так как качество таких семян выше.

10.2. Вычисление коэффициента корреляции рангов

По качественному признаку данные наблюдений разбивают на однородные группы и располагают их в порядке снижения качества. Однородным группам, в порядке снижения качества признака, присваивает номера, которые называют рангами.

Была исследована абсолютная всхожесть семян сосны в зависимости от их цвета. По окраске семена были разделены на четыре группы: черные, коричневые, серые, светлые. Для каждой группы семян установлена абсолютная всхожесть . Результаты обработки сведены в табл.10.2.

Таблица 10.2. Вычисление коэффициента корреляции рангов

Цвет семян

Абсолютная

Номера рангов

Разность

Квадрат разности

 

всхожесть,%

по цвету

по всхожести

рангов

рангов

Черный

96

1

2

-1

1

Коричневый

95

2

3

-1

1

Серый

99

3

1

2

4

Светлый

85

4

4

0

0

Всего

-

10

10

0

6

Коэффициент корреляции рангов можно определить по схеме вычисления коэффициента корреляции для малой выборки, имея в виду, что

Материалы предоставлены В.М.Жариковым, научным сотрудником Северной лесной опытной станции

64

средний номер ранга равен 10 : 4 = 2,5. Это вычисление можно сделать проще по формуле Спирмена:

r 1

6 a

2

(10.3)

n(n

2

 

 

 

1)

где r – коэффициент корреляции рангов;

а – разность между рангами (порядковыми номерами) данной пары сопоставляемых номеров;

n – число сопоставляемых пар (в нашем примере 4).

Для нашего примера r 1

6 6

1

36

1 0,60 0,40

4 (16 1)

 

 

60

 

Связь прямая, умеренная. Абсолютная всхожесть исследуемых семян сосны тем выше, чем темнее семена.

10.3. Вычисление коэффициента корреляции между качественными и количественными признаками

Изучены два показателя дерева: протяженность кроны от вершины (в метрах) и количество почек (женских, мужских). Протяженность кроны от вершины измерена, установлено наличие или отсутствие мужских и женских почек. В этом случае коэффициент корреляции вычисляется по формуле

r

M1 M0

 

n1

(10.4)

0

n n1

 

 

 

где М1 – среднее значение количественного признака с наличием качественного; М0 – общее среднее значение количественного признака всей партии;

σ0 – общее среднее квадратичное отклонение количественного признака;

n – число всех наблюдений;

n1 – число случаев с наличием данного признака.

В качестве примера вычислим коэффициент корреляции между протяженностью кроны (от ее вершины) и наличием женских (мужских) почек. У соснового дерева на разных расстояниях от вершины подсчитаны женские и мужские почки . Опытные данные сведены в табл.10.3.

Обработка данных табл.10.3 ведется с помощью начальных моментов. Первые начальные моменты:

Материалы собраны студенткой А.В.Шамаховой под руководством доц. П.В.Стальской.

65

для всей партии m

 

kn

 

359

 

0,65

n

 

 

 

1

 

552

 

 

 

 

 

для женских почек m

 

kn1

 

 

30

 

0,48

 

n1

 

 

 

1

 

 

 

62

 

 

для мужских почек m

 

kn2

 

23

0,047

n2

 

 

1

 

 

 

490

 

Таблица 10.3. Вычисление коэффициента корреляции между количественными и качественными признаками

Протя-

Количество почек на

Вся партия почек

Женские почки

Мужские почки

женность

 

дереве

 

 

 

 

 

 

 

 

 

 

 

 

кроны от

 

 

 

 

 

 

 

 

 

 

 

 

Жен-

Мужс

Всего

 

 

 

 

 

 

 

 

 

вершины,

ские

кие

n

k

kn

k2n

k

kn1

k2n1

k

kn2

k2n2

м

 

n1

n2

 

 

 

 

 

 

 

 

 

 

0

5

-

5

-5

-25

125

-3

-15

45

-

-

-

1

11

-

11

-4

-44

176

-2

-22

44

-

-

-

2

15

-

15

-3

-45

135

-1

-15

15

-

-

-

3

13

27

40

-2

-80

160

0

0

0

-3

-81

243

4

14

41

55

-1

-55

55

1

14

14

-2

-82

164

5

4

66

70

0

0

0

2

8

16

-1

-66

66

6

-

135

135

1

135

135

-

-

-

0

0

0

7

-

190

190

2

380

760

-

-

-

1

190

190

8

-

31

31

3

93

279

-

-

-

2

62

124

Всего

62

490

552

-

359

1825

-

-30

134

-

23

787

Второй начальный момент для всей партии

m2 k2n 1825 3,31

n 552

Средние значения протяженности кроны:

для всей партии M0 x0 im1 5 1 0,65 5,65м

для женских почек M1 x0 im1 3 1 0,48 2,52м

для мужских почек M2 x0 im1 6 1 0,047 6,05м

Среднее квадратичное отклонение для всей партии

im2 m12 13,31 0,652 1,70м

Коэффициент корреляции между протяженностью кроны от вершины дерева и наличием женских почек равен

 

 

 

r

2,52 5,65

62

1,84

 

0,66

 

 

0,126

 

 

 

 

552 62

 

 

1,7

 

 

 

 

 

 

 

Основная ошибка коэффициента корреляции

1 0,66

2

0,071, достоверность t1

 

66

 

 

 

mr

 

 

 

 

7

 

 

0,07

62

 

 

 

 

 

 

 

 

 

66

Коэффициент корреляции достоверен, так как t1>4. Связь обратная, значительная. Наибольшее количество женских почек находится в верхней части кроны.

Коэффициент корреляции между протяженностью кроны (от вершины дерева) и наличием мужских почек

r

M2 M0

 

n2

 

6,05 5,65

 

490

0,235

 

0,66

 

 

7,9

 

 

 

 

2

0

 

n n2

1,7

 

552 490

 

 

 

 

 

 

 

Основная ошибка коэффициента корреляции mr 1 0,662 0,025, досто-

490

верность t1 66 26.

0,025

Коэффициент сходства достоверен, так как t1>4. Связь прямая, значительная. Наибольшее количество мужских почек сосредоточено у основания кроны.

10.4. Ошибки наблюдения

Наблюдение – это описание единиц, образующих совокупности. Объектом наблюдения лесовода является биологические явления природы

– деревья, участки леса, насекомые, сеянцы, семена и т.д.

Изучаемые признаки живой природы отличаются друг от друга и не позволяют делать заключение о всей совокупности по одной единице. Поэтому для изучения того или иного явления производят наблюдение над достаточно большим числом единиц изучаемой совокупности. Такие наблюдения называют статистическими.

При наблюдении (измерение, взвешивание, подсчет) неизбежны ошибки. Ошибки могут быть случайные и систематические.

Иногда выделяются грубые ошибки (промахи). Случайные ошибки получаются при любых измерениях, причину которых не всегда можно установить. Но величину их можно определить, если произвести многократные измерения одних и тех же единиц наблюдения. Случайные ошибки характеризуются следующими свойствами: малые ошибки встречаются чаще, чем больше; ошибки с положительным и отрицательным знаком при многочисленных измерениях равновероятны, то есть встречаются в равном количестве; сумма ошибок при большом количестве единиц наблюдения стремится к нулю. Систематические ошибки получаются от неточности инструментов или приборов и физических недостатках наблюдения. Эти ошибки можно определить, если известны истинные значения изучаемого признака. Систематическая ошибка вычисляется по формуле

67

 

с

xизм хист

(10.5)

 

n

 

 

 

 

где

хизм – измеренные значения признака;

 

 

хист – истинные значения признака;

 

 

Σn – количество единиц.

 

Систематическая ошибка характеризует на сколько в среднем отличаются измеренные данные от истинных.

Наряду с систематической ошибкой, вычисляется средняя квадратичная ошибка. Средняя квадратичная ошибка показывает на сколько в основном (68%) единиц наблюдения отличаются отдельные измеренные значения признака от истинных.

Средняя квадратичная ошибка вычисляется по формуле

 

 

 

хизм хист с

(10.6)

 

n 1

 

 

 

 

 

где

с – систематическая ошибка.

 

Систематическая ошибка при расчете средней квадратичной ошибки вводится в формулу (10.6) с обратным знаком.

Ниже приводится пример вычисления систематической и средней квадратичной ошибок (табл.10.4).

Таблица 10.4. Вычисление систематической и средней квадратичной ошибок

№ дерева

Высота дерева, м

хизмист

измист)± с

[(хизмист)± с]2

измеренная

истинная

 

 

 

 

 

хизм

хист

 

 

 

1

2

3

4

5

6

1

14,5

15,5

-1,0

-0,2

0,04

2

12,0

13,5

-1,5

-0,7

0,49

3

16,5

17,2

-0,7

+0,1

0,01

4

12,0

13,0

-1,0

-0,2

0,04

5

20,6

19,6

+1,0

+1,8

3,24

6

17,0

18,6

-1,6

-0,8

0,64

Итого

92,6

97,4

-4,8

0

4,46

В примере взято шесть деревьев, у которых измерена высота до срубки высотометром (гр.2), а затем деревья срублены и высота определена истинная (гр.3). Далее находится разность между измеренной и истинной высотой, которая записывается в гр.4 с учетом знака. Для вычисления средней квадратичной ошибки необходимо исключить систематическую ошибку с=-0,8 м с обратным знаком, то есть к данным гр.4 прибавить

68

+0,8 м и записать в гр.5. Сумма гр.5 должна равна нулю или близкой к нулю. В гр.6 записываются возведенные в квадрат данные гр.5.

Для нашего примера систематическая ошибка равна

с xизм хист 4,8 0,8м

n 6

Заметим, что разность суммы хизм (гр.2) и хист (гр.3), равная в примере 92,6- 97,4=-4,8, должна совпадать с итогом гр.4.

Средняя квадратичная ошибка равна

 

 

хизм хист с

 

 

 

4,46

 

0,95м

 

 

 

 

n 1

6 1

Итак, с=-0,8 м, σ=±0,95 м

69

11. РЕГРЕССИОННЫЙ АНАЛИЗ

При изучении взаимосвязей двух статистических величин устанавливают тесноту и форму связи, используя для этой цели коэффициент корреляции, корреляционное отношение и другие показатели (см.работу 9). Наряду с этим очень важно провести математическое моделирование, т.е. подобрать аналитическое уравнение, которое бы соответствовало природе изучаемого явления.

Опытные данные зависимого признака по классам независимого, полученные на основе выборочной совокупности, отличаются от аналогичных показателей в генеральной совокупности и на графике выражаются ломаной линией, так как число наблюдений было недостаточным. В генеральной (общей) совокупности изучаемое явление обычно изменяется по прямой или по какой-либо плавной кривой. Задача регрессионного анализа и заключается в выравнивании опытных данных, в получении данных, наиболее близких к действительности. Регрессией называется изменение функции при определенных изменениях одного или нескольких аргументов. Функцией называют признак, зависящий от другого признака - аргумента. Взаимосвязь между функцией и аргументом кратко можно выразить формулой y=f(x), то есть признак у есть функция признака х. Регрессионный анализ включает выбор уравнения, наиболее точно выражающего зависимость одного признака от другого, вычисление коэффициентов уравнения и оценку его точности.

Выравнивание опытных данных производят по способу наименьших квадратов, сущность которого заключается в следующем.

Линия выравнивания, характеризующая зависимость между величинами, должна быть проведена так, чтобы сумма квадратов отклонений опытных данных от выравненных значений была наименьшей по сравнению с суммой квадратов отклонений, которые получаются при любом другом проведении линии выравнивания. Иначе говоря, линия регрессии, характеризующая зависимость одного признака от другого, имеет самую меньшую из возможных сумму квадратов от всех опытных точек. Таким образом, нахождение теоретической регрессии сводится к получению такой линии, для которой сумма квадратов отклонений всех опытных значений от вычисленных является наименьшей. Отсюда и происходит название метода выравнивания - метод наименьших квадратов.

Для выравнивания опытных данных по способу наименьших квадратов применяются различные аналитические уравнения.

y a bx cx2

70

Если с увеличением одного показателя наблюдается пропорциональное увеличение или уменьшение другого, берут параболу первого порядка:

y a bx (11.1)

Когда изменение показателя выражается плавной кривой о одним изгибом, для выравнивания берут параболу второго порядка:

(11.2)

В более сложных случаях, для кривых S-образной формы, имеющих два изгиба, используют параболу третьего порядка:

y a bx cx2 dx3

(11.3)

Достаточно хорошо передает S-образный характер изгиба кривой

уравнение

 

y axb clg x

(11.4)

Если с увеличением одного показателя наблюдается замедленное

увеличение другого, применяют логарифмические кривые:

 

y a blgx

(11.5)

y a bx clgx

(11.6)

Когда с увеличением одного показателя другой интенсивно возрастает, для выравнивания берут показательную кривую:

y a bx

(11.7)

Если с увеличением одного показателя другой интенсивно уменьша-

ется, применяют уравнение гиперболы:

 

y a

b

 

 

(11.8)

x

 

 

 

Характер изгиба уравнения гиперболы можно уточнить путем введе-

ния показателя степени независимой переменной

х

y a

b

 

(11.9)

 

 

 

xc

 

Когда один признак при увеличении другого, постепенно возрастая,

переходит в пропорциональное увеличение, берется степенная кривая:

y axb

(11.10)

где y - зависимая переменная; х - независимая переменная;

a,b,c,d - постоянные величины, подлежащие определению в уравнениях.

Для конкретного математического выражения необходимо определить коэффициенты уравнения регрессии. В этих целях можно использо-