Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Смольянов. тексты лекция

.pdf
Скачиваний:
30
Добавлен:
15.03.2016
Размер:
1.22 Mб
Скачать

70

По форме различают корреляцию линейную, когда зависимость между признаками отражается прямой линией и соответствующим ей уравнением, и криволинейную, когда зависимость отражает какая-либо кривая линия и соответствующее ей уравнение. Во многих случаях форму корреляции можно уже предсказать до опыта. Например, между длиной и толщиной молодых деревьев в древостое можно ожидать линейную корреляцию, но нельзя ожидать такой же формы корреляции у деревьев, растущих в старых древостоях. Статистический анализ дает ответ о форме связи и в тех случаях, когда на основе биологического анализа ее установить трудно или вообще невозможно.

По направленности различают корреляцию прямую, когда с увеличением одного признака в среднем увеличиваются и значения другого, а с уменьшением – уменьшаются, и обратную, когда с увеличением значений одного признака значения другого в среднем уменьшаются.

Учитывая вышесказанное, при проведении корреляционного анализа решаются следующие задачи:

1 Установление факта наличия или отсутствия связи между изучаемыми признаками.

2 Определение формы связи и ее направленности.

3 Вычисление показателя тесноты связи и его оценка.

Исходные данные, построение корреляционной таблицы. Исходные данные для проведения простого корреляционного анализа при большой и малой выборках представлены двумя рядами цифр. В качестве примера рассмотрим данные большой выборки по обмеру диаметров и соответствующих им поперечников крон у 125 деревьев сосны. Для удобства сопоставления и анализа данные наблюдений, особенно при большой выборке, систематизируют, т.е. строят таблицу распределения, или, как ее называют иначе, корреляционную таблицу.

При этом из двух изучаемых признаков за «х» принимают тот, который более легко определяется (измеряется, оценивается и т.д.) в натуре.

Перед построением корреляционной таблицы так же, как и при построении вариационного ряда, делаются вспомогательные расчеты. При этом для каждого из признаков отдельно определяется максимальная (Vmax) и минимальная (Vmin) варианты и размер ряда, который будет равен Vmax - Vmin. Количество классов принимается равным от 8 до 13. Величина интервала (λ) определяется как частное от деления размера ряда на количество классов. Для вычисления среднего значения начального класса к минимальной варианте прибавляют половину интервала. Желательно, чтобы средние значение классов (W) и величи-

71

на интервала были целыми числами, или, если это невозможно, удобными дробными. Количество классов по каждому признаку может быть разным.

После определения средних значений классов (Wx и Wy) и их границ производят разноску вариант методом точковки сразу по двум признакам. При этом в таблицу для каждого дерева ставится одна точка на пересечении соответствующих классов по признаку «х» и по признаку «y», к которым относится данное дерево. Итоги такой разноски в цифровом виде для рассматриваемого примера показаны в табл. 9.1.

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 9.1

 

Корреляционная таблица для установления связи между диаметрами (х)

 

 

 

 

и поперечниками крон (y) деревьев сосны

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wy

 

 

Поперечники крон (y), м

 

 

nx

yx - условно-

 

 

 

 

 

 

 

 

 

 

 

 

итого

средний

Wx

 

1,5

2

 

2,5

3

3,5

4

 

4,5

5

поперечник

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кроны

 

12

3

1

 

 

 

 

 

 

 

 

4

1,625

см

 

 

 

 

 

 

 

 

 

 

 

 

 

16

2

5

 

1

 

 

 

 

 

 

8

1,94

х),

 

 

 

 

 

 

 

 

 

 

 

 

 

20

1

5

 

11

4

 

 

 

 

 

22

2,48

(

 

 

 

 

 

 

 

 

 

 

 

 

 

Диаметры

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

1

 

7

21

9

2

 

 

 

40

3,05

 

 

 

 

 

 

 

 

 

 

 

 

 

28

 

 

 

2

5

13

4

 

1

 

25

3,44

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

 

 

 

 

2

6

7

 

2

 

17

3,76

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

 

 

 

 

 

1

3

 

4

1

9

4,28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ny итого

6

12

 

21

32

30

16

 

7

1

125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В конце таблицы для каждого из классов по признаку х вычисляется условно среднее значение yx. Например, в первом классе диаметров, равном 12 см. имеется 4 дерева. Три дерева из них имеют поперечник кроны равный 1,5 м, а одно дерево – 2 м. Следовательно, условно-среднее значение равно:

y =(31,5м)+(1 2м)=1,6м.

x

4

 

Аналогичным образом вычисляются условно-средние значения для остальных классов диаметров.

Установление корреляционной связи, ее формы и направленности.

Первое представление о наличии или отсутствии корреляционной связи дает графическое изображение данных наблюдения. Если выборка малая, то в системе координат зависимости y от х находят все исходные данные. При большой

72

выборке график строится по средним значениям классов – Wx и условно средним значением – yx (рис. 9.1).

Рис. 9.1 Графическое изображение корреляционных связей для большой выборки (а, б – связь отсутствует; в – связь линейная прямая; г – связь линейная обратная; д, е – связь нелинейная)

Вывод об отсутствии связи делается в том случае, если при изменении значения х значение yx практически остается на одном уровне, т.е. не изменяется (рис. 9.1 а), или изменчивость yx слишком велика и не может быть выражена математически (рис. 9.1 б). Если через полученные на графике точки можно провести прямую линию, то зависимость между признаками признается линейной прямой или обратной (рис. 9.1 в, г). В рассматриваемом примере для большой выборки зависимость между поперечниками крон и диаметрами деревьев сосны можно предварительно считать линейной, прямой.

73

2 Вычисление показателей тесноты связи и их оценка при большой выборке. Коэффициент корреляции и корреляционные отношения

Если по графику удалось определить форму связи, то сразу приступают к вычислению показателей ее тесноты: коэффициенту корреляции (r) или корреляционному отношению (η).

Иногда установить форму связи по графику затруднительно, тогда этот вопрос решается математически, путем вычисления меры линейности (Ζ) и ее оценки.

Прежде чем приступить к вычислению показателей тесноты корреляционной связи, необходимо предварительно вычислить среднее значение и среднеквадратическое отклонение по каждому из признаков х и y. Сделать это можно при помощи начальных моментов. Вычисление этих показателей для рассматриваемого примера большой выборки представлено в табл. 9.2. и табл. 9.3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 9.2

 

 

 

 

 

 

Вычисление Мх, σх

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wx

nх

А

а =

Wx F

 

a n

x

a2

a 2 n

x

 

 

 

 

Вычисления

λ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

4

 

 

-3

 

-12

 

9

36

 

ν =

anx =

36

= 0,287

 

 

 

 

 

 

 

 

 

 

 

16

8

 

 

-2

 

-16

 

4

32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

N

 

 

125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

22

 

 

-1

 

-22

 

1

22

 

 

 

 

 

a2nx

 

 

264

 

24

40

24

 

0

 

0

 

0

0

 

ν2 =

=

= 2,11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

125

28

25

 

 

1

 

25

 

1

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M x = A + λν 1

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

17

 

 

2

 

34

 

4

68

 

 

 

 

 

 

 

= 24

+ 0,287 4 = 25,16 см.

 

 

 

 

 

 

 

 

 

 

 

36

9

 

 

3

 

27

 

9

81

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

= λ

ν

 

ν2

=

 

 

Итого

125

 

 

 

 

-50

 

 

264

 

х

2

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

1

 

 

 

 

 

 

 

 

 

 

+ 86

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 4 2,110,2872 = 5,7см.

 

 

 

 

 

 

+ 36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Условные обозначения: А – условное начало; ν1 и ν2 – первый и второй начальный моменты; λх – интервал по признаку х; λу – интервал по признаку у.

Коэффициент корреляции является численной характеристикой связи между признаками, когда она имеет явно выраженный линейный характер. Коэффициент корреляции численно выражает отклонение числа факторов, действующих на изменение обоих признаков, к общему числу факторов. Указанное содержание коэффициента корреляции достаточно хорошо выражается формулой:

74

r =

n x α x

α y

,

(9.1)

N

σ x

σ

y

 

 

 

где числитель – сумма произведений отклонений величин αх и αу от своих средних Мх и Му;

знаменатель – σх и σу – среднеквадратические отклонения; Ν – число составляемых пар.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 9.3

 

 

 

 

 

 

Вычисление Мх, σх

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wу

nх

А

а =

Wx F

 

a nx

a2

a 2 nx

 

 

 

 

Вычисления

λ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,5

6

 

-3

 

-18

9

54

 

ν =

anу

=

 

 

24

 

= 0,192

2

12

 

-2

 

-24

4

48

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

N

 

125

 

 

 

2,5

21

 

-1

 

-21

1

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2nу

 

 

 

296

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

32

3

0

 

0

0

0

 

ν2

=

 

=

= 2,37

 

 

 

 

 

 

 

 

 

 

 

 

N

125

3,5

30

 

1

 

30

1

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M x = A+ λν1 =

 

 

 

 

4

16

 

2

 

32

4

64

 

 

 

 

 

4,5

7

 

3

 

21

9

63

 

= 3+ 0,192 0,5 = 3,1см.

5

1

 

 

 

 

4

16

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ х = λх ν 2 ν12 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итого

125

 

 

 

 

+ 24

 

296

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 0,5 2,37 0,1922

= 0,76см.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из формулы следует, что при независимом варьировании признаков, когда любое из отклонений αх может сочетаться с любым αу (как с положительными, так и с отрицательными, притом одинаково часто), числитель ее будет равен нулю или близкой к нулю величине. Следовательно, r = 0. При сопряженном варьировании отклонения αх сочетаются только с некоторыми отклонениями αу, например, положительные в основном только с положительными (при прямой связи) или положительные с отрицательными (при обратной связи). В этом случае сумма произведений будет иметь положительное (при прямой связи) или отрицательное (при обратной связи) значение, притом тем больше по своей величине (при данном Ν), чем связь сопряженнее.

Коэффициент корреляции может принимать значение от +1 до –1. При полной прямой корреляции r = +1; при полной обратной r = –1. При r = 0 или близкой к 0 прямолинейная связь отсутствует (но при этом может быть криволинейная связь). Для оценки степени тесноты корреляционных связей используется следующая шкала: r > 0,91 – связь очень высокая;

 

75

 

 

r = 0,71 – 0,90 – связь высокая;

 

 

r = 0,51

– 0,70 – связь значительная;

 

 

r = 0,31

– 0,50 – связь умеренная;

 

 

r = 0,10

– 0,30 – связь слабая;

 

 

r < 0,1 – связь отсутствует.

 

 

По указанию М.Л. Дворецкого [5], для практических целей можно ис-

пользовать связи при r > 0,5.

 

 

 

Для вычисления степени достоверности полученной величины

rx

обыч-

 

 

y

 

но вычисляют ошибку коэффициента корреляции (mr) и показатель достоверности (tr). Применительно к нашему примеру, когда r = +0,83:

mr

=

1r

2

 

=

10,832

= ±0,027

;

(9.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

125 1

 

 

 

N 1

 

 

 

 

 

 

 

tr =

r

 

=

 

0,83

 

 

≈ 31 .

 

(9.3)

 

 

mr

0,027

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель tr = 31 оценивается по критерию Стьюдента (прил. 3) согласно вычисленному числу степеней свободы f = N – 1 = 124. Определяем стандартное значение критерия Стьюдента (fst) для f = 124 и уровня значимости 0,05:

t0,05=1,96≈2,0.

Поскольку tr = 31 > t0,05 = 2, делается заключение о том, что коэффициент корреляции достоверен.

Доверительный интервал для коэффициента корреляции в генеральной совокупности (τr) для уровня значимости 0,05 определяем по формуле

τ ген. = τ в ± t0.05 mr = 0,83 ± 2 0,027 = 0,83 ± 0,054.

Следовательно, доверительные границы коэффициента корреляции в генеральной совокупности при вероятности 0,95 будут находиться в пределах от 0,78 до 0,38.

Вычисление корреляционного отношения и его оценка. Если по графику установлено, что связь между признаками заведомо нелинейная, то сразу приступают к вычислению ее меры – корреляционного отношения (η). Квадрат корреляционного отношения представляет собой частное от дисперсии

групповых σ у на общую дисперсию σ у , т.е.

х

76

ηу =

σ у

 

х

,

(9.4)

 

х

σ у

 

где σ у - среднее квадратическое отклонение, вычисленное по условным

х

средним значениям; σ у - полное среднее квадратическое отклонение.

Корреляционное отношение показывает, какую часть общей дисперсии (вариации) результативного признака (у) составляет дисперсия частных средних этого признака, т.е. измеряет относительную степень варьирования групповых средних у.

Можно вычислить два корреляционных отклонения

η

у

и

η х

. Однако

 

х

у

реальное значение имеет, как правило, один из них.

Величина корреляционного отношения имеет везде и всегда положительное значение, изменяющееся от 0 до 1. Когда групповые средние одинаковы (не варьируют), то η = 0 или связь отсутствует. В случае строго прямолинейной связи (все точки лежат на прямой) η = r = 1. В других случаях η > r. Чем это различие больше, тем связь более криволинейна. В предельном случае, когда связь строго криволинейна, и кривая проходит через групповые средние так,

что ηу = σ у , корреляционное отношение равно 1, а r =1.

х

Для вычисления σу применяется формула

 

 

 

 

 

х

 

 

 

 

 

 

 

 

n α

σ

 

=

 

n x (y x M y )2

=

y

 

N

N

 

 

 

 

 

 

x

 

 

где α y

 

= y x

M y ;

 

 

ух – условно среднее по признаку у.

2

y , (9.5)

Втех случаях, когда характер связи между изучаемыми признаками по графику проявляется недостаточно четко, проводят полный корреляционный анализ, т.е. вычисляют и коэффициент корреляции, и корреляционное отношение, а характер связи определяют математически, путем вычисления меры линейности и ее ошибки.

Врассматриваемом примере связь между диаметром и поперечником кроны согласно данным графика признана линейной, и для оценки степени ее

77

тесноты вычислили коэффициент корреляции. Предположим теперь, что связь между изучаемыми признаками в той же степени может быть признана нелинейной. Для доказательства характера связи проведем полный корреляционный анализ и, следовательно, в дополнение к коэффициенту корреляции вычислим корреляционное отношение, а затем меру линейности и ее ошибку.

 

Расчеты начинают с вычисления σу

 

. При этом предварительно состав-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ляется вспомогательная таблица (табл. 9.4) для вычисления

 

 

 

 

 

 

 

 

 

 

 

 

nx (yx My )2

.

 

 

 

 

 

 

 

 

 

 

 

 

(9.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 9.4

 

 

 

 

 

 

 

 

 

 

Вспомогательные расчеты

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wx

 

nх

 

 

 

 

ух

 

 

 

 

Му

 

 

 

 

 

 

α

у

 

 

 

 

 

 

α 2

 

nα2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

4

 

 

 

1,625

 

 

 

 

 

 

 

 

 

 

-1,475

 

 

 

 

 

2,1756

 

8,7024

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

 

8

 

 

 

1,94

 

 

 

 

 

 

 

 

 

 

 

-1,16

 

 

 

 

 

1,3456

 

10,7648

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

22

 

 

2,48

 

 

 

 

 

 

 

 

 

 

 

-0,62

 

 

 

 

 

0,3844

 

8,4568

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

40

 

 

3,05

 

 

3,10

 

 

 

 

 

-0,05

 

 

 

 

 

0,0025

 

0,1000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

28

 

25

 

 

3,44

 

 

 

 

 

 

 

 

 

 

 

0,34

 

 

 

 

 

0,1156

 

2,8900

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

 

17

 

 

3,76

 

 

 

 

 

 

 

 

 

 

 

0,66

 

 

 

 

 

0,4356

 

7,4052

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

 

9

 

 

 

4,28

 

 

 

 

 

 

 

 

 

 

 

1,18

 

 

 

 

 

1,3924

 

12,5316

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итого

 

125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nx (yx

2

= 50,8508

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

My )

 

 

Полученные в табл. 9.4 значения nx (yx

 

 

 

M y )2 подставим в формулу

и вычислим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nx (yx My )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

50,8508

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

=

 

 

 

 

=

 

= 0,4068 = 0,638.

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По величине σу

 

 

и ранее вычисленной σу

(см. табл. 9.3.) определим ве-

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ у

0,638

 

 

 

 

 

личину корреляционного отношения: η =

 

 

 

 

х

=

= 0,84.

 

 

 

 

 

 

 

 

 

 

 

0,76

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ у

 

 

 

 

 

 

 

 

 

 

Ошибка корреляционного отношения будет равна:

 

 

 

 

 

 

 

 

 

 

 

 

 

1 η 2

 

 

 

 

 

1 0,84 2

 

 

 

 

 

 

 

 

 

 

m

η

= ±

 

 

 

 

= ±

 

 

 

 

 

 

 

 

 

 

 

 

= ± 0,0265 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

 

125 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

78

Показатель достоверности корреляционного отношения:

t =

η

=

0,84

= 31,7;

 

0,0265

 

m

 

 

η

 

 

f = N 1 = 125 1 = 124 ; t0,95 = 1,96 2 < tη = 31,7.

Следовательно, корреляционное отношение достоверно. Доверительный интервал для генеральной совокупности с вероятностью 0,95 составит:

η r = η B ± t0,95 mη = 0,84 ± 2 0,0265 = 0,787 0,893 .

Оценка линейности корреляционной связи. Как указывалось выше, если по графику выявлен нечеткий характер корреляционной связи (линейная или нелинейная), то уточнение характера связи производится математически. С этой целью по величине r и η определяют меру криволинейности (Z), ее основную ошибку (mZ) и так называемый показатель меры линейности Блекмана (tZ).

Мера криволинейности обычно изменяется от 0 до 1. При К=0 связь строго прямолинейная, при К=1 связь строго криволинейная.

Мера криволинейности определяется по формуле

Z = η 2

r2 .

(9.7)

Для рассматриваемого примера зависимости поперечников кроны от диа-

метров на высоте груди мера линейности будет равна:

 

Z =η 2 r 2 = 0,842 0,8342

= 0,01;

tZ =

Z

 

=

0,0100

= 1,2 < t0,05

= 2,0.

 

 

 

m

Z

0,089

 

 

 

 

 

 

 

 

Следовательно, связь между признаками нужно признать линейной. Данный признак подтверждает предварительно выявленный по графику линейный характер связи.

3 Статистический анализ корреляции. Оценка показателей связи при малой выборке

Статистический анализ корреляции, установленный на основе выборочных характеристик, производится в принципе так же, как и анализ выборочных показателей распределения. Ошибки статистических показателей связи рассмотрены были выше. Полученные значения r и η и их ошибок позволяют произвести проверку нулевой гипотезы о том, значимы ли r и η. Или в более подробной ее постановке: совместимы ли полученные показатели с предположени-

79

ем о том, что в генеральной совокупности не существует связи между изучаемыми признаками, т.е. ρ = 0 и ηr = 0 (ρ и ηr – показатели генеральной совокупности). Критерий t, дающий решение имеет значение:

t =

r

(9.8)

t =

η

(9.9)

 

 

r

m

 

η

m

 

 

r

 

 

η

 

Если фактические значения tr и tη выше стандартных значений, приводимых в приложении 3 (при f = N - 1), то можно утверждать, что разность между выборочным показателем r и гипотетическим ρ = 0 (аналогично между η и ηr) является значимой. Нулевая гипотеза Но: ρ = 0; ηr = 0 отвергается. Для меры криволинейности tZ, если значение меньше критического t0,05 = 2,0, то выборочная Z – незначима. Она незначимо отличается от нуля, принимаемого в формуле для tZ за значение меры криволинейности в совокупности.

Для вычисления коэффициента корреляции при малой выборке используется формула:

r =

α x

α y

 

 

 

 

 

 

 

2

2 ,

(9.10)

y

 

 

 

α x

α y

 

 

x

 

 

 

 

 

 

 

 

 

где αx ,α y - отклонение отдельных значений наблюдений по признаку х, у от соответствующих средних значений Мх, Му.

Вычисление ry покажем на примере взаимосвязи диаметра на 1,3 м.

x

1,3) и текущего прироста по диаметру за 10 лет, выявленного у 15 тридцатилетних стволов, согласно данным М.Л. Дворецкого [5].

Исходные данные и расчет отклонений показаны в табл. 9.5. При составлении табл. 9.5 предварительно вычисляют Мх, Му.

 

 

M

 

= x =

195

 

=13см,

 

М = у

=

28,5

 

=1,9 см.

 

 

x

 

 

 

 

 

 

 

 

N

 

15

 

 

 

 

 

у

N

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отклонения вычисляются по формулам:

 

 

 

 

 

 

α x = x M x

 

 

 

 

(9.11)

 

 

αy = yMy

(9.12)

Подставив табличные данные в формулу, определим коэффициент корре-

ляции:

r =

α x

α y

 

 

=

47 ,7

 

= +0,97 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α x2

 

 

 

192 12 ,6

 

 

 

 

 

 

 

α y2