Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Игнатенко Статистическая оценка данных екологического мониторинга 2010.pdf
Скачиваний:
131
Добавлен:
16.08.2013
Размер:
2.09 Mб
Скачать

рех. Поскольку величина C заведомо больше единицы, то после вычисления значения V можно уже проверить выполнение нера-

венства V χ2табл Если оно окажется справедливым, то гипотезу об однородности дисперсий можно принять. Если V > χ2табл то следует

вычислить C и довести проверку до конца.

Применение критерия Бартлетта, как видно, является достаточно трудоемким. Кроме того, следует иметь в виду, что он весьма чувствителен к отклонениям от нормальности распределения.

1.9. Проверка однородности средних

Здесь исследуются две выборки, имеющие различные средние арифметические. Данная проверка позволяет установить, вызвано ли расхождение между средними случайными ошибками измерения или оно связано с влиянием каких-либо неслучайных факторов. Эта процедура находит широкое применение, например, в случаях, если требуется установить идентичность параметров одинаковых измерений, выполненных разными приборами. Проверка проводится с применением t-критерия Стьюдента. Пусть n1 и n2 – объемы выборок, измеряемой величины yi, у1 и у2 соответствующие сред-

ние значения выборок, s12 и s22 – оценки дисперсий, найденные по

этим выборкам.

Предстоит рассмотреть два случая.

1. Дисперсии s12 и s22 однородны. Вычисляется расчетное t- отношение по формуле

tрасч =

| y1 y2 |

((1/ n1 +1/ n2 ) (((n1 1)s12 +(n2 1)s22 )/ (n1 + n2 2))). (1.18)

Из таблиц распределения Стьюдента при уровне значимости q и числе степеней свободы f = n1 + n2 – 2 находят табличное значение

tтабл (см. табл. 1.1). Если tрасч > tтабл, то расхождение между средними значимо. В противном случае можно принять гипотезу об однород-

ности средних. Формула (1.18) упрощается, если обе выборки имеют одинаковый объем, т.е. n1 = n2 = n3 =...= n. В этом случае

21

tрасч =

 

 

 

 

 

s2

+ s2

 

n .

(1.19)

y

y

2

 

1

 

 

1

2

 

 

 

2. Дисперсии s12 и s22 неоднородны. Как и в предыдущем слу-

чае, здесь можно использовать t-критерий Стьюдента, но формула для tрасч имеет уже следующий вид [8]:

 

 

 

 

 

tрасч=

 

y

 

y

2

 

 

s2

n + s2

n

.

 

(1.20)

 

 

 

 

 

 

 

 

1

 

 

 

 

1

1

 

2

2

 

 

 

Далее вычисляют величину f по формуле

 

 

 

 

 

s2

s2

2

s2

2

 

 

 

 

 

s2

 

2

 

 

 

f =

 

1

+

2

 

 

 

 

1

 

 

(n

+1)+

 

2

 

 

 

(n

+1)2 .

(1.21)

 

 

 

 

 

 

 

 

n

n

 

 

n

 

1

 

 

n

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

1

 

 

 

 

 

2

 

 

 

 

 

Найденное значение f округляют до целого и принимают за число степеней свободы. По этой величине и по уровню значимости q из таблиц распределения Стьюдента отыскивается tтабл. Дальнейший ход проверки не отличается от предыдущего случая.

1.10. Проверка нормальности распределения

При рассмотрении всех предыдущих статистических процедур предполагалось, что выходная величина подчиняется нормальному закону распределения. Это предположение можно проверить разными способами. Наиболее строгим из них является применение критерия χ2 Пирсона. Для этого необходимо иметь выборку достаточно большого объема: n ≥ 50 – 150. Диапазон изменения выходной величины в этой выборке разбивается на l интервалов так, чтобы эти интервалы покрывали всю ось от –∞ до +∞, и в каждый интервал при этом попало не менее пяти значений выходной величины. Подсчитывают количество mi, наблюдений, попавших в каждый интервал. Затем вычисляют теоретические вероятности попадания случайной величины в каждый i-й интервал. Для этого используют формулу

P = Ф(z2) – Ф(z1),

где,

 

 

yн

y

 

 

 

yв

y

 

 

 

z

=

i

z

2

=

i

,

(1.22)

 

 

1

 

s

 

 

s

 

 

 

 

 

 

 

 

 

22

в которой y – среднее арифметическое выборки; s – среднее квадратическое отклонение выборки; yiн – нижняя граница i-го интер-

вала;

yв

– верхняя граница i-го интервала; Ф(z) – нормированная

 

i

 

 

 

функция Лапласа:

 

z

 

 

Ф(z)=

1

 

 

ex2 2dx .

 

 

 

 

 

 

2π 0

Значения ее для z = z1 и z = z2 определяют из таблиц [9]. При отыскании значений этой функции для отрицательных значений аргумента следует иметь в виду, что функция Ф(z) нечетная:

Ф(–z) = – Ф(z).

 

Следующим этапом является вычисление величины

χрас2 по

формуле

 

l

 

χрасч2 = (mi pi n)2 pi n .

(1.23)

i=1

 

По выбранному уровню значимости q и числу степеней свободы k = l – 3 из статистических таблиц приложения 4 отыскивают χ2табл . Гипотезу о нормальности распределения можно принять, если

χ2расч < χ2табл .

1.11. Коэффициент корреляции

Во многих случаях целью экспериментальных исследований является установление и изучение зависимости между некоторыми величинами. Если каждая из этих величин является случайной, то при этом используют методы корреляционного анализа. Так, методами корреляционного анализа можно оценить степень взаимосвязи между пределом влажности воздуха и количеством дисперсных загрязняющих частиц и т.д.

Будем говорить, что между двумя случайными величинами имеется статистическая связь, если при изменении одной из них меняется распределение другой. Для оценки статистической связи по данным эксперимента широко используется выборочный коэффи-

23

циент корреляции. Пусть проведено n наблюдений и в каждом из них определялись значения двух параметров (признаков) x и y. Следовательно, имеются две одновременно получаемые выборки: x1, x2 ,..., xn и y1, y2 ,..., yn .

По каждой из них найдем среднее арифметическое x и y , а

также выборочный стандарт sx и sy. Выборочный коэффициент корреляции r рассчитывается по формуле

r = n ((xi

 

)(yi

 

))/((n 1)sxsy ),

 

x

y

(1.24)

i=1

 

которую можно переписать в виде, более удобном для вычислений:

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

nxi yi yi

 

 

 

 

 

 

 

r =

 

 

i=1

 

i=1

 

 

 

 

 

.

(1.25)

 

 

 

2 n

 

 

 

 

 

 

n

 

n

 

 

n

2

 

 

nxi2

xi

nyi2

yi

 

 

 

 

i=1

 

 

 

i=1

 

 

 

 

i=1

i=1

 

 

 

При расчетах полезно иметь в виду, что выборочный коэффициент корреляции не изменяется при изменении начала отсчета и масштаба измерения x и у.

Коэффициент корреляции всегда лежит в пределах – 1 < r < 1. Он характеризует не всякую, а только линейную зависимость между случайными величинами. При положительном r можно предполагать, что с возрастанием одной из случайных величин другая в среднем тоже возрастает. При отрицательном r с ростом одной из них другая величина будет в среднем убывать. Чем ближе величина r к 1 или к (–1), тем больше степень линейной зависимости между рассматриваемыми случайными величинами. Значение r = 0 свидетельствует об отсутствии линейной статистической связи между ними. Такие случайные величины называются некоррелированными. Для выяснения, будут ли некоррелированными в этом случае признаки х и у, вычисляют величину [3]

tрасч =

 

r

 

(n 2)

(

1r2

)

.

(1.26)

 

 

 

 

Ее сравнивают с табличным значением t-критерия Стьюдента, найденным при выбранном уровне значимости q и числе степеней

24

свободы f = п – 2. Если tрасч < tтабл, принимается гипотеза о некоррелированности величин х и у. В противном случае коэффициент корреляции значимо отличается от нуля, т.е. между величинами x и y существует линейная статистическая связь.

Пример. При исследовании влияния низко интенсивного ЭМИ (2–10 мкВт/см2, 9–10 ГГц) на прорастание семян ржи получено 16 замеров:

хi

5

2

5

10

7

7

7

7

5

5

15

14

12

8

10

11

уi

2

1,5

3

3

3

3

3

3

3

2

8

5

5

4

4

5

где x – мощность потока, y – длина корешка проращиваемого зерна в мм. Требуется выяснить, имеется ли корреляционная связь между этими показателями.

Предварительно вычислим суммы:

 

 

хi = 130;

хi2= 1250;

 

 

 

 

уi = 59,5;

уi2 = 260,25;

хi уi = 564.

 

 

Далее вычисляем коэффициент корреляции

 

 

r =

(16 564 130

59,5)

 

= 0,916 .

(

)(

260,25 572

)

 

16 1250 1302

16

 

 

Результаты вычислений свидетельствуют о значительной корреляционной связи между рассматриваемыми параметрами. Оценим формально значимость коэффициента корреляции, для чего вычислим tрасч по формуле (1.26):

tрасч = 0,926 (16 2)(1 0,926)2 = 9,162 .

Для q = 0,05 найдем из табл. 1.1 при f = n – 2 = 14, tтабл = 2,14.

Сравнивая tрасч с tтабл, получим: tрасч = 9,162 > tтабл = 2,14. Это подтверждает вывод о наличии корреляционной связи между ис-

следуемыми показателями.

Если требуется исследовать статистическую связь между тремя и более случайными величинами, то пользуются коэффициентом множественной корреляции. Так, для оценки степени статистической связи случайной величины z с величинами x и у рассчитывают выборочный совокупный коэффициент корреляции p по формуле

25

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]