Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Биометрическая обработка данных на основе компь...doc
Скачиваний:
29
Добавлен:
11.11.2019
Размер:
1.7 Mб
Скачать

2.4. Параметрические критерии сравнения средних

В биологических исследованиях постоянно приходится сравнивать выборочные совокупности (данные контроля и опыта, сходные признаки у разных групп растений и животных). О различии сравниваемых групп судят по разности значений их выборочных показателей, но так как выборочные показатели – величины случайные, варьирующие вокруг своих генеральных параметров, то разность между ними может возникнуть не вследствие систематически действующих на признак в одной группе и не действующих в другой группе причин, а чисто случайно.

Поэтому возникает необходимость установления истинной значимости различий. С этой целью требуется проанализировать нулевую гипотезу (Но), согласно которой первоначально предполагается, что между изучаемыми показателями достоверного различия нет, а выявленные различия являются случайными. То есть, принять Но – значит согласиться с тем, что выборочные совокупности взяты из одной генеральной совокупности. Отклонить нулевую гипотезу (принять альтернативную гипотезу На) то есть признать, что различие между показателями достоверно с определенной вероятностью (95%, 99%, 99,9%).

При сравнении совокупностей, имеющих нормальный тип распределения, для проверки истинности нулевой гипотезы используют параметрические критерии оценок: критерий Фишера (F), критерий Стьюдента (Т), для которых функции распределения известны. Для каждого критерия имеется таблица (табл. 9-10), в которой обозначены критические точки, отвечающие определенным числам степеней свободы и принятым уровням значимости.

Критерий Фишера используют для оценки равенства генеральных дисперсий . На основе критерия Фишера проверяется нулевая гипотеза об отсутствии разницы между дисперсиями. Если разницы между дисперсиями нет, то разница между средними арифметическими не обусловлена влиянием случайных причин.

Определяют критерий Фишера (F) нахождением отношения выборочных дисперсий: F= .

Фактическое значение F сравнивается со стандартными значениями, приведенными в таблице 11. Значения критерия Фишера при уровнях значимости Р≤0,05, Р≤0,01 и Р≤0,001. Стандартное значение F зависит от степеней свободы 1=n1- 1 и 2=n2 - 1. Нулевая гипотеза о равенстве дисперсий двух выборок принимается, если F фак. ≤ Fst. Дисперсия характеризует внутригрупповую изменчивость. Если дисперсии равны, наблюдаемая разница между выборочными средними обусловлена влиянием изучаемого фактора. Разница между средними арифметическими не обусловлена влиянием случайных причин. Критерий Фишера повышает точность оценки разности между генеральными параметрами, особенно при использовании малочисленных выборок.

При равенстве дисперсий парных выборок (одинаковое количество объектов в выборках) проверка гипотезы о равенстве выборочных средних производится

1) на основе Статистики Стьюдента

,

если ( из таблицы 12 Стандартные значения критерия Стьюдента для принятого уровня значимости и числа степеней свободы ; n1 – число объектов в первой выборке, n2 – число объектов во второй выборке), то разница достоверна;

Таблица 11

Стандартные значения критерия Фишера- F (дисперсионное отношение Фишера)

2

Γ1

1

2

3

4

5

6

7

8

9

10

11

3

167,5

34,1

10,1

148,5

30,8

9,6

141,1

29,5

9,3

137,1

28,7

9,1

134,6

28,2

9,0

132,9

27,9

8,9

131,8

27,7

8,9

130,6

27,5

8,8

130,0

27,5

8,8

129,5

27,2

8,8

128,9

27,1

8,8

4

74,1

21,2

7,7

61,2

18,8

6,9

56,1

16,7

6,6

53,4

16,0

6,4

51,7

15,5

6,3

50,5

15,2

6,2

49,8

15,0

6,1

49,0

14,8

6,0

48,6

14,7

6,0

48,2

14,7

6,0

47,8

14,5

5,9

5

47,0

16,3

6,6

36,6

13,3

5,8

33,2

12,1

5,4

31,1

11,4

5,2

29,8

11,0

5,1

28,8

10,7

5,0

28,2

10,5

4,9

27,6

10,3

4,8

27,3

10,2

4,8

27,0

10,1

4,7

26,7

10,0

4,7

6

35,5

13,4

6,0

27,0

10,9

5,1

23,7

9,8

4,8

21,9

9,2

4,5

20,8

8,8

4,3

20,0

8,5

4,3

19,5

8,3

4,2

19,0

8,1

4,1

18,8

8,0

4,1

18,5

7,9

4,1

18,3

7,8

4,0

7

29,2

12,3

5,6

21,7

9,6

4,7

18,8

8,5

4,4

17,2

7,9

4,1

16,2

7,5

4,0

15,5

7,2

3,9

15,1

7,0

3,8

14,6

6,8

3,7

14,4

6,7

3,7

14,

6,6

3,6

13,1

6,5

3,6

8

25,4

11,3

5,3

18,5

8,7

4,6

15,8

7,6

4,1

14,4

7,0

3,8

13,5

6,6

3,7

12,9

6,4

3,6

12,5

6,2

3,5

12,0

6,0

3,4

11,8

5,9

3,4

11,6

5,8

3,3

11,4

5,7

3,3

9

22,9

10,6

5,1

16,4

8,0

4,8

13,9

7,0

3,6

12,6

6,4

3,6

11,7

6,1

3,5

11,1

5,8

3,4

10,8

5,6

3,3

10,4

5,5

3,2

10,2

5,4

3,2

10,0

5,3

3,1

9,8

5,2

3,1

10

21,0

10,0

5,0

14,9

7,9

4,1

12,3

6,6

3,7

11,3

6,0

3,5

10,5

5,6

3,3

9,9

5,4

3,2

9,6

5,2

3,1

9,2

5,1

3,1

9,0

5,0

3,0

8,9

4,9

2,9

8,7

4,8

2,9

11

19,7

9,7

4,8

13,8

7,2

4,0

11,6

6,2

3,6

10,4

5,7

3,4

9,6

5,3

3,2

9,1

5,1

3,1

8,8

4,9

3,0

8,4

4,7

3,0

8,2

4,6

2,9

8,0

4,5

2,9

7,8

4,5

2,9

12

18,6

9,3

4,8

12,3

6,9

3,9

10,8

6,0

3,5

9,6

5,4

3,3

8,9

5,1

3,1

8,4

4,8

3,0

8,1

4,7

2,9

7,7

4,5

2,9

7,5

4,4

2,8

7,4

4,3

2,8

7,2

4,2

2,7

13

17,8

9,1

4,7

12,3

6,7

3,8

10,2

5,7

3,4

9,1

5,2

3,2

8,4

4,9

3,0

7,9

4,6

2,9

7,6

4,4

2,8

7,2

4,3

2,8

7,0

4,2

2,7

6,9

4,1

2,7

6,7

4,0

2,6

14

17,1

8,9

4,6

11,8

6,5

3,7

9,7

5,6

3,3

8,6

5,0

3,1

7,9

4,7

3,0

7,4

4,5

2,9

7,1

4,3

2,8

6,8

4,1

2,7

6,6

4,0

2,7

6,5

3,9

2,6

6,3

3,9

2,6

15

16,6

8,7

4,5

11,3

6,4

3,7

9,3

5,4

3,3

8,3

4,9

3,1

7,6

4,6

2,9

7,1

4,3

2,8

6,8

4,1

2,7

6,5

4,0

2,6

6,3

3,9

2,6

6,2

3,8

2,6

6,0

3,7

2,5

2) на основе сравнения критерия Стьюдента для парных переменных

,

определяется по выборке составленной из разности парных элементов двух сравниваемых выборок.

Если ( из таблицы 12). Стандартные значения критерия Стьюдента для принятого уровня значимости и числа степеней свободы , n - число пар), то разница достоверна.

Если выборки не парные:

•при равенстве дисперсий критерий определяется по формуле

Т=d •;

•при неравенстве дисперсий

Т=( .

Для каждого критерия программа STATISTICA определяет уровень значимости и сравнивает с уровнем значимости Р≤0,05. Если показатель значимости оцениваемого критерия больше 0,05, разница между генеральными средними не достоверна.

Если показатель значимости оцениваемого критерия меньше 0,05 разница между генеральными параметрами достоверна. Результат, полученный при сравнении выборок, будет наблюдаться при сравнении генеральных совокупностей у 95 особей из каждой ста сравниваемых.

После проверки критерия Фишера рассчитывают критерий Стьюдента – Т статистика для оценки разности между выборочными средними. Критерий Стьюдента проверяет нулевую гипотезу о равенстве выборочных средних. В зависимости от результатов сравнения дисперсий применяют различные формулы вычислений Т – статистики: для непарных выборок при равенстве дисперсий; для непарных выборок при неравенстве дисперсий (используется критерий Уэлча); для парных выборок. При Тфак.≥Тst. (табл. 12) разница между выборочными средними установлена.

Для каждой статистики вычисляется уровень значимости Р соответствующей нулевой гипотезы отсутствия различий. Если Р≥0,05 нулевая гипотеза может быть принята. В случае нескольких выбранных переменных вычисления производятся для всех пар переменных.

Если условия применения параметрических критериев сравнения средних не выполнимы, то необходимо использовать непараметрические критерии сравнения средних.

Таблица 12

Стандартные значения критерия Стьюдента

(критерия достоверности разности)

Число степеней свободы,

Вероятность, Р

Число степеней свободы, 

Вероятность, Р

0,95

0,99

0,999

0,95

0,99

0,999

1

12,7

63,66

637,0

16

2,12

2,92

4,02

2

4,30

9,93

31,60

17

2,11

2,90

3,97

3

3,18

5,84

12,94

18

2,10

2,88

3,92

4

2,78

4,60

8,61

19

2,09

2,86

3,88

5

2,57

4,03

6,86

20

2,09

2,85

3,85

7

2,37

3,50

5,41

22

2,07

2082

3,79

8

2,31

3,36

5,04

23

2,07

2081

3,77

9

2,26

3,25

4,78

24

2,06

2,80

3,75

10

2,23

3,17

4,49

25

2,06

2,79

3,73

11

2,20

3,11

4,44

26

2,06

2,78

3,71

12

2,18

3,06

4,32

27

2,05

2,77

3,69

13

2,16

3,01

4,22

28

2,05

2,76

3,67

14

2,15

2,98

4,14

29

2,05

2,76

3,66

15

2,13

2,95

4,07

30

2,04

2,75

3,65

1,96

2,58

3,29

Пример 1. Даны две независимые выборки с показателями массы тела крабов (Pachygrapsus crassipes).

Выборка 1.

6,1

9,6

11,5

13,8

7,1

8,6

11,6

13,3

6,6

8,8

12,7

10,7

12,6

7,0

10,5

11,8

12,4

8,3

11,6

11,3

14,5

17,8

9,7

11,3

12,5

15,6

9,1

10,6

13,6

14,7

9,5

10,5

Выборка 2.

19,8

13,8

11,5

16,7

12,7

11,1

17,6

13,6

11,7

16,5

13,3

13,5

10,3

14,4

12,5

9,0

14,6

12,6

9,0

15,3

13,3

11,6

9,1

15,8

13,6

8,1

14,7

12,5

15,6

10,8

14,5

10,8

Определите для этих выборок среднюю арифметическую, дисперсию, ошибку средней арифметической. Проведите сравнение этих выборок на основе критерия Фишера и Стьюдента.

Результаты обработки.

Оценка параметров на основе описательной статистики:

11,1±0,47 7,32

=13,1±0,47 7,32

Оценка нормальности 1-й выборки. Критерий Колмогорова-Смирнова d=0,106808 значимость=>0,2; значимость Лилиефорса>0,2; критерицй Шапиро-Уилка W=0,98692, значимость 0,98692>0,05. Распределение не отличается от нормального.

Оценка нормальности 2-й выборки. Критерий Колмогорова-Смирнова d=0,106808 значимость=>0,2; значимость Лилиефорса>0,2; критерицй Шапиро-Уилка W=0,98692, значимость 0,98692>0,05. Распределение соответствует нормальному типу.

Оценка достоверности разности между средними арифметическими следует провести на основе параметрических критериев достоверности оценок.

Для запуска программы в верхнем меню Statistics надо выбрать команду Basic Statistic/Tables (основные статистики/таблицы). Откроется меню команды, в котором Т – критерий представлен четырьмя процедурами:

 Т- test, independent, by variables (Т – критерий для независимых выборок) применяется, если надо сравнить средние двух независимых выборок;

 Т- test, independent, by groups (Т – критерий для независимых выборок с группирующей переменной) используется, если надо сравнить средние двух независимых групп, полученных из одной выборки при помощи группирующей переменной;

 Т- test, dependent samples (Т – критерий для зависимых выборок ) применяется, если надо сравнить средние двух зависимых групп;

 t- test, single samples (простые выборки) используется для оценки достоверности выборочных средних.

Для оценки достоверности разности между средними арифметическими независимых выборок (пример 1) необходимо определить:

 t- test, single samples (простые выборки) используется для оценки достоверности выборочных средних;

 Т- test, independent, by variables (Т – критерий для независимых выборок).

Судить о том, как та или иная выборочная величина характеризует соответствующий параметр генеральной совокупности, позволяет критерий достоверности выборочного показателя. Он обозначается буквой t с подстрочным знаком того показателя для которого он вычисляется: – критерий достоверности средней арифметической.

Если критерий достоверности t> 3, то есть выборочный показатель превышает в три раза свою ошибку , такая выборка достоверно характеризует генеральную совокупность.

По 1-й выборке T= 23,21> 3; Р=0.0<0,05. Выборочная средняя арифметическая достоверно характеризует генеральную среднюю. По 2-й выборке T= 27,38> 3; Р=0.0<0,05. Выборочная средняя арифметическая достоверно характеризует генеральную среднюю.

Если критерии достоверности выборочных показателей меньше трех (t<3), то выборочные показатели меньше трех своих ошибок ( , , ), то такая выборка не может быть использована для характеристики генеральной совокупности.

Критерий Фишера=1,0; Р=1,0>0,05 (стандартное значение Фишера =1,84 при числах степеней свободы 31 и 31).

Принимается нулевая гипотеза. Нет различий между выборочными дисперсиями. Разница между средними не обусловлена влиянием случайных причин.

Статистика Стьюдента=2,954; Р=0,04<0,05 (стандартное значение статистики Стьюдента=2,0 при числе степеней свободы=62). Разница между средними арифметическими достоверна.

Пример 2. Охарактеризуйте зависимые выборки (годовой удой буйволиц: матерей и дочерей) по следующему плану:

•описательная статистика;

•гистограмма и тест нормальности;

•критерии достоверности оценок (критерий Фишера, критерий Стьюдента).

Выборка 1. 4942 4914 4440 4325 3340 3880 4050 4030 3970 5323 4502 4384 4450 4550 4825 4905

Выборка 2. 4502 4440 3340 3880 4050 3970 5323 4914 4030 4942 4905 4825 4325 4650 4450 4384

Заключение по примеру 2.

Оценка параметров выборок.

124,4

=4433±125,0

Оценка нормальности 1-й выборки. Критерий Колмогорова-Смирнова d=0,11437 значимость=>0,2; значимость Лилиефорса>0,2; критерий Шапиро-Уилка W=0,97150, значимость 0,86230>0,05. Распределение не отличается от нормального.

Оценка нормальности 2-й выборки. Критерий Колмогорова-Смирнова d=0,10189 значимость=>0,2; значимость Лилиефорса>0,2; критерий Шапиро-Уилка W=0,97471, значимость 0,90790>0,05. Распределение соответствует нормальному типу.

Для оценки достоверности разности между средними арифметическими зависимых выборок (пример 2) необходимо определить:

 t- test, single samples (простые выборки) используется для оценки достоверности выборочных средних;

 Т- test, dependent samples,(Т – критерий для зависимых выборок) применяется, если надо сравнить средние двух зависимых групп

По 1-й выборке t= 35,48> 3; Р=0.0<0,05. Выборочная средняя арифметическая достоверно характеризует генеральную среднюю. По 2-й выборке t= 35,46> 3 ; Р=0.0<0,05. Выборочная средняя арифметическая достоверно характеризует генеральную среднюю.

Критерий Фишера=1,0 (стандартное значение статистики Фишера=2,4 при числе степеней свободы 15,15),значимость=0,99 больше 0,05. Нет различий между выборочными дисперсиями. Разница между средними арифметическими не обусловлена влиянием случайных причин.

Критерий Стьюдента для парных значений 0,02 (стандартное значение=2,13 при числе степеней свободы=15), значимость=0,97 больше 0,05. Разница между средними арифметическими не достоверна.

Пример 3. При кормлении тушканчиков сухой пищей получены следующие данные о средних температурах тела самцов и самок:

Самки: 36,9 36,8 37,0 36,6 37,3 36,8 37,3 37,1

Самцы: 36,7 36,7 36,8 36,6 37,3 36,8 37,3 37,1

Определите достоверность разницы по температуре тела самцов и самок.

Для оценки достоверности разности между средними арифметическими независимых выборок (пример 3) необходимо определить: t- test, independent, by groups (Т – критерий для независимых выборок с группирующей переменной). Метод используется при сравнении групп, полученных из одной выборки при помощи группирующей переменной.

Оценка параметров выборок.

0,088

=36,8±0,053

По 1-й выборке T= 420,1> 3 ; Р =0.0<0,05. Выборочная средняя арифметическая достоверно характеризует генеральную среднюю. По 2-й выборке T= 694,3> 3 ; Р =0.0<0,05. Выборочная средняя арифметическая достоверно характеризует генеральную среднюю.

Для оценки достоверности разности между средними арифметическими выборок (пример 3) необходимо оценить t- test independent, by groups (Т – критерий для независимых выборок с группирующей переменной).

Критерий Фишера=2,71; Р=0,21>0,05 (стандартное значение Фишера =3,79, при числах степеней свободы 7 и 7). Принимается нулевая гипотеза. Нет различий между выборочными дисперсиями. Разница между средними не обусловлена влиянием случайных причин. Статистика Стьюдента=1,69; Р=0,11>0,05 (стандартное значение статистики Стьюдента=2,14 при числе степеней свободы=14). Разница между средними арифметическими не достоверна.

Задания для самостоятельной работы

Задание 1. Приведены показатели плотности птиц (особей/км²) в лесопарках г. Тюмени, с разной плотностью рекреационной нагрузки:

А) лесопарк «Затюменский» (рекреационная нагрузка 21 чел./ч.

102,7

22,2

57,4

5,6

16,7

1,9

4,3

22,2

24,1

7,4

16,7

13

3,7

7,4

9,3

1,9

3,7

1,9

1,9

14,8

1,9

1,9

1,9

1,9

Б) лесопарк «Гилевская роща» (рекреационная нагрузка 16чел./ч.)

78,2

39,3

30,9

130,2

10,9

3,6

7,3

18,2

1,8

10,9

27,3

67,3

7,3

7,3

1,8

1,1

3,6

1,8

1,1

3,6

1,8

1,1

1,8

7,3

9,1

7,3

1,8

1,8

Проведите сравнение независимых выборок по следующему плану: описательная статистика; гистограмма и тесты нормальности; критерий достоверности выборочных средних арифметических; критерии достоверности оценок (критерий Фишера, статистика Стьюдента).

Задание 2. Для контроля развития проведены взвешивания группы кроликов (кг). Сравните зависимые выборки по следующему плану:

- описательная статистика;

- гистограмма и тесты нормальности;

- критерии достоверности выборочных средних арифметических;

- критерии достоверности оценок (критерий Фишера, критерий Стьюдента).

Выборка 1.

1,9

2,4

3,0

2,7

2,1

1,6

1,2

1,6

2,2

2,1

2,3

1,5

1,3

2,2

2,5

2,3

2,1

1,0

1,8

1,9

1,8

3,2

2,1

2,9

3,0

1,3

2,0

2,6

2,5

1,9

Выборка 2.

2,6

3,1

3,7

3,4

2,8

2,3

1,9

2,3

2,9

2,8

3,0

2,2

2,0

2,9

3,2

3,0

2,8

1,7

2,5

2,6

2,5

3,9

2,8

3,6

3,7

2,0

2,7

3,3

3,2

2,6

Контрольные вопросы:

1.Объясните применение параметрических критериев достоверности оценок. 2. Что характеризует средняя арифметическая, среднее квадратическое отклонение, дисперсия, квартили, медиана, показатели асимметрии, эксцесса? 3. Каковы значения показателей асимметрии и эксцесса при нормальном распределении? 4. Что принято называть доверительным интервалом, ошибками репрезентативности? 5. Какие особенности нормального распределения? 6. При решении, каких вопросов используют функции нормального распределения?7. Выявите различия между генеральными параметрами и выборочными характеристиками. 8. Объясните вероятности Р=0,95, Р=0,99, Р=0,999, уровни значимости Р=0,05, Р=0,01, Р=0,001. 9. Объясните применение критерия Фишера и Стьюдента, статистики Стьюдента при сравнении средних.