Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
НИРС / Методические рекомендации по написанию и оформлению научных работ.DOC
Скачиваний:
202
Добавлен:
06.02.2015
Размер:
1.01 Mб
Скачать

Алгоритм выбора критерия

Характер

распределения

Характер связи между группами

Связанные

(до и после эксперимента)

Независимые

(опыт и контроль)

Больше 2-х групп

Нормальное

Объем выборки 10-30 - критерий Стъюдента (t) 1,2

объем выборки 40 – 100 - критерий Колмагорова-Смирнова1

Объем выборки 40–100 - критерий Х2

Объем выборки 40–100 - критерий Фишера-Ирвина 1

Ненормальное

Объем выборки < 20 - критерий Вилкоксона–Манна–Уитни (U) 1

Объем выборки > 5 - критерий знаков (Z) 1

Объем выборки 6–25 - парный критерий Вилкоксона (T) 1,2

Объем выборки > 5 - критерий Уайта (К) 1

Объем выборки 11–26 - критерий Розенбаума (Q) 2

Объем выборки 12–40 - критерий Вилкоксона (W) 1,2

Примечание: 1 – в качественной форме (для показателей выраженных в форме + или - ), 2 – в количественной форме

t-критерий Стъюдента

Применяется для определения достоверности при сравнении двух связанных выборочных средних, при этом выборки должны иметь равный объем n. Если число наблюдений (n< 30) критерий достоверности определяется по таблице Стьюдента. Однако при малочисленных выборкахt– критерий оказывается недостаточно точными. С увеличениемn(числа наблюдений), распределение быстро приближается к нормальному с параметрами М = 0 и σ = 1 и уже приn≥ 30 не отличается от него. Еслиn= 30, то достоверность разности между двумя средними величинами или показателями определяется по формуле:

где М – значение средней в выборочной совокупности n1иn2соответственно, Р – для показателя доли (%),m– ошибка репрезентативности

При значении t= 2 говорят о достоверности различий двух средних или относительных величин с вероятностью Р > 95,5 % и выше.

При значении t= 2,58 иt= 3 различия достоверны с вероятностью Р > 99 % и Р > 99,9 % соответственно.

При t< 2 различия считают случайными или недоказанными.

Определив величину t- критерия Стьюдента необходимо провести оценку критерия по таблице (приложение, табл.I). Н0отвергается, еслиtфакт≥t stдля принятого уровня значимости и числа степеней свободыk=n1+n2– 2.

Точный метод Фишера-Ирвина

Критерий применяется для проверки нулевой гипотезы (Н0) о том, отобраны ли две исследуемые бинарные выборки из генеральных совокупностей с одинаковой частотой встречаемости изучаемого эффекта.Бинарная (или дихотомическая) – это качественная (категориальная) переменная, включает только две возможные категории, например, да/нет, есть заболевание/нет. Рассматриваемый метод предназначен для обработки так называемых четырехпольных (четырехклеточных) таблиц или таблиц «2 х 2».

Пример.

Действие 2 фактора, вызывающий эффект Б

Действие 1 фактора, вызывающего эффект А:

Да Нет Всего

Да

Нет

a b a + b

c d c + d

Всего

a + c b + d a + b + c + d

В результате вычислений получается точное значение уровня значимости нулевой гипотезы. Вычисление производится по формуле:

n = a + b + c + d. (5)

К следующим методам относятся методы, позволяющие оценить статистическую значимость различий значений признака в двух совокупностях в случае, когда имеется малое число наблюдений и характер распределения неизвестен. Более того, когда результаты выражены полуколичественными или описательными характеристиками (например, + или - ).

Критерий Манна-Уитни (U)

Критерий Uудобно применять при малом объёме выборок (n<20). Данный критерий оперирует не с абсолютными значениями элементов двух выборок, а с результатами их парных сравнений. Используется для выяснения достоверности качественных характеристик изучаемых параметров. То есть изменился или нет изучаемый признак, без количественного изменения (+ или - ).

U = a1 + a2 + …. + ax + ½ • (b1 + b2 + ….. + bx) (6)

где a1 , a2 , …. , ax - число случаев, когда a > b,

b1,b2, …..,bx- число случаев, когдаa=b.

Пример. В группе больных (8 чел.) показатель Х составил:

0,6; 1,0; 1,4; 2,1; 2,6; 2,8; 3,4; 3,7

В группе контроля (9 чел.) соответствующий показатель Yсоставил:

1,8; 2,2; 2,9; 3,0; 3,8; 4,1; 4,4; 4,8; 4,9

Достоверно ли различие показателей в основной и контрольной группах?

Данные располагают в порядке возрастания, таким образом, чтобы в одной строке был один результат:

X

Y

Число инверсий

0,6

-

0

1,0

-

0

1,4

-

0

-

1,8

-

2,1

-

1

-

2,2

-

2,6

-

2

2,8

-

2

-

2,9

-

-

3,0

-

3,4

-

4

3,7

-

4

-

3,8

-

-

4,1

-

-

4,4

-

-

4,8

-

-

4,9

-

Определяют число инверсий (нарушений в расположении чисел, когда число ряда Yстоит впереди числа рядаX). Перед 0,6, 1,0 и 1,4 нет чисел рядаY, поэтому инверсия нулевая. Перед числом 2,1 – одна инверсия (1,8). Перед числами 2,6 и 2,8 – две (1,8 и 2,2). Перед числами 3,4 и 3,7 четыре (1,8, 2,2 , 2,9, 3,0).

Сумма всех инверсий ∑ = 1 + 2 +2 + 4 + 4 = 13.

Найденную величину сравниваем с табличным значением (приложение, табл. II).

При n1 иn2 находим максимальное значение, при котором можно считать различия в сравниваемых группах достоверными. Оно равно 18 при Р = 95 % и 11 при Р = 99 %. Следовательно, различие опытной и контрольной группы статистически достоверно (95 %, Р = 99 %).

Критерий Вилкоксона (W)

Ранговый критерий, оперирует не численными значениями вариант, а их рангами (то есть числами 1, 2, 3 и т. д. описывающими их положение в упорядоченном наборе данных) – исследование «случай-конроль». Применяется для сравнения двух независимых совокупностей одинаковой или разной численности по их центральной тенденции. Выборки могут принадлежать порядковой или количественной шкале. Критерий рекомендуется для выборок умеренной численности (численность каждой выборки от 12 до 40). Имеется простая формула связи рассматриваемого критерия с U–критерием Манна–Уитни, поэтому данные критерии в некоторых источниках носят наименование критериев Вилкоксона–Манна–Уитни:

где n– число наблюдений первой выборки,m– число наблюдений второй выборки.

Вычисляют эмпирическое значение критерия Вилкоксона (Wфакт) для сравниваемых выборок. Плюсовые и минусовые разности парных вариант сравниваемых выборок ранжируют, так, что бы наименьшая по абсолютной величине разность получила первый ранг (разности равные нулю в расчет не принимаются). Меньшая сумма рангов составляет фактическую величину критерия. Ее сравнивают с критическим значением критерия (приложение табл.III). Нулевая гипотеза Н0опровергается на принятом уровне значимости с учетом числа (n), еслиWфакт <Wтабл. ПриWфакт ≥Wтабл., Н0опровергнуть нельзя.

Пример.

X

Y

Разница

45

60

+ (15)

38

38

0

49

47

- (2)

26

29

+ (3)

33

50

+ (17)

49

31

- (18)

24

20

- (4)

33

39

+ (6)

39

41

+ (2)

Минусовых разностей меньше, их сумма: 2 + 18 + 4 = 24. это и есть фактически найденная величина W– критерия. Сумма рангов с положительными знаками 15 + 3 + 17 + 6 + 2 = 43 в расчет не принимается как большая. Найденную величину сравниваем сWтабл. для 5 % уровня значимости иn= 9, которое равноWтабл. = 7 (приложение табл.III).

Так как Wфакт ≥Wтабл., то Н0опровергнуть нельзя. Следовательно, различия значимые.

Парный критерий Вилкоксона (Т)

T–критерий Вилкоксона, в отличие от W–критерия Вилкоксона, применяется для сравнения выборок с попарно сопряженными вариантами (например, до и после опыта). Выборки могут принадлежать порядковой или количественной шкале.

Методика расчёта требует попарного расположения значений признака в двух сравниваемых совокупностях (одна и та же группа до и после эксперимента). Затем вычисленные разности между связанными парами изучаемых признаков ранжируют в порядке возрастания абсолютных значений разности (без учёта знака). Далее вычисляется величина Т, равная сумме ранговых номеров разностей, имеющих отрицательное значение (т.е. разностей, противоположных наблюдаемых в большинстве опытов).

Различие двух связанных выборок признаётся достоверным, если значение Т<Т05 05– табличное значение при Р = 95 % и соответствующем числе наблюдений, приложение табл.III).

Критерием проверяется статистическая значимость нулевой гипотезы (Н0) о том, что распределение случайных величин симметрично относительно нуля. Эти случайные величины в рассматриваемом случае представляют собой разности случайных величин, соответствующих двум другим выборкам, поэтому часто критерий называют одновыборочным критерием Вилкоксона.

Пример. Систолическое артериальное давление у 8 студентов составило:

АД до экзамена, мм. рт. ст

АД после экзамена, мм. рт. ст.

Разность

Ранговый номер разности

1

140

110

30

6

2

145

120

25

5

3

130

115

15

3

4

120

130

-10

2

5

125

125

0

-

6

115

120

-5

1

7

150

130

20

4

8

110

110

0

-

Порядок расчета:

  1. Определение разность значений «до» и «после» (графа «Разность»)

  2. Ранжирование полученных разностей в порядке возрастания (графа ”Ранговый номер разности”)

  3. Суммирование рангов разностей, имеющих отрицательные значения Т = 2 + 1 = 3.

  4. Сравнение полученного значения Т с табличным (приложение ) при n= 8 (Т = 5 при Р = 95 %). Поскольку Т < 5, различие в артериальном давлении у студентов до и после экзамена следует считать существенным (значимым).

Критерий Розенбаума (Q)

Используется для оценки достоверности изменений какого-либо признака в двух несвязанных группах, например, опытной и контрольной. Метод расчёта критерия Qоснован на сравнении двух упорядоченных рядов наблюдений. Первым (I) рядом считается тот, где максимальные и минимальные величины больше, чем во втором (II) ряду. Величина критерияQоценивается по таблице (приложение табл.IV).

Q=S+ Т (8)

где S– количество наблюденийIряда, которые больше максимальной величиныIIряда, Т – количество наблюденийIIряда, которые меньше минимальной величиныIряда.

Пример. В результате эксперимента было установлены величины Х до и после применения лекарственного средства Yбыли равны значениям представленным в 1 и 2 ряду соответственно.

Ряд

I

25

27

27

28

28

30

30

30

31

32

33

n1 = 11

Ряд

II

16

17

17

18

19

19

20

20

22

24

26

27

29

n2= 12

S= 6 (30, 30, 30, 31, 32, 33 изIряда больше, чем максимальная величина – 29 изIIряда)

Т = 10 (16, 17, 17, 18, 19, 20, 20, 22, 24 из IIряда, меньше, чем минимальная величина – 19 изIряда)

Q=S+ Т = 6 + 10 = 16

По таблице значений Q(приложение табл.IV) определяем, что приn1= 11 иn2 = 12 минимальное значениеQ, при котором различия между группами наблюдений существенны, приt= 95 % равно 6, а приt= 99 % равно 9. Следовательно в данном случае различия существенны с Р > 99 %.

Как показал пример, применение критерия Qнесложно, однако он может быть использован лишь для выборок, имеющих более 10 единиц наблюдения.

Критерий Уайта (К)

Используется в случае сравнения двух независимых выборок (опытная и контрольная группы). Методика требует ранжирования результатов экспериментов обеих групп. Затем высчитывают сумму рангов для каждого ряда (результатов эксперимента в опытной и контрольной группах).

Пример. Получены следующие данные содержания в крови вещества Х у животных экспериментальной группы (опытной и контрольной).

Опытная Y198, 206, 235, 243, 226, 208, 184, 172

Контрольная группа Z124, 170, 204, 193, 210, 140, 196, 143, 120

Ранжируем данные эксперимента

Значения

Y

172

184

198

206

208

226

235

243

Z

120

124

140

143

170

193

196

204

210

Ранг

Y

6

7

10

12

13

15

16

17

Z

1

2

3

4

5

8

9

11

14

Суммы рангов для каждого ряда

К Y = 6 + 7 + 10 + 12 + 13 + 15 + 16 + 17 = 96

К Z= 1 + 2 + 3 + 4 + 5 + 8 + 9 + 11 + 14 = 57

Находим значение К (приложение табл. V) приnY= 9 иnZ= 8;K0,5= 51,K0,1 = 45. меньшая из найденных сумм К (КY) равна 57, что превышает К0,5(51). Следовательно, нельзя признать различие опытной и контрольной групп достоверным. Различие достоверно при условии , что К < К0,1(табличное значение при Р = 99 %).

Если сравниваемые выборки не отличаются друг от друга, то и суммы их рангов должны быть равными. И, наоборот, чем значительнее расхождение между выборками, тем больше разница между суммами их рангов. Так как эта разница может быть случайной, то её следует сравнить с помощью Т-критерия Уайта (приложение, табл. V).

Критерий знаков (Z)

Критерий знаков основан на подсчёте числа однонаправленных (имеющих одинаковые знаки) результатов в парных сравнениях (до и после опыта). Иногда сравнивая выборки с попарно связанными вариантами, наблюдаемые между ними различия обозначают знаками:

«+» - увеличение показателя (положительный эффект).

«-» - снижение (отрицательный эффект).

В этом случае Н0проверяется с помощью критерияZ, т.е. если попарно сравниваемые выборки не различаются, то количество «+» и «–» будет одинаковым. Если же преобладание «+» или «–», то это может быть результатом воздействия изучаемого фактора.

Например, после введения 28 животным определённой дозы изучаемого вещества у 21 было отмечено повышение артериального давления (Zфакт), у 2 - понижение, у 5 – значения не изменились. Необходимо определить, является ли гипертензивный эффект достоверным (неслучайным).

Для оценки полученного результата с помощью критерия знаков необходимо подсчитать число наблюдений (n), в которых отмечается эффект («+» и «-»):

n= 21 + 2 = 23.

Затем определить максимальное число по строке равной сумме, при котором ещё можно считать обнаруженные различия существенными при Р = 95 % (приложение табл. VI). Нулевые разности, т.е. случаи, не давшие ни «+», ни «–» результата в расчет не принимаем. В этом случае число парных наблюдений уменьшается. Приn= 23 и Р = 95 %Zтабл. = 17.Zфакт >Zтабл. Н0опровергается, изменение после проведенного опыта являются неслучайными (статистически достоверными).

Критерий знаков элементарно прост в применении на практике, однако он не даёт представление о величине различия (сдвиге изучаемых параметров после опыта).

Критерий χ2

Критерий согласия χ2в отличие от описанных выше методик позволяет сравнивать одновременно несколько групп. При этом нет необходимости расчета относительных и средних величин, а признаки могут быть качественными. Расчёт критерияχ2производится методом «от противного», т.е. путём доказательства нулевой гипотезы (Н0).

Критерий согласия определяется по формуле:

где у – фактическое число, у1– ожидаемое число.

Например, необходимо определить, достоверно ли различие послеоперационной летальности у больных острым аппендицитом, прооперированных в течение первых суток от начала приступа, в течение вторых суток, в течение третьих суток и далее.

Результаты исследования заносятся в таблицу:

Исходы операций у больных в зависимости от сроков госпитализации

Группа

Исход

Итого

Выздоровеление

Смерть

Фактическое число

Ожидаемое число

Фактическое число

Ожидаемое число

I

II

III

1200

850

430

1189

849

441

12

15

20

23

16

9

1212

865

450

Всего

в %

2480

98,1

47

1,9

2527

100

Примечание

I– оперированные в первые сутки после приступа,

II– оперированные на вторые сутки,

III- оперированные на третьи сутки и далее

Сопоставление представленных в таблице чисел позволяет предположить, что летальность растёт с увеличением времени от начала приступа до операции. Это предположение – рабочая гипотеза (На). Противоположна ей гипотеза нулевая (Н0), т.е. говорящая об отсутствии влияния времени оперативного вмешательства на исход операции.

Эмпирическое значение критерия χ2для сравниваемых выборок вычисляют по формуле (9). Затем сравнивают это значение с табличным критическим значениемχ2 0,05. Еслиχ2 0,05 χ2, то можно сделать вывод, что характеристики сравниваемых выборок совпадают с уровнем значимости Р = 0,05. Еслиχ2 0,05<χ2, то можно сделать вывод, что достоверность различий характеристик сравниваемых выборок составляет 95 %.

Критерий Колмогорова-Смирнова

Используется для оценки значимости различий как двух эмпирических распределений, так и для эмпирического и теоретического распределений. Критерий Колмогорова-Смирнова основан на сопоставлении рядов накопленных частот, т.е. отношений накопленных частот (суммы данной и предыдущей) к числу наблюдений в соответствующей группе сравниваемых групп и нахождении наибольшей абсолютной разности между ними.

По критерию Колмогорова–Смирнова сравнивают эмпирические функции распределения двух эмпирических рядов. Проверяется нулевая гипотеза о том, являются ли одинаковыми непрерывные функции распределения генеральных совокупностей, из которых взяты выборки. Иначе, проверяется принадлежность двух выборок одной и той же генеральной совокупности при условии непрерывности ее функции распределения. Выборки могут принадлежать порядковой или количественной шкале.

Критерий рекомендуется для выборок средней и большой численности (от 40 до 100 и выше). При большей численности выборок становится больше теоретических оснований для применения параметрических тестов.

Закон Харди-Вайнберга

Закономерность наследования признаков в популяциях получила название закона Харди-Вайнберга (1908-1909 гг.). Данный закон объясняет, каким образом в популяции сохраняется генетическое равновесие, то есть число особей с доминантными (Х) и рецессивными (х) признаками остается на определенном уровне. У особей могут встречаться только четыре комбинации этих аллелей: ХХ, хх, хХ и Хх. Если обозначить через p и q частоту встречаемости индивидуумов с аллелями Х и х соответственно, то согласно закону Харди-Вайнберга.

p2 + 2pq + q2 = 100% (10)

где p2 — частота встречаемости индивидуумов с аллелями ХХ,

2pq — с аллелями Хх или хХ,

q2 — частота встречаемости индивидуумов с аллелями хх.

Закон представляет собой модель, используя которую генетики могут количественно определять изменения в распределении генов в популяции, вызванные, например, мутациями или миграцией. Другими словами, этот закон является теоретическим критерием для измерения изменений в распределении генов.

Если в популяции существует два или более аллеля локуса, то этот локус называется полиморфным. Обычно локус наиболее распространенного аллеля имеет частоту меньше 0,99. Одним из наиболее простых способов измерения степени полиморфности в популяции является подсчет среднего соотношения полимофрных локусов и путем деления их общего числа на суммарное число локусов в выборке. Более точным показателем генетической вариабельности внутри популяции является средняя ожидаемая гетерозиготность или генное разнообразие.

h– генное разнобразие

sum- сумма

Xi– частота аллеля

j– общее число аллелей данного локуса