- •Сравнение групп
- •Нулевая гипотеза
- •Две оценки дисперсии
- •Критическое значение f
- •Критерий стьюдента
- •Принцип метода
- •Критерий Стьюдента для множественных сравнений
- •Анализ качественных признаков
- •Точность оценки долей
- •Сравнение долей
- •Поправка Йейтса на непрерывность
- •Тромбоз шунта у больных на гемодиализе
- •Критерии χ2 для таблицы 2×2
- •Точный критерий Фишера
- •Непараметрическое множественное сравнение.
Непараметрическое множественное сравнение.
Потребность во множественном сравнении возникает всякий раз, когда с помощью дисперсионного анализа (или его непараметрического аналога — критерия Крускала—Уоллиса) обнаруживается различие нескольких выборок. В этом случае и требуется установить, в чем состоит это различие. В гл. 4 мы познакомились с параметрическими методами множественного сравнения. Они позволяют сравнить группы попарно и затем объединить их в несколько однородных наборов так, что различия между группами из одного набора статистически незначимы, а между группами из разных наборов — значимы. Кроме того, они позволяют сравнить все группы с контрольной. К счастью, параметрические методы множественного сравнения легко преобразовать в непараметрические. Когда объемы выборок равны, для множественного сравнения используют непараметрические варианты критериев Ньюмена—Кейлса и Даннета. Когда же объемы выборок различны, применяется критерий Данна.
ПОВТОРНЫЕ ИЗМЕРЕНИЯ:
КРИТЕРИЙ ФРИДМАНА
Если одна и та же группа больных последовательно подвергается нескольким методам лечения или просто наблюдается в разные моменты времени, применяют дисперсионный анализ повторных измерений (гл. 9). Но чтобы использование дисперсионного анализа было правомерно, данные должны подчиняться нормальному распределению. Если вы в этом не уверены, лучше воспользоваться критерием Фридмана — непараметрическим аналогом дисперсионного анализа повторных измерений.
Логика критерия Фридмана очень проста. Каждый больной ровно один раз подвергается каждому методу лечения (или наблюдается в фиксированные моменты времени). Результаты наблюдений у каждого больного упорядочиваются. Обратите внимание, что если раньше мы упорядочивали группы, то теперь мы отдельно упорядочиваем значения у каждого больного независимо от всех остальных. Таким образом, получается столько упорядоченных рядов, сколько больных участвует в исследовании. Далее, для каждого метода лечения (или момента наблюдения) вычислим сумму рангов. Если разброс сумм велик — различия статистически значимы.
Порядок расчета критерия Фридмана.
• Расположите значения для каждого больного по возрастанию, каждому значению присвойте ранг.
• Для каждого из методов лечения подсчитайте сумму присвоенных ему рангов.
• Вычислите значение χr2 .
• Если число методов лечения и число больных присутствует в табл. 10.14, определите критическое значение χr2 по этой таблице. Если число методов лечения и число больных достаточно велико (отсутствует в таблице), воспользуйтесь критическим значением χ2 с числом степеней свободы ν = k – 1.
• Если рассчитанное значение χr2 превышает критическое — различия статистически значимы.
29
ВЫВОДЫ
Обратите внимание, что, оперируя не данными, а рангами, рассмотренные методы строятся, в сущности, по тому же принципу, что и рассмотренные ранее пераметрические, такие, как критерий Стьюдента и дисперсионный анализ. Заменив данные рангами, мы делаем следующее.
• Формулируем нулевую гипотезу, то есть предполагаем, что наблюдаемые различия случайны.
• Выбираем критерий, то есть числовое выражение различий.
• Определяем, каким было бы распределение величины критерия при условии справедливости нулевой гипотезы.
• Находим критическое значение, то есть величину, которую при справедливости нулевой гипотезы значение критерия превышает достаточно редко (точнее, с вероятностью, равной уровню значимости α).
• Вычисляем значение критерия для наших данных и сравниваем его с критическим: если вычисленное значение больше, признаем различия статистически значимыми.
Выбор между параметрическими и непараметрическими методами определяется прежде всего характером данных. Имея дело с порядковыми признаками, не остается ничего, кроме как воспользоваться непараметрическими методами. Если признак числовой, стоит подумать, нормально ли его распределение. Тут могут помочь как общие соображения, так и графическое представление данных. Даже если нет веских оснований сомневаться в нормальности распределения, но данных мало, или вы не хотите делать никаких предположений о типе распределения — воспользуйтесь непараметрическими методами.