Добавил:
ilirea@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Старый материал / Лекция 4.ppt
Скачиваний:
48
Добавлен:
21.08.2018
Размер:
816.64 Кб
Скачать

СРАВНЕНИЕ ДОЛЕЙ

Критерий z, аналогичный критерию Стьюдента t:

О статистически значимом различии долей можно

говорить, если значение z окажется «большим». С

такой же ситуацией мы имели дело, рассматривая критерии Стьюдента. Отличие состоит в том, что t

подчиняется распределению Стьюдента, а z —

стандартному нормальному распределению.

Таблицы сопряженности: кр

Будем рассматривать не долю, а число больных с тромбозом. Занесем результаты испытания в таблицу. Для каждой из групп укажем число больных с

тромбозом и без тромбоза. У нас два признака:

препарат (аспирин—плацебо) и тромбоз (есть—нет); в

таблицеуказаны все их возможные сочетания, поэтому такая таблица называется таблицей сопряженности. В данном случае размер таблицы

2×2

Критерии χ2

для таблицы 2×2

Критерий χ2

(читается «хи-квадрат») не

требует

никаких

предположений

относительно

параметров

совокупности, из

которой извлечены выборки, — это непараметрический

где О — наблюдаемое число в клетке таблицы сопряженности, Е — ожидаемое число в той же клетке. Суммирование проводится по всем клеткам таблицы. Как видно из формулы, чем больше разница наблюдаемого и ожидаемого числа, тем больший вклад вносит клетка в

Критическое значение χ2 для 5% уровня

значимости для таблиц сопряженности размером 2×2 - 3,84.

В примере с тромбозом шунта мы получили значение 7,10, поэтому мы отклоняем гипотезу об отсутствии

связи между приемом аспирина и образованием

Применениет омбов.

критерия χ2

правомерно,

если

ожидаемое

число в любой из

клеток больше

или

равно 5 (в противном случае мы вынуждены

использовать точный критерий Фишера). размеров

Критическое значение χ2 зависит от

таблицы сопряженности, то есть от числа сравниваемых методов лечения (строк таблицы) и числа возможных исходов (столбцов таблицы). Размер таблицы выражается числом степеней свободы ν:

ν = (r – 1)(c – 1),

где r — число строк, а с — число столбцов.

Точный критерий Фишера

Критерий χ2 годится для анализа таблиц

сопряженности 2×2, если ожидаемые значения в любой из ее клеток не меньше 5. Когда число наблюдений невелико, это условие не выполняется и

критерий χ2 неприменим. В этом случае используют

точный критерий Фишера. Он основан на переборе всех возможных вариантов заполнения таблицы сопряженности при данной численности групп, поэтому, чем она меньше, тем проще его применить.

Нулевая гипотеза состоит в том, что между лечением и исходом нет никакой связи.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

Природа порядковых признаков такова, что о двух значениях можно сказать лишь, какое больше или меньше, но в принципе нельзя — на сколько или во сколько раз. (Любой количественный признак можно рассматривать как порядковый, но не наоборот.)

Первое, что следует сделать при анализе таких

признаков, это перейти к их рангам — номерам, под

которыми будут стоять исходные данные, если выстроить их по возрастанию. Критерии, основанные на рангах, не нуждаются в предположениях о типе распределения. Единственное требование состоит в

том, чтобы тип распределения в сравниваемых совокупностях был одинаковым. При этом не нужно знать, что это за распределение и каковы его параметры.

Параметрические и непараметрические

методы.

Какой выбрать?

Непараметрические методы, которые мы рассмотрим в этой главе, заменяют реальные значения признака рангами. При этом мы сохраняем большую часть информации о распределении, но избавляемся от необходимости знать, что это за распределение. Нас

не интересуют более параметры распределения,

отпадает и необходимость равенства дисперсий.

Остается в силе только предположение, что тип

распределения во всех случаях одинаков. Если выполняется условие нормальности распределения, параметрические критерии обеспечивают наибольшую чувствительность. Если же это условие не выполняется хотя бы приблизительно, их чувствительность существенно снижается и непараметрические критерии дают больше шансов

выявить реально существующие различия.

Непараметрические

критерии

СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИ

СРАВНЕНИЕ НАБЛЮДЕНИЙ ДО И ПОСЛЕ ЛЕЧЕНИЯ:

КРИТЕРИЙ УИЛКОКСОНА

СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП:

КРИТЕРИЙ КРУСКАЛА-УОЛЛИСА

ПОВТОРНЫЕ

ИЗМЕРЕНИЯ:

КРИТЕРИЙ

ФРИДМАНА

ВЫВОДЫ

Обратите внимание, что, оперируя не данными, а рангами, рассмотренные методы строятся, в сущности, по тому же принципу, что и рассмотренные ранее пераметрические, такие, как критерий Стьюдента и дисперсионный анализ. Заменив данные рангами, мы делаем следующее.

Формулируем нулевую гипотезу, то есть предполагаем, что наблюдаемые различия случайны.

Выбираем критерий, то есть числовое выражение различий.

Определяем, каким было бы распределение величины критерия при условии справедливости нулевой гипотезы.

Находим критическое значение, то есть величину, которую при справедливости нулевой гипотезы значение критерия превышает достаточно редко (точнее, с вероятностью, равной уровню значимости α).

Вычисляем значение критерия для наших данных и сравниваем его с критическим: если вычисленное значение больше, признаем различия статистически значимыми.

Выбор между параметрическими и непараметрическими методами определяется прежде всего характером данных. Имея дело с порядковыми признаками, не остается ничего, кроме как воспользоваться непараметрическими методами. Если признак числовой, стоит подумать, нормально ли его распределение. Тут могут помочь как общие соображения, так и графическое представление

данных. Даже если нет веских оснований сомневаться в нормальности