Добавил:
ilirea@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Старый материал / Лекция 4.doc
Скачиваний:
74
Добавлен:
21.08.2018
Размер:
932.86 Кб
Скачать

Критерий Стьюдента для множественных сравнений

Если исследуемых групп больше двух, то следует воспользоваться дисперсионным анализом. Однако дисперсионный анализ позволяет проверить лишь гипотезу о равенстве всех средних. Но если гипотеза не подтверждается, нельзя узнать какая именно группа отличается от других.

Это позволяют сделать методы множественного сравнения. Все они основаны на критерии Стьюдента, но учитывают, что сравнивается более одной пары средних. Сразу поясним, когда на наш взгляд следует использовать эти методы. Подход состоит в том, чтобы в первую очередь с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних, а уже затем если нулевая гипотеза отвергнута выделить среди них отличные от остальных, используя для этого методы множественного сравнения. Простейший из методов множественного сравнения — введение поправки Бонферрони. Которая гласит, что если мы хотим обеспечить вероятность ошибки α′, то в каждом из сравнений мы должны принять уровень значимости α′/k — это и есть поправка Бонферрони. Например, при трехкратном сравнении уровень значимости должен быть 0,05/3 = 1,7%. Поправка Бонферрони хорошо работает, если число сравнений невелико. Если оно превышает 8, метод становится слишком «строгим и даже весьма большие различия приходится признавать статистически незначимыми. Один из способов смягчить строгость поправки Бонферрони состоит в том, чтобы увеличить число степеней свободы. Число степеней свободы ν = m(n – 1). Если число групп m больше 2, то число степеней свободы при таком расчете будет больше 2(n – 1) благодаря чему критическое значение t уменьшится.

20

Анализ качественных признаков

Статистические процедуры, с которыми мы познакомились в предыдущих главах, предназначены для анализа количественных признаков. Примером таких признаков служат артериальное давление, диурез или продолжительность госпитализации. Единицей их измерения могут быть миллиметры ртутного столба, литры или дни. Над значениями количественных признаков можно производить арифметические действия. Можно, например, сказать, что диурез увеличился вдвое. Кроме того, их можно упорядочить, то есть расположить в порядке возрастания или убывания. Однако очень многие признаки невозможно измерить числом. Например, можно быть либо мужчиной, либо женщиной, либо мертвым либо живым. Можно быть врачом, юристом, рабочим и так далее. Здесь мы имеем дело с качественными признаками. Эти признаки не связаны между собой никакими арифметическими соотношениями, упорядочить их также нельзя. Единственный способ описания качественных признаков состоит в том, чтобы подсчитать число объектов, имеющих одно и то же значение. Кроме того, можно подсчитать, какая доля от общего числа объектов приходится на то или иное значение. Существует еще один вид признаков. Это порядковые признаки. Их можно упорядочить, но производить над ними арифметические действия нельзя. Пример порядкового признака — состояние больного тяжелое, средней тяжести, удовлетворительное.

Для характеристики совокупности, которая состоит из двух классов, достаточно указать численность одного из них если доля одного класса во всей совокупности равна р (вероятность), то доля другого равна 1 – р. (Заметим, что pроз есть еще и вероятность того, что случайно выбранный марсианин окажется розовым).

Доля р в некотором смысле аналогична среднему µ по совокупности.

Пусть имеется совокупность из N членов. При этом М членов обладают каким-то качественным признаком, которого нет у остальных N – M членов. Введем числовой признак X: у членов совокупности, обладающих качественным признаком, он будет равен 1, а у членов, не обладающих этим признаком, он будет равен 0. Тогда среднее значение X равно

то есть доле членов совокупности, обладающих качественным признаком.

Найдем стандартное отклонение. По определению оно равно

где для М членов совокупности значение X = 1, а для остальных N – М членов X = 0. Величина µ = р. Таким образом,

Рис. 5.2. Что такое разброс данных, если значений признака всего два? Возможно, это станет яснее, если вспомнить, что разброс — это отсутствие единства. Рассмотрим три совокупности из 200 марсиан. А. Все марсиане зеленые. Царит полное единство, разброс отсутствует, σ = 0. Б. Среди стройных рядов зеленых марсиан появилось 10 розовых. Единство немного нарушено, появился некоторый разброс, σ = 0,2. В. От единства марсиан не осталось и следа: они разделились поровну на зеленых и розовых. Разброс максимален, σ = 0,5.

Рис. 5.3. Стандартное отклонение доли σ полностью определяется самой этой долей р. Когда доля равна 0 или 1, разброс отсутствует и σ = 0. Когда р = 0,5, разброс максимален, σ = 0,5