Добавил:
ilirea@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Старый материал / Лекция 4.doc
Скачиваний:
74
Добавлен:
21.08.2018
Размер:
932.86 Кб
Скачать

Точность оценки долей

Если бы в наших руках были данные по всем членам совокупности, то не было бы никаких проблем связанных с точностью оценок. Однако нам всегда приходится довольствоваться ограниченной выборкой. Поэтому возникает вопрос, насколько точно доли в выборке соответствуют долям в совокупности.

Рис. 5.4. А. Из совокупности марсиан, среди которых 150 зеленых и 50 розовых, извлекли случайную выборку из 10 особей. В выборку попало 5 зеленых и 5 розовых марсиан, на рисунке они помечены черным. Б. В таком виде данные предстанут перед исследователем, который не может наблюдать всю совокупность и вынужден судить о ней по выборке. Оценка доли розовых марсиан p = 5/10 = 0,5.

Как любая выборочная оценка, оценка доли (обозначим ее p^) отражает долю р в совокупности, но отклоняется от нее в силу случайности. Рассмотрим теперь не совокупность марсиан, а совокупность всех значений p^ , вычисленных по выборкам объемом 10 каждая. (Из совокупности в 200 членов можно получить более 106 таких выборок). По аналогии со стандартной ошибкой среднего найдем стандартную ошибку доли. Для этого нужно охарактеризовать разброс выборочных оценок доли, то есть рассчитать стандартное отклонение совокупности p^.

где σ p^ — стандартная ошибка доли, σ — стандартное отклонение, n — объем выборки.

Заменив в приведенной формуле истинное значение доли ее оценкой p^ , получим оценку стандартной ошибки доли:

Из центральной предельной теоремы вытекает, что при достаточно большом объеме выборки выборочная оценка p^ приближенно подчиняется нормальному распределению, имеющему среднее р и стандартное отклонение σˆp . Однако при значениях р, близких к 0 или 1, и при малом объеме выборки это не так. При какой численности выборки можно пользоваться приведенным способом оценки? Математическая статистика утверждает, что нормальное распределение служит хорошим приближением, если np^ и n(1-p^) превосходят 5. Напомним, что примерно 95% всех членов нормально распределенной совокупности находятся в пределах двух стандартных отклонений от среднего. Поэтому если перечисленные условия соблюдены, то с вероятностью 95% можно утверждать, что истинное значение р лежит в пределах np^ и n(1-p^).

Вернемся на минуту к сравнению операционной летальности при галотановой и морфиновой анестезии. Напомним, что при использовании галотана летальность составила 13,1% (численность группы — 61 больной), а при использовании морфина —

14,9% (численность группы — 67 больных). Стандартная ошибка доли для группы

Если учесть, что различие в летальности составило лишь 2%, то маловероятно, чтобы оно было обусловлено чем-нибудь, кроме случайного характера выборки.

Перечислим те предпосылки, на которых основан излагаемый подход. Мы изучаем то, что в статистике принято называть независимыми испытаниями Бернулли. Эти испытания обладают следующими свойствами.

• Каждое отдельное испытание имеет ровно два возможных взаимно исключающих исхода.

• Вероятность данного исхода одна и та же в любом испытании.

• Все испытания независимы друг от друга.

21