- •Введение
- •Задания
- •Предварительные понятия и определения
- •Выборка
- •Проверка гипотез
- •Точечное оценивание
- •Доверительное оценивание.
- •Вероятностные модели
- •Первичный статистический анализ
- •Задание 1. Выборочные характеристики.
- •Задание 2. Гистограмма выборки.
- •Задание 3. Эмпирическая функция распределения.
- •Проверка гипотезы о типе распределения
- •Задание 4. Критерий согласия хи-квадрат.
- •Проверка гипотезы однородности
- •Задание 5. Одновыборочный критерий Стьюдента.
- •Задание 6. Критерий знаков.
- •Задание 7. Двухвыборочный критерий Стьюдента.
- •Задание 8. Критерий Вилкоксона.
- •Задание 9. Критерий Фишера. Критерий сравнения дисперсий.
- •Задание 10. Критерий однородности хи-квадрат.
- •Интервальные оценки
- •Задание.
- •Задание 11. Построить интервальную оценку для среднего значения нормального распределения.
- •Задание 12.
- •Задание 13. Построить интервальную оценку для вероятности успеха
- •Доказательство корректности метода II.
- •Исследование зависимости между двумя характеристиками
- •Задание 14. Проверить независимость двух характеристик по критерию сопряженности хи-квадрат
- •Задания 15-16. Проверить независимость двух характеристик по критерию Стьюдента. Построить линии регрессии.
Задание.
-
Проинтерпретируйте смысл определений односторонних доверительных границ.
-
Докажите, что критерий, построенный по –доверительному множеству, имеет уровень .
Методы построения.
I. Метод опорной функции. Пусть для некоторой статистики существует монотонное по параметру преобразование G (t, ) (так называемая опорная функция), для которого функция распределения не зависит от . Тогда, выбирая из соотношения и разрешая неравенство относительно при полученном экспериментальном значении статистики , получаем верхнюю или нижнюю (в зависимости от направления монотонности G) доверительную границу для .
Этот метод применяется при построении доверительных границ для среднего значения и дисперсии нормального распределения.
II. Метод, основанный на функции распределения оценки. Пусть распределение статистики непрерывно убывает с ростом параметра . Тогда, если экспериментальное значение статистики T=t, то значение нижней (1-)-доверительной границы можно получить как решение уравнения . Верхняя (1-)-доверительная граница получается как решение уравнения .
Этот метод применяется при построении доверительных границ для вероятности наблюдаемого события.
-
Метод, основанный на асимптотическом распределении оценок. Этот метод близок к первому методу. Если известно асимптотическое распределение некоторой статистики , то, оценив мешающие параметры, можно построить опорную функцию, предельное распределение которой не будет зависеть от неизвестных параметров. Далее, поступая как и в методе I, можно построить доверительную границу для неизвестного параметра. Надежность такого доверительного утверждения с ростом объема выборки будет приближаться к номинальной надежности Q.
Этот метод также применяется при построении доверительных границ для вероятности наблюдаемого события.
Задание 11. Построить интервальную оценку для среднего значения нормального распределения.
Постановка задачи.
Имеется выборка из нормального распределения. Требуется построить 95%-доверительный интервал (верхнюю границу, нижнюю границу) для неизвестного среднего этого распределения.
Теоретические основы.
Пусть - выборочное среднее, - выборочная дисперсия, вычисленные по выборке из нормального распределения со средним и дисперсией . Опорная функция
монотонно убывает по и имеет распределение Стьюдента с (n-1)-ой степенью свободы (см. введение). Пусть - верхняя -квантиль распределения (то есть, решение уравнения ), тогда с надежностью (1-)·100%
а) - нижняя доверительная граница для среднего;
б) - верхняя доверительная граница для среднего.
Как видно из формул для доверительного интервала, ширина этого интервала пропорциональна отношению . Это отношение называется стандартной ошибкой среднего, обозначается обычно буквой и весьма оригинально читается – “эм малое”. В медицинской практике принято результаты вычислений записывать в виде , где первое слагаемое есть среднее арифметическое , а второе слагаемое – ошибка среднего .
Квантиль распределения чаще всего находят по таблицам. Во введении мы нашли, что при объеме выборки верхняя 95%-ая квантиль распределения Стьюдента равна . Эту константу применяют для построения любой односторонней 95%-доверительной границы при 20 наблюдениях. Для построения двухстороннего 95%-доверительного интервала применяется константа .