- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
2.2. Точечные оценки математического ожидания и дисперсии
Законы распределения элементов выборки и генеральной совокупности одинаковы, следовательно, их математические ожидания равны: . В качестве точечной оценки естественно принять среднее арифметическое случайных величин :
.
Математическое ожидание обладает линейными свойствами [3], т.е. и . Поэтому
.
Следовательно, является несмещенной оценкой математического ожидания .
По теореме Чебышева [3] можно показать, что эта оценка является также состоятельной, а для нормального закона еще и эффективной.
Вычисленное для конкретной выборки выборочное среднее считается точечной оценкой параметра а, т.е.
.
Аналогично статистической оценкой дисперсии генеральной совокупности может быть выборочная дисперсия (см. параграф 1.4). Однако величина является смещенной оценкой [3], т.к.
.
Следует отметить, что при больших значениях , т.е. выборочная дисперсия является асимптотически несмещенной оценкой.
Исправленная выборочная дисперсия
становится несмещенной оценкой. Можно также показать, что такая точечная оценка будет состоятельной, а для нормального закона и асимптотически эффективной оценкой дисперсии.
В случае обработки сгруппированного вариационного ряда выборочная дисперсия, вычисленная с учетом поправки Шеппарда, также является несмещенной оценкой дисперсии.
2.3. Интервальные оценки математического ожидания нормального распределения
Случайная непрерывная величина Х подчинена нормальному закону распределения (закону Гаусса) с двумя параметрами a и , если ее плотность распределения имеет вид
.
Вид кривой плотности распределения , представленной на рис. 2.3.1, определяется конкретными значениями и [3].
Рис. 2.3.1
Изменение величины параметра не изменяет формы нормальной кривой, но сдвигает ее вдоль оси х. Максимум функции f(x) достигается в точке а и равен . С возрастанием нормальная кривая становится более пологой, т. е. сжимается к оси x и растягивается вдоль нее. При уменьшении нормальная кривая стягивается к прямой x = a.
Математическое ожидание случайной величины с нормальным распределением М[Х] = а. Точка x = a называется центром распределения вероятностей, или центром рассеивания. Дисперсия нормального распределения случайной величины D[Х] = 2.
Функция распределения нормального закона вычисляется по формуле
F(х) = .
График функции F(х) изображен на рис. 2.3.2.
Рис. 2.3.2
Распределение с параметрами и называется стандартным нормальным распределением. В этом случае функция распределения, которую принято обозначать Ф(х), имеет вид
.
На практике чаще используется функция Лапласа
.
Так как [3] , то в таблицах (см. приложение 1) можно приводить значения функции только для положительных значений аргумента. Производные функций и равны и
.
Таблицы значений функции также приведены в приложении 1.
Определив по таблице значение функции Лапласа, можно найти величину функции нормального распределения в любой точке:
.
Тогда вероятность попадания нормальной случайной величины X в интервал [х1; х2) вычисляется [3] по формуле
Р(х1 Х < х2) = .
Для нормального распределения также верна формула
.
Если случайная величина распределена по нормальному закону, то можно вывести формулы, позволяющие на основе выборки находить доверительные интервалы для математического ожидания а и среднеквадратичного отклонения .
Рассмотрим сначала случай, когда дисперсия известна, а оценить надо математическое ожидание а. Среднее арифметическое независимых случайных величин также распределено нормально [3]. При этом
, .
Если выполняется соотношение , то
.
Следовательно, зная , можно вычислить и определить надежность оценки математического ожидания , используя таблицу значений функции , приведенную в приложении 1. И, наоборот, значение t, удовлетворяющее уравнению , можно (при заданной надежности ) найти в таблице значений функции Лапласа. Затем, например, можно определить объем выборки , обеспечивающей заданные точность и надежность .
При точности оценки неравенство , эквивалентно двойному неравенству . Следовательно, с надежностью можно утверждать, что доверительный интервал покрывает неизвестный параметр .
Если параметр распределения неизвестен, то для построения доверительного интервала надо сначала вычислить точечную оценку дисперсии s. Случайная величина
.
подчинена закону Стьюдента [3] и ее функция распределения не зависит от оцениваемого параметра а, а зависит только от объема выборки n. Параметр называется в статистике числом степеней свободы. Плотность вероятности распределения Стьюдента является четной функцией [3], следовательно, при выполняются равенства:
;
;
.
Тогда
.
Если обозначить через , то условие будет выполнено тогда, когда t является корнем уравнения . Зная величины уровня значимости и степени свободы , значение , удовлетворяющее этому уравнению, можно найти в таблице приложения 2. Условие , эквивалентное неравенству , задает доверительный интервал , покрывающий неизвестный параметр с надежностью . Очевидно, что при увеличении объема выборки n доверительный интервал уменьшается. При увеличении надежности оценки уменьшается уровень значимости . По таблице приложения 2 видно, что в этом случае увеличивается значение t, а, следовательно, доверительный интервал становится больше.
При построении интервальной оценки среднеквадратичного отклонения также предполагается, что случайная величина Х подчинена нормальному закону распределения с параметрами a и . Пусть по результатам n испытаний вычислена точечная оценка дисперсии . Для того чтобы построить доверительный интервал для среднеквадратичного отклонения , рассмотрим
.
Распределение случайной величины называется [3] распределением («хи-квадрат»). Функция распределения такой величины не зависит от оцениваемого параметра , а зависит лишь от числа степеней свободы .
Рассмотрим соотношение
.
Обозначив , после несложных преобразований (при ) получим
или
.
Обозначая , получаем уравнение
.
Для распределения в приложении 3 приведены решения этого уравнения при различных значениях и k.
Итак, вычислив по выборке и найдя по таблице, имеем возможность записать искомый доверительный интервал, покрывающий значение с заданной надежностью :
, если ;
, если .
Отметим, что есть и другие способы построения доверительных интервалов [1]. В случае, например, можно доверительные интервалы находить по формулам:
;
;
Значение , удовлетворяющее уравнению , можно найти в приложении 1. Примеры расчета доверительных интервалов приведены в параграфе 2.4.