- •Математическая статистика
- •1. Первичная обработка результатов измерений
- •1.1. Выборка и её вариационный ряд. Статистический ряд результатов измерений
- •1.2. Гистограмма и полигон частот
- •1.3. Статистическая функция распределения
- •2. Точечные оценки параметров
- •2.1. Понятие о точечных оценках параметров и их свойствах
- •2.2. Точечные оценки математического ожидания, дисперсии и среднего квадратического отклонения
- •2.3. Получение точечных оценок методом максимального правдоподобия. Оценки параметров распределения Пуассона и нормального распределения
- •3. Интервальные оценки параметров
- •3.1. Понятие об интервальном оценивании параметров
- •3.2. Построение доверительных интервалов для математического ожидания и дисперсии нормально распределённой св
- •4. Проверка статистических гипотез
- •4.1. Основные определения и общая схема проверки
- •4.2. Критерий согласия Пирсона
- •4.3. Критерий согласия Колмогорова
- •4.4. Критерий однородности Смирнова
- •4.5. Проверка гипотезы о независимости двух случайных величин
- •4.6. Проверка гипотезы о равенстве математических ожиданий и дисперсий двух нормально распределённых св
Математическая статистика
Предметом математической статистики является изучение методов сбора, систематизации и обработки экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. К основным задачам математической статистики относятся следующие:
1) задача нахождения неизвестного закона распределения СВ по статистическим данным;
2) задача нахождения неизвестных параметров распределения или числовых характеристик СВ;
3) задача проверки правдоподобия гипотез о законах или параметрах распределения СВ.
1. Первичная обработка результатов измерений
1.1. Выборка и её вариационный ряд. Статистический ряд результатов измерений
Пусть некоторая СВ Х наблюдается (измеряется) n раз. Это означает, что эксперимент состоит в последовательном наблюдении (измерении) СВ , где – СВ, соответствующая результату i-го наблюдения (измерения). Предполагается, что наблюдения (измерения) проводятся независимо друг от друга и условия проведения эксперимента не изменяются при переходе от одного измерения к другому, т.е. – независимые СВ, имеющие тот же закон распределения, что и СВ Х.
Измеряемая СВ Х в математической статистике называется генеральной совокупностью, а соответствующий ей случайный вектор – случайной выборкой объёма n из генеральной совокупности Х. Числовой вектор , полученный в конкретной серии последовательных измерений, называется реализацией случайной выборки или просто выборкой измерений СВ Х.
Вариационным рядом выборки называется числовой вектор , компонентами которого являются элементы выборки, расположенные в порядке неубывания, т.е. имеет место . Величина называется размахом выборки. Поскольку значения случайным образом меняются в различных сериях измерений, то их можно считать реализацией некоторых СВ , удовлетворяющих условию . Случайная величина называется i-й порядковой статистикой, а случайный вектор – вариационным рядом случайной выборки.
При большом объёме n выборка перестаёт быть наглядной формой представления результатов измерений СВ Х. Поэтому на практике результаты измерений обычно представляют в виде статистического ряда.
Сначала рассмотрим случай, когда Х – дискретная СВ. Пусть выборка содержит k различных элементов , записанных в порядке возрастания, при этом встречается раз, где . Число называется частотой элемента , при этом
.
Статистическим рядом называется последовательность пар , , которая обычно записывается в виде таблицы:
-
Z
...
...
При достаточно большом объёме выборки статистический ряд может служить статистическим аналогом ряда распределения дискретной СВ Х.
Рассмотрим случай, когда Х – непрерывная СВ. Построив вариационный ряд выборки , возьмём произвольный интервал числовой прямой, охватывающий все элементы выборки с небольшим запасом. Разобьём этот интервал на k непересекающихся интервалов , . Пусть – число элементов выборки, попавших в i-й интервал ( ), тогда число называется частотой интервала , при этом
.
Под статистическим рядом понимается следующая таблица:
Номер интервала i |
Границы интервала |
Середина интервала
|
Частота
|
Накопленная частота |
1 |
|
|
|
|
2 |
|
|
|
|
... |
... |
... |
... |
... |
k |
|
|
|
|
Выбор количества интервалов k зависит от объёма выборки n. Рекомендуется брать . Длины интервалов проще взять одинаковыми, однако при существенной неравномерности распределения наблюдаемой СВ целесообразно в области наибольшей плотности интервалы брать короче, чем в областях малой плотности. Желательно, чтобы каждый интервал содержал не менее пяти элементов выборки (интервалы, содержащие менее пяти элементов, объединяются с соседними интервалами).