- •С.П. Казаков
- •Содержание
- •1. Элементы теории вероятностей
- •1.1. Общие понятия
- •1.2. Сумма и произведение случайных событий,
- •1.3 Формула полной вероятности, формула Байеса
- •1.4 Схема Бернулли
- •1.5 Дискретные случайные величины
- •1.6 Непрерывные случайные величины
- •1.6.2 Числовые характеристики непрерывных случайных величин
- •1.3 – Плотности распределения случайных величин
- •1.7 Нормальное распределение
- •1.8 Основы теории надежности
- •1.8.2. Надежность элементов
- •Контрольные вопросы и задачи
- •2. Случайные прцессы
- •2.1Общие понятия
- •2.2 Непрерывный нормальный
- •2.3 Нестационарный случайный процесс (временной ряд)
- •2. 4 Марковские случайные процессы
- •Самостоятельная работа № 2
- •3. Математическая статистика
- •3.1 Общие понятия и задачи математической статистики
- •3.2 Выборочный метод
- •175, 166, 169, 179, 164, 170, 169, 167, 175, 181.
- •158, 162, 163, 164, 165, 166, 167, 168, 169,169,
- •170, 170, 171, 174, 175, 175, 177, 179, 180, 181.
- •3.3 Точечные оценки параметров распределений
- •3.4 Доверительные интервалы
- •3.5 Отсев грубых ошибок и определение минимально
- •3.6Проверка статистических гипотез
- •6, 4, 5, 7, 6, 4, 8, 6, 8, 9. 3, 2, 0, 4, 4, 3, 4, 1, 5, 7.
- •3, 6, 3, 4, 6, 9, 4, 9, 6, 5. 3, 4, 6, 4, 2, 3, 6, 3, 4, 1.
- •4 Статистические зависимости и связи
- •4.1 Подбор эмпирических формул (парная корреляция)
- •4.2 Практическая задача: проверка легитимности выборов
- •4.3 Множественная корреляция
- •4.4 Задачи классификации
- •Теория вероятностей, случайные процессы и математическая статистика
3.2 Выборочный метод
Изучение множества сходных объектов может проводиться как по качественному, так и по количественному признакам. Например, если анализируется возрастной состав работающих на предприятии, то качественным признаком может быть их совершеннолетие или несовершеннолетие, а количественным – возраст работающих. Анализируя их возраст, можно использовать два подхода:
1)определять возраст всех объектов исследования;
2)определять возраст объектов только для отдельной представительной группы и из этого делать выводы, касающиеся всех объектов исследований.
Очевидно, что первый подход нерационален. При втором подходе множество случайным образом отобранных объектов называется выборочной совокупностьюили простовыборкой.Все множество объектов, подлежащих исследованию, называетсягенеральной совокупностью. Число объектов выборочной совокупности называютобъемом выборки. Обычно генеральная совокупность содержит конечное множество объектов. Оно, как правило, велико, поэтому при теоретических выводах объем генеральной совокупности часто предполагается бесконечным.
Вариационный ряд и эмпирическая функция распределения.Пусть для изучения количественного признакаХиз генеральной совокупности отобранопобъектов, характеризуемых статистическими даннымих1,х2,…, хn.Наблюдаемые значенияхiназываютсявариантами. Если их расположить в порядке возрастания, то полученная последовательность образуетвариационный ряд. Вариационные ряды удобны для статистического оценивания функции распределения случайной величины.
Обозначим k – число значений случайной величины, меньших, где–члены вариационного ряда. Зная общее число членов рядап,можно построить функцию
,
(3.1)
, (
Эта функция называется эмпирической функцией распределенияслучайной величиных.Она и определяет приближенно функцию распределенияF(х). В 1933г. советским математиком В.И. Гливенко доказанаосновная теорема математической статистики,которая доказывает, что при больших значенияхп эмпирической функцией распределения приближается к теоретической:Fn(x)®F(x) при n®¥.
Кроме эмпирической функции распределения для исследований полезно построить гистограмму fп(х), являющуюсяэмпирической плотностью вероятностей. Для этого задаются интервалы ∆хi, далее определяются количества значений (частот) – ∆ni(x), попавших в каждый из интервалов.Затем строится столбчатая функция, высота столбцов которой в отдельных интервалахравна ∆ni(x)/n∆x=fn(x).Общая площадь под гистограммой равна 1.
Задача 1.Построить гистограмму и эмпирическую функцию распределения роста выборочной группы изN= 20 чел. для следующей выборки (рост, см):
165, 158, 170, 180, 163, 171, 168, 174, 162, 177,
175, 166, 169, 179, 164, 170, 169, 167, 175, 181.
Решение.Расположим значения выборки в порядке возрастания, т.е. в видевариационного ряда:
158, 162, 163, 164, 165, 166, 167, 168, 169,169,
170, 170, 171, 174, 175, 175, 177, 179, 180, 181.
Изменения роста выборочной группы находится в диапазоне от 158 до 181 см, т.е. хmax– xmin= 181–158 = 23 см.
Количество наблюдений при статистических исследованиях обычно бывает достаточно большим. Теория и практика статистических расчетов показывает, что группировка данных по 8–12 интервалам, в каждый из которых попадает не более 10–15% значений xi,оказывается достаточной для выявления свойств распределений и надежного вычисления характеристик случайных величин. При малых выборах (n<30) число интервалов гистограммыmследует принимать равным 5–7. При больших выборках (n >30) число интервалов можно рассчитывать по формуле
.
Число интервалов должно быть удобным для построения гистограммы. Для предыдущей задачи, при длине интервалов 4 см., получаем семь интервалов: 156 – 160; 160 – 164; …; 180 – 184 см.
Гистограмма распределения и диаграмма представлены на рисунке 3.1. В диаграмме на оси ординат откладывается число значений, попавших в i-ый интервал, на гистограмме – значения ni(x)/n∆x=f(x).
В интервал (хi-1; xi) помещают значения х, которые меньше xi:
- т.е. в первом интервале n1 = 1 (158 см);
- во втором – n2 = 2 (162, 163);
- в третьем – n3 = 4 (164, 165, 166, 167) и т.д.,
в седьмом интервале число значений n7 = 2 (180, 181).
Общая площадь гистограммы распределения, согласно построению, равна 1,0
Таким образом, она является аналогом плотности распределения случайной величины х илиэмпирической плотностью распределения.
Рисунок 3.1 – Гистограмма и диаграмма распределения
На рисунке 3.2 для этой гистограммы построена эмпирическая функция распределения Fn (x). На этом примере видны основные особенности эмпирической функции распределения. Как и теоретическая, она не убывает и значения ее не выходят из интервала [0; I].
Рисунок 3.2 – Эмпирическая функция распределения
Самостоятельная задача 1.Построить гистограмму и эмпирическую функцию распределения веса выборочной группы изN=20 чел. для следующей выборки (вес, кг):
60, 51, 66, 74, 58, 67, 62, 68, 61, 76,
68, 63, 67, 74, 59, 69, 64, 63, 72, 65. (3.2)