- •Математическая статистика теория и практика
- •220301, 230104, 230201 Очной формы обучения
- •Издательство
- •§1. Задачи математической статистики
- •§2. Генеральная и выборочная совокупность. Репрезентативность выборки. Способы отбора (способы организации выборки)
- •§3. Статистическое распределение выборки. Графическое представление распределений
- •Эмпирическая функция распределения
- •§4. Статистические оценки параметров распределения
- •§5. Генеральная средняя. Выборочная средняя. Оценка генеральной средней по выборочной средней
- •§6. Генеральная дисперсия. Выборочная дисперсия. Оценка генеральной дисперсии по исправленной дисперсии
- •§8. Доверительная вероятность. Доверительный интервал
- •Доверительный интервал для оценки математического ожидания
- •§ 10. Понятие о корреляционном и регрессивном анализе
Эмпирическая функция распределения
Определение. Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события Х < х.
где nx – число вариантов (число хi) меньших х; n – объем выборки.
Свойства:
Значение F*(х) принадлежит отрезку [0, 1]: ;
F*(х) – неубывающая функция;
Если xi – наименьшее наблюдаемое значение, хk – наибольшее наблюдаемое значение, то F*(х) = 0 при ;
F*(х) = 1 при .
Пример 7. Пусть результаты наблюдений представлены в виде следующего ДСР (данные примера 3):
xi |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
wi |
1/20 |
2/20 |
3/20 |
4/20 |
5/20 |
3/20 |
2/20 |
Объём выборки по условию примера n = 20. Наименьшая варианта равна 1, значит, mx = 0 при x ≤ 1. Тогда при x ≤ 20. Следующая варианта в ранжированном ряду равна 2. Рассмотрим 1 < x ≤ 2. В этом случае неравенство X < x выполняется для варианты x1 = 1. Эта варианта встречается один раз в выборке, поэтому mx = 1 и .
Далее, если 2 < x ≤ 3, то неравенство X < x выполняется для вариант x1 = 1 и x2 = 2. Варианта x1 встречается один раз, а варианта x2 встречается два раза, поэтому mx = 1 + 2 = 3 и и т.д. Следовательно, аналитически функция определяется следующим образом:
|
Замечание. Вообще, если известен ДСР, то
Здесь xk совпадает с xmax. |
Суммы обычно называются накопленными относительными частотами.
Построим график по данным примера 7 (рис. 6).
Рис. 6
Если результаты наблюдений представлены в виде ИСР, то выборочную функцию строят иначе.
Пример 8. Рассмотрим для этого следующий вариационный ряд:
[xi; xi+1) |
[0; 10) |
[10; 20) |
[20; 30) |
[30; 40) |
[40; 50) |
wi |
1/30 |
2/30 |
3/30 |
4/30 |
5/30 |
[xi; xi+1) |
[50; 60) |
[60; 70) |
[70; 80) |
[80; 90) |
[90; 100] |
wi |
5/30 |
4/30 |
3/30 |
2/30 |
1/30 |
Очевидно, что для функция , т.к. mx = 0. Пусть теперь . В этом случае число не определено, т.к. неизвестно, сколько выборочных значений случайной величины, принадлежащих этому интервалу, меньше x. Если x = 10, то mx = 1. Следовательно, в этом случае . Рассуждая аналогично, убеждаемся, что точками, в которых значение функции можно определить, являются правые концы интервалов и все точки интервала . Значение функции в указанных точках можно записать в виде таблицы:
x |
|
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
90 |
|
|
0 |
|
|
|
|
|
|
|
|
|
1 |
Так как эта таблица определяет функцию не полностью (не для всех x известны ее значения), то при графическом изображении данной функции ее доопределяют, соединив точки графика, соответствующие концам интервалов, отрезками прямой. В результате график функции будет представлять собой непрерывную линию. Подобный график выборочной функции часто называют кумулятивной кривой (от англ. accumulation – накопление).
Построим график по данным примера 8 (рис. 7).
Рис. 7