- •Генеральная и выборочная совокупности
- •Повторная и бесповторная выборки. Репрезентативная выборка
- •Способы отбора
- •Статистическое распределение выборки
- •Эмпирическая функция распределения
- •1) Значения эмпирической функции принадлежат отрезку [0, 1];
- •2) F*(х) - неубывающая функция;
- •Решение
- •Полигон и гистограмма
- •Решение
- •Числовые характеристики выборки
- •Решение
- •Решение
Эмпирическая функция распределения
Пусть известно статистическое распределение частот количественного признака X. Введем обозначения:
nх - число наблюдений, при которых наблюдалось значение признака, меньше х;
n - общее число наблюдений (объем выборки).
Ясно, что относительная частота события X < х равна nх/n. Если х изменяется, то, вообще говоря, изменяется и относительная частота, т. е. относительная частота nx/n есть функция от х. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события X < х.
Итак, по определению,
F*(х) = nх/n,
где nх - число вариант, меньших х; n - объем выборки.
Таким образом, для того чтобы найти, например, F*(x2), надо число вариант, меньших х2, разделить на объем выборки:
В отличие от эмпирической функции распределения выборки функцию распределения F (х) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F(х) определяет вероятность события X<х, а эмпирическая функция F*(х) определяет относительную частоту этого же события. Из теоремы Бернулли следует, что относительная частота события X<х, т. е. F*(х) стремится по вероятности к вероятности F(х) этого события. Другими словами, при больших n числа F*(х) и F(х) мало отличаются одно от другого в том смысле, что
Уже отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической (интегральной) функции распределения генеральной совокупности.
Такое заключение подтверждается и тем, что F*(х) обладает всеми свойствами F(х). Действительно, из определения функции F*(х) вытекают следующие ее свойства:
1) Значения эмпирической функции принадлежат отрезку [0, 1];
2) F*(х) - неубывающая функция;
3) если х1 - наименьшая варианта, то F*(x) = 0 при хх1, если xk - наибольшая варианта, то F*(x)=1 при x>xk.
Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.
Пример. Построить эмпирическую функцию по данному распределению выборки:
варианты xi |
2 |
6 |
10 |
частоты ni |
12 |
18 |
30 |
Решение
Найдем объём выборки: 12 + 18 + 30 = 60.
Наименьшая варианта равна 2, следовательно,
F*(x)=0 при х<2.
Значение X < 6, а именно х1 = 2 и х2 = 6, наблюдалось 12 раз, следовательно,
F*(х) = 12/60 = 0,2 при 2<х6
Значения X < 10, а именно х1 = 2 и х2 = 6, наблюдались 12 + 18 = 30 раз, следовательно,
F*(х) = 30/60 = 0,5 при 6 < х10.
Так как х=10 - наибольшая варианта, то
F*(х) = l при х>10.
Искомая эмпирическая функция
График этой функции изображен на рис. 1.
Рис.1.