Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kurs_Theor.doc
Скачиваний:
8
Добавлен:
22.12.2018
Размер:
1.86 Mб
Скачать

Задание 3. Эмпирическая функция распределения.

Постановка задачи.

Построить график эмпирической функции распределения с подогнанной ожидаемой функцией распределения.

Теоретические основы.

Эмпирическая функция распределения:

Она служит оценкой истинной функции распределения и представляет собой возрастающую от 0 до 1 ступенчатую функцию. Изменения происходят скачком в точках x, совпадающих с каким-либо выборочным значением xi. Высота этого скачка равна числу выборочных данных, равных xi, поделенному на общий объем выборки n. Внутри любого интервала значений x, не содержащего выборочных данных, функция остается неизменной.

В отличие от гистограммы, ЭФР является достаточной статистикой, то есть сохраняет всю полноту информации выборки. Кроме того, при увеличении объема выборки она сходится к истинной функции распределения :

.

(*)

Другими словами, она является состоятельной оценкой . Легко показать, что ЭФР также и несмещенная оценка .

Для построения ЭФР необходимо сначала построить так называемый вариационный ряд – ряд упорядоченных выборочных данных . Обратим внимание здесь на различие в написании индексов в исходной выборке xi и в вариационном ряду x(j). В первом случае индекс указывает на номер в порядке поступления выборочного значения, а во втором случае – на его ранг, то есть на место, которое это значение занимает в ранжированном по возрастанию ряду выборочных данных. Следовательно, всегда x(1) – минимальное значение выборки, x(n) – её максимальное значение при объеме выборки n. Для значений x, попадающих в интервал между k-ым и (k+1)-ым значениями вариационного ряда, – , ЭФР . В частности, заметим, что если , то .

В качестве примера рассмотрим ЭФР, построенную по 6 данным, среди которых -1 встречается два раза, 1 – три раза, а 4 – один раз. График ЭФР будет выглядеть следующим образом

Как и при построении гистограммы, график ЭФР полезно сравнить с графиком предполагаемого распределения (например, нормального). При этом некоторую информацию о степени достоверности этого распределения – правильности выдвинутого предположения о виде распределения – будет нести величина расхождения D, вычисленная по формуле (*). Неизвестные параметры модели можно оценить по выборке. В нормальной модели среднее оценивается выборочным средним , а дисперсия – выборочной дисперсией . Для показательного закона интенсивность отказа также может быть оценена посредством .

Если бы предполагаемое распределение было известно полностью и не надо было оценивать неизвестные параметры, то на основе значений D можно было бы построить критерий проверки адекватности этого распределения выборочным данным – так называемый критерий Смирнова (см., например, сборник таблиц [1]). Применять этот критерий к моделям с неизвестными параметрами нельзя, поскольку вероятность ошибки 1-го рода такого критерия будет зависеть от неизвестных параметров.

    1. Проверка гипотезы о типе распределения

Здесь описывается наиболее популярный метод проверки согласия выборочных данных с гипотезой о типе распределения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]