Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Бурлов_матем1.doc
Скачиваний:
111
Добавлен:
05.12.2018
Размер:
4.01 Mб
Скачать

2.3. Статистическая оценка законов распределения случайных величин

Эмпирические ряды распределения, получаемые при обработке первичных статистических данных, оформляются в таблицах или изображаются графически посредством геометрических образов — точек, линий и фигур в различных сочетаниях. Построение эмпи­рических графиков и диаграмм позволяет установить на первом этапе исследования, к какому типу теоретических распределений ближе всего полученное эмпирическое распределение, что облегча­ет выбор конкретных технических приемов обработки исходных данных.

Для применения Графического метода анализа распределений необходимо знать, как строить графики распределения, какие су­ществуют типы распределений и какими свойствами обладают те­оретические распределения.

Покажем, каким образом производится обработка статистичес­кого материала для нахождения законов распределения случайной величины. Для этого будем рассматривать некоторую случайную величину X. При функционировании экономической системы или ее элемента в течение некоторого времени t случайная величина X может принять п определенных значений. Совокупность этих слу­чайных значений случайной величины в математической статисти­ке называется статистической выборкой объема п. Если располо­жить отдельные значения случайной величины X в возрастающем или убывающем порядке и указать относительно каждого значения, как часто оно встречалось в данной совокупности, то полу­чится эмпирическое распределение случайной величины, или ва­риационный ряд, на основании которого определяются аналитиче­ская форма неизвестной плотности вероятности f(х), функция рас­пределения F(x) и оцениваются входящие в нее параметры.

Рассмотрим подробнее процедуру построения вариационного ряда.

Весь диапазон значений непрерывной случайной величины X разбивается на интервалы. Далее подсчитывается количество зна­чений случайной величины X, приходящейся на каждый интер­вал, и определяется частота ее попадания в данный интервал по формуле:

(2.36)

Если случайная величина X, принимает значение, попадающее на границу i-го и (i + 1)-го интервалов, то это значение учитывает­ся в числе попаданий в (i + 1)-й интервал.

Определив таким образом частоты попадания случайной вели­чины X в каждый интервал, получим вариационный (статистичес­кий) ряд, который представляют в виде таблицы:

Интервал

….

Частота

…..

Оптимальная длина интервала определяется по формуле:

(2.37)

где размах вариации случайной величины X.

Число интервалов будет равно:

(2.38)

Если k не целое число, то в качестве числа интервалов надо взять ближайшее к k целое число, не меньшее k.

Вариационные ряды могут быть изображены графически в ви­де полигона распределения и гистограммы.

Полигон распределения представляет собой многоугольник, который строится на прямоугольной координатной сетке следующим образом. В выбранных масштабах на оси абсцисс наносится шкала для фактических значений случайной величины X, на оси ординат— для частот (рис. 2.2). Пользуясь этими шкалами, наносят точки с координатами и . Точки соединяют ломаной линией .Крайние точки и если они не лежат на оси Ох соединяют также со смежными точками соответственно и на оси абсцисс. Полученный таким образом много­угольник является полигоном распреде­ления.

Рис. 2.2. Полигон распределения реализаций случайной величины X

Полигоны распределения чаще всего применяются для изобра­жения дискретных вариационных рядов.

Гистограмма распределения реализаций случайной величины применяется для графического изображения интервальных рядов распределения. Она представляет собой многоугольник, построен­ный с помощью смежных прямоугольников. В случае непрерывных Равных интервалов с шириной интервала х гистограмма строится следующим образом (рис. 2.3).

Рис.2.3. Гистограмма распределения

В выбранных масштабах на оси абсцисс наносится шкала для реализаций случайной величины X, на оси ординат — величины .ользуясь этими шкалами, строят прямоугольники ABCD, DEFG, ..., основания которых соответствуют ширине интервала х, а высоты равны отношениям Многоугольник ABCEF... QORJA и является гистограммой распределения.

Гистограммы чаще всего применяются для изображения вариа­ционных рядов с непрерывными значениями случайной величины X. При уменьшении величины каждого интервала гистограмма бу­дет приближаться к некоторой плавной кривой, соответствующей графику функции плотности распределения случайной величины X. Следовательно, в результате построения гистограммы можно по­лучить представление о дифференциальном законе распределения случайной величины X.

Эмпирическая (статистическая) функция распределения стро­ится следующим образом. Над каждым отрезком оси абсцисс (х), изображающим расстояние между концами интервалов, проводит­ся отрезок горизонтальной прямой на уровне ординаты, равной ве­личине накопленной частоты; концы горизонтальных отрезков со­единяются вертикальными линиями.

Статистическая функция распределения F*(X) представляет со­бой частоту событий X < х в данной выборке:

(2.39)

где x – текущая переменная

p – частота, или статическая вероятность события.

Неравенство под знаком суммы указывает, что суммиро­вание распространяется на все те значения , которые меньше х.

Значения при данном значении определяется по фор­муле:

(2,40)

где число опытов, при которых X <.

При неограниченном увеличении числа опытов (наблюдений) п, согласно теореме Я. Бернулли, при любом частота события р*(Х < ) приближается (сходится по вероятности) к вероятности этого события. Следовательно, если Xнепрерывная величина, то при увеличении n график функции F*(x) приближается к плавной кривой F(x) — интегральной функции распределения величины X.

Таким образом, графическое изображение рядов распределения даёт возможность более наглядно представить эмпирическое рас­пределение реализаций случайной величины и выразить законо­мерность ее распределения путем построения статистической инте­гральной функции распределения.

Пример 2.1. Построить гистограмму и статистическую функцию распределения часовой выработки подвижного состава автопред­приятия.

Значения часовой выработки получены в ходе наблюдения за работой автомобилей-самосвалов КамАЗ-5511 в течение календар­ного года. Объем выборки составил n = 100 наблюдений. Размах вариации равен:

Величина интервала вариационного ряда определена по формуле (2.37):

Количество интервалов вариационного ряда равно:

Вариационный ряд часовой выработки автомобиля представлен в табл.2.1.

Таблица 2.1.