Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
195
Добавлен:
06.02.2016
Размер:
2.19 Mб
Скачать

4. Статистическое распределение выборки,

эмпирическая функция распределения

Пусть исследуется произвольная случайная величина и относительно этой случайной величины производится ряд независимых опытов (испытаний) при наличии определённого комплекса условий. Далее, пустьиз генеральной совокупности извлечена выборка, причем значениенаблюдалось раз, наблюдалосьраз, и так далее наблюдалосьраз, при этом натуральное числои

,

выражает объём выборки, значенияназываютвариантами с.в..Вся совокупность значений с.в.представляет собой первичный статистический материал, который подлежит дальнейшей обработке, сначала подлежатьупорядочению. Операцию по упорядочению значений случайной величины (признака) по не убыванию называют «ранжированием» статистических данных. Полученная таким способом последовательность значенийслучайной величины, где;,называетсявариационным рядом.

Числа , показывающие, сколько раз встречаются варианты (числа)в ряде наблюдений, называютсячастотами. А числаравное отношениек объёму выборки, называютсяотносительными частотами, т.е.

(1)

Пе­речень вариантов и соответствующие им частость или относи­тельных частот называют статическим распределением выборки или статическим рядом.

Статистическое распределение записывается в виде таблицы, где в первой строке пишут численные значения вариантов, а вторая заполняется их соответствующими частотами. Из этой таблицы затем составляют новую таблицу с указаниемчастотностей (относительных частот) , где должен выполняться «контроль»

Пример 2. Задано распределение частот выборки объема ,

.

Эта таблица означает, что принимается три раза,принимается 10 раз ипринимается 7 раз. В итоге:.

Написать таблицу распределение относительных частот.

Решение. Найдем относительные частоты, для че­го разделим частоты на объем выборки:

.

Теперь, составим таблицу распределения относительных частот:

.

Контроль:

Пример 3. В результате тестирования группы из 10 человек для приёма на работу претенденты набрали баллы: Составить

а) вариационный ряд;

б) статический ряд;

в) таблицу частот и относительных частот.

Решение. а) Упорядочив статические данные, получим вариационный ряд:

;

б) Подсчитав частоту и относительную частотность вариантов: получим статическое распределение выборки (так называемый дискретный ряд).

0

1

2

3

4

5

1

2

1

1

2

3

где . Контроль.

Построим таблицу относительную частоту

0

1

2

3

4

5

где . Контроль.

Статистическое распределение выборки является оценкой неизвестного распределения.

По теореме Бернулли, относительные частоты сходятся прик соответствующим вероятностям,т.е.. Поэтому, при больших значенияхстатическое распределение мало отличается от истинного распределения.

В случаях, когда количество значений признака (с.в.) достаточно велико или когда случайная величинаявляется непрерывной (т.е. её значение заполняет некоторый отрезок числовой прямой),составляют интервальный статистический ряд.

В первую очередь образуют частичные промежутки, которые берут обычно с одинаковыми длинами, равными.

Интервалы

Частота

Частость

Эта таблица означает, что весь диапазон изменения величиныразбит на интервалы

(границами го интервала являются,и); числоесть частота попадания вй интервал,, гдеколичество чисел в исходном ряде (выборке), приходящихся в- й интервал. На практике число интервалов выбирается обычно в пределах одного-двух десятков. Также следует отметить, что в общем случае длины интервалов не обязаны быть одинаковыми.

Для определения величины интервала существуют разные подходы, в качестве одного из таких способов разбиения, может быть использована формула Стерджесса:

где выражает разность между наибольшим и наименьшим значениями признака, числа интервалов;. За начало первого интервала рекомендуется брать величину, и если конец последнего промежутка входит во множестве с.в., то оно также включается в число элементов, входящих в последний промежуток. После завершения «разбиения» первую строку таблицы статического распределения заполняют полученными частичными промежутками. Во второй строчке статистического ряда вписывают числа- количество наблюдений, попавших в каждый интервал, а затем составляют вторую таблицу относительных частот по выше указанному принципу, где мы для удобства объединили обе таблицы.

Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математичес­кой статистике — соответствие между наблюдаемыми ва­риантами и их частотами, иличастость (относительные частоты).

Пример 4. Измерили рост (с некоторой точностью скажем до 1 см.) 30 наудачу отобранных студентов. Результаты измерения показали:

Построить интервальный статистический ряд.

Решение.Сначала упорядочим полученные данные.

Следует, что рост студентов является непрерывной с.в. При более точном измерении роста значения с.в.обычно не повторяется и может отличиться друг от друга на несколько миллиметров. Вероятность наличия на Земле двух человека с одинаковым ростом, например,метров, равна нулю.

Отсюда следует, что ; в соответствии с формулой Стерджесса, при, находим длину частичного интервала разбиения:

Если примем за , тогдаВсе исходные данные разбиваем наинтервалов (при):

Подсчитав общее число студентов , попавших в каждый из полученных промежутков, получим интервальный статистический ряд:

Рост

[150-156)

[156-162)

[162-168)

[168-174)

[174-180)

[180-186)

Частота

4

5

6

7

5

3

Частость

0,13

0,17

0,20

0,23

0,17

0,10

Одним из способов статистической обработки вариационного ряда является построение

эмпирической функции распределения.

Пусть известно статистическое распределение частот количественного признака число наблюдений, при которых наблюдалось значе­ние признака, а общее число наблюдений (объем выборки).

Эмпирической (статистической) функцией распределения называется функция,определяющая для каждого значениячастость события:

(2) .

В отличие от эмпирической функции распределения выборки, интегральную функцию распределения ге­неральной совокупности называюттеоретической функ­цией распределения. Различие между эмпирической и тео­ретической функциями состоит в том, что теоретическая функция

(3)

- определяет вероятность события, а эмпирическая функция определяет относительную частоту этого же события.

Очевидно, что функция удовлетворяет тем же условиям, что и истинная функция(см.Т.3).Другими словами, числа и мало отличаются одно от другого. Уже отсюда следует целесообразность исполь­зования эмпирической функции распределения выборки для приближенного представления теоретической (инте­гральной) функции

-распределения генеральной совокуп­ности. Такое заключение подтверждается и тем, что об­ладает всеми свойствами . Действительно, из опреде­ления функции вытекают следующие ее свойства:

1. Значения эмпирической функции принадлежат от­резку [0,1];

2. неубывающая функция;

3. Если наименьшая варианта, то при ; и если наибольшая варианта, то при ,.

На основании теорем ЗБЧ при увеличении числа наблюдений (опытов) относительная частота событияприближается к истинной вероятности этого события.

Эмпирическая функция распределения является как бы «оценкой» вероятности события, т.е. оценкой теоретической функции распределенияс.в..

Таким образом, можно заключить, что имеет место утверждение,

Пусть является теоретическая функция распределения случайной величины, аеё эмпирической функцией распределения. Тогда для любогосправедливо предельное соотношение

(4)

Пример 5.В условиях примера 3, и используя полученные результаты, построим эмпирическую функцию.

Решение. В нашем случае по условию. В целях наглядности решения примера приведём ещё раз полученную таблицу относительных частот

0

1

2

3

4

5

где . Контроль.

Поэтому при(наблюдений меньшеотсутствует);при(здесь по таблице).при(здесь) и т.д. Таким образом, получаем

График эмпирической функции распределения имеет вид: (Рис. 72.)

Рисунок 72 из Письменного

Соседние файлы в папке Теория вероятностей от исмоилова