Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс лекций _Выборочный метод_Новротская.doc
Скачиваний:
17
Добавлен:
10.11.2018
Размер:
398.85 Кб
Скачать

3. Статистическое распределение выборки

В дальнейшем под генеральной совокупностью мы будем подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В действительности генеральной совокупности как множества объектов может и не существовать. Например, имеет смысл говорить о множестве деталей, которые можно произвести, используя данный технологический процесс. Используя какие-то известные нам характеристики данного процесса, мы можем оценивать параметры этого несуществующего множества деталей. Размер детали – это случайная величина, значение которой определяется воздействием множества факторов, составляющих технологический процесс. Нас, например, может интересовать вероятность, с которой случайная величина принимает значение, принадлежащее некоторому интервалу. На данный вопрос можно ответить, зная закон распределения случайной величины, а также ее параметры, такие как математическое ожидание и дисперсия.

Итак, будем рассматривать генеральную совокупность как случайную величину X, закон распределения и параметры которой определяются с помощью выборочного метода.

Рассмотрим выборку объема n, представляющую данную генеральную совокупность. Первое выборочное значение x1 будем рассматривать как одно из возможных значений случайной величины X1, имеющей тот же закон распределения с теми же параметрами, что и случайная величина X. Второе выборочное значение x2 – одно из возможных значений случайной величины X 2 с тем же законом распределения, что и случайная величина X. То же самое можно сказать о значениях x3, x4,..., xn .

Таким образом, на выборку будем смотреть как на совокупность независимых случайных величин X 1, X 2, ..., X n, распределенных так же, как и случайная величина X, представляющая генеральную совокупность. Выборочные значения x1, x2, ..., xn – это значения, которые приняли данные случайные величины в результате 1-го, 2-го, ..., n-го эксперимента.

Дискретное статистическое распределение

Пусть генеральная совокупность изучается с помощью некоторого признака или числовой характеристики, которую можно измерить (размер детали, удельное количество нитратов в арбузе, шум работы двигателя, количество бракованных изделий). Данная характеристика – случайная величина X, принимающая для каждой единицы определенное числовое значение. Из выборки объема n получаем значения данной случайной величины в виде ряда из n чисел: x1, x2,..., xn. Эти числа называются значениями признака или вариантами.

Если все значения признака упорядочить, т.е. расположить в порядке возрастания, то в результате получим вариационный ряд. При этом некоторые значения ряда могут повторяться. Выписав все различные значения признака xi и подсчитав, сколько раз данное значение встречается в выборке mi, получим таблицу, которая называется дискретным статистическим распределением (табл. 3.1). Число mi называется частотой i-го значения признака.

Таблица 3.1

Дискретное статистическое распределение

Варианты

x1

x2

x3

...

xk

Частоты

m1

m2

m3

...

mk

Очевидна также справедливость равенства .

Используя статистическое распределение, можно вычислить такие показатели, как относительная частота, накопленная частота, эмпирическая функция распределения:

wi = – относительная частота. В соответствии с законом больших чисел (теорема Бернулли) относительная частота при стремится к вероятности случайного события wipi.

mx – накопленная частота или число наблюдений в выборке, меньших либо равных х.

= выборочная или эмпирическая функция распределения случайной величины Х, вычисленная по выборке. Величина является относительной частотой попадания значений выборки левее точки х в данной выборке, т.е. относительной частотой события (X < x). Иначе говоря, является выборочным аналогом функции распределения в генеральной совокупности.

Свойства эмпирической функции распределения:

1. 0 ≤ ≤ 1, следует из определения.

2. – неубывающая функция.

3. = 0, если .

4. = 1, если .

В точке функция увеличивается на величину wi и до следующего значения остается постоянной, затем в точке опять увеличивается на величину wi+1 и т.д. (рис. 3.1).

Рис. 3.1. График эмпирической функции распределения

Видно, что график эмпирической функции распределения напоминает график функции дискретного распределения вероятностей. Это не случайно: эмпирическую функцию распределения выборки можно рассматривать как функцию распределения вероятностей, где каждому значению , соответствует вероятность wi. Связь между и F(x) основана на теореме Бернулли, так же, как связь между относительной частотой события и его вероятностью. Поэтому если выборка репрезентативная, то F(x) при . Наглядное представление о дискретном статистическом распределении дает полигон частот (xi; ni) или полигон относительных частот (xi; wi) (рис. 3.2).

Рис. 3.2. Полигон распределения относительных частот

Пример 1. На втором курсе института теорию вероятностей изучают 690 студентов. Случайным образом выбрано 50 человек. На экзамене по теории вероятностей эти студенты получили следующие оценки:

8, 2 , 6, 5, 4, 5, 7, 6, 4, 3, 5, 5, 5, 4, 6, 7, 6, 6, 6, 3, 9, 8, 4, 4, 6, 7, 5, 5, 4, 3, 5, 5, 4, 3, 6, 6, 7, 7, 5, 4, 4, 5, 6, 3, 6, 6, 3, 4, 8, 6.

Необходимо:

1) построить вариационный ряд, вычислить относительные, накопленные частоты и значения эмпирической функции распределения;

2) построить полигон распределения относительных частот и график эмпирической функции распределения;

3) вычислить вероятность того, что оценка случайно выбранного студента окажется не менее семи.

Решение

1. Построим вариационный ряд, упорядочив все значения выборки по возрастанию:

2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9.

Используя вариационный ряд, подсчитаем, сколько раз каждое значение признака встречается в выборке. Затем вычислим относительные частоты, накопленные частоты, значения эмпирической функции распределения и все полученные результаты занесем в табл. 3.2.

Таблица 3.2

Х

mi

wi

mx

2

1

= 0,02

1

0

3

6

= 0,12

1 + 6 = 7

= 0,02

4

10

= 0,20

10 + 7 = 17

= 0,14

5

11

= 0,22

11 + 17 = 28

= 0,34

6

13

= 0,26

13 + 28 = 41

= 0,56

7

5

= 0,10

5 + 41 = 46

= 0,82

Окончание табл. 3.2

Х

mi

wi

mx

8

3

= 0,06

3 + 46 = 49

= 0,92

9

1

= 0,02

1 + 49 = 50

= 0,98

x > 9

0

0

50

= 1

Сумма

50

1

2. По данным табл. 3.2. построим полигон распределения относительных частот (рис. 3.3).

Рис. 3.3. Полигон распределения относительных частот

Используя данные последнего столбца табл. 3.2, построим график эмпирической функции распределения (рис. 3.4).

Рис. 3.4. График эмпирической функции распределения

3. Используя данные табл. 3.2, вычислим вероятность того, что оценка случайно выбранного студента окажется не менее семи:

P(X ≥ 7) = P(X = 7) + P(X = 8) + P(X = 9) ≈

w7 + w8 + w9 = 0,10 + 0,06 + 0,02 = 0,18.