Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов всех специальностей

.pdf
Скачиваний:
151
Добавлен:
19.08.2013
Размер:
863.61 Кб
Скачать

40

Доказательство. Пусть X1 , X2 ,K, Xn - п попарно независи-

мых случайных величин. Средняя арифметическая этих величин является, в свою очередь, тоже случайной величиной. Обозначим

 

 

 

 

 

 

 

1 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

её X : X =

 

Xi . Определим математическое ожидание и дис-

 

 

 

 

 

 

 

 

n i =1

 

M (

 

 

)= M

 

n

 

 

 

 

 

 

 

 

 

n

 

 

персию

X

:

 

 

 

 

 

 

 

x

1

Xi

=

1

M (xi ),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i =1

 

 

 

 

 

 

n i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(x)= D 1 Xi =

 

 

1 D(xi ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

i =1

 

n2

 

 

Применяя к случайной величине

 

 

 

неравенство Чебышева, полу-

X

 

p(

 

 

 

M (

 

)≤τ

 

)>1

D(

 

),

 

 

чаем

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

X

x

 

 

 

 

 

τ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

n

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

p

 

1

 

Xi

M (xi )

τ >1

D(xi ).

 

 

n

 

n

n2τ 2

 

 

 

 

 

 

 

 

=

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

i 1

 

i 1

 

 

 

 

 

 

 

 

i 1

Заменяя в правой части последнего неравенства дисперсии случайных величин величиной В, которую по условию теоремы не превосходит ни одна из дисперсий, получаем усиленное неравенство

 

 

1

n

1

M (xi )

 

 

 

B

 

 

 

 

 

p

 

Xi

 

τ

>1

.

 

 

n

 

nτ 2

 

 

n i =1

 

 

 

 

 

Для любого сколь угодно малого числа η > 0 можно найти такое

число п, при котором выполняется неравенство B <η. Таким nτ 2

образом получаем неравенство, которое требовалось доказать:

 

 

1

n

1

n

 

 

>1η.

 

 

p

 

Xi

M (xi )

 

τ

 

 

n i =1

n i =1

 

 

 

Переходя в фигурных скобках к противоположному событию,

можно записать p

1

n

1

n

>τ η .

Xi

M (xi )

 

n i =1

n i =1

 

Теорема Чебышева показывает, средняя арифметическая попарно независимых случайных величин обладает свойством устойчивости и при определённых условиях мало отличается от средней арифметической математических ожиданий этих величин.

41

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 28. Основные понятия математической статистики

Математическая статистика- это раздел математики, изу-

чающий методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей. Выводы о закономерностях, которым подчиняются явления, изучаемые методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений. Поэтому естественно предположить, что эти выводы при большом числе наблюдений могут оказаться иными. Чтобы быть в состоянии высказать более определённое суждение об изучаемом явлении, математическая статистика опирается на теорию вероятностей.

Оценив неизвестные величины или зависимости между ними по данным наблюдений, исследователь выдвигает ряд гипотез, предположений о том, что рассматриваемое явление можно описать той или иной вероятностной теоретической моделью. Далее, используя математико-статистические методы, можно дать ответ на вопрос, какую из гипотез или моделей следует принять. Именно эта модель и есть закономерность изучаемого явления.

Основные задачи математической статистики состоят в разработке методов:

1)организации и планирования статистических наблюдений;

2)сбора статистических данных;

3)«свертка информации», то есть методов группировки и сокращения статистических данных с целью сведения большого числа таких данных к небольшому числу параметров, которые в сжатом виде характеризуют всю исследуемую совокупность;

4)анализа статистических данных;

5)принятия решений, рекомендаций и выводов на основе анализа статистических данных;

6)прогнозирования случайных явлений.

Одним из основных методов статистического наблюдения является выборочный метод. Рассмотрим основные понятия этого метода.

42

29. Вариационные ряды

О.1. Генеральной совокупностью называется совокупность всех мыслимых наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий измерений. Число членов, образующих генеральную совокупность, называется объёмом генеральной совокупности.

О.2. Выборочной совокупностью или просто выборкой объё-

мом п называется совокупность п объектов, отобранных из исследуемой генеральной совокупности.

О.3. Вариантами называются различные значения признака, а варьированием – изменение значений признака.

О.4. Расположение наблюдаемых значений в порядке возрастания или убывания называется ранжированием выборки.

О.5. Если признак по своей сущности таков, что различные значения не могут отличаться друг от друга меньше чем на некоторую конечную величину, то говорят, что это дискретно варьи-

рующийся признак.

О.6. Число, показывающее, сколько раз встречается вариант х в ряде наблюдений, называется частотой варианта mx.

Вместо частоты варианта х можно рассматривать её отношение к общему числу наблюдений п, которое называется частостью варианта х и обозначается ωх. Так как общее число наблю-

дений равно сумме частот всех вариантов (n = mx ), то справед-

лива следующая цепочка равенств: ωx = mnx = mmx x .

О.7. Таблица, позволяющая судить о распределении частот (или частостей) между вариантами, называется дискретным ва-

риационным рядом.

Наряду с понятием частоты используется понятие накопленной частоты, которую обозначают mнакx . Накопленная частота

показывает, во скольких наблюдениях признак принял значения, меньшие заданного значения х. Отношение накопленной частоты к общему числу наблюдений называют накопленной частостью и

обозначают ωнак. Очевидно, что ωнак = mxрак

n

.

х

x

 

О.8. Признак называется непрерывно варьирующим, если он может принять любое значение в некотором числовом интервале.

43

По полученным данным такого признака трудно выявить характерные черты варьирования значений признака. Построение дискретного вариационного ряда также не даст желаемых результатов (слишком велико число вариантов). Для получения ясной картины нужно объединить полученные значения в несколько интервалов.

О.9. Таблицу, позволяющую судить о распределении частот (или частостей) между интервалами варьирования значений признака, называют интервальным вариационным рядом.

Интервальный вариационный ряд строят по данным наблюдений за непрерывно варьирующим признаком, а также за дискретно варьирующим, если велико число наблюдавшихся вариантов. Дискретный вариационный ряд строят только для дискретно варьирующего признака.

Для построения интервального вариационного ряда необходимо определить величину интервала, установить полную шкалу интервалов, в соответствии с ней сгруппировать результаты наблюдений. Для определения оптимального интервала h, то есть такого, при котором построенный интервальный ряд не был бы слишком громоздким и в то же время позволял выявить характерные черты рассматриваемого явления, можно использовать фор-

мулу Стэрджеса

h =

 

 

xmax xmin

, где xmax и xmin -

соответст-

1+3,322 lg n

 

 

 

 

венно максимальный

и минимальный варианты.

Величина

1+3,322 lg n характеризует число интервалов m, но так как коли-

чество интервалов целое число, то её округляют до целого значения. При этом желательно, чтобы = hm (xmax xmin )0 было минимальным для возможных значений m. Длина интервала имеет ту же точность, что и варианты.

Пример 33. Найти оптимальную длину интервала по сле-

дующим данным, xmax = 74, xmin =16

n = 50, причём значения

вариантов целые числа.

 

Решение. Вычислим 1+ lg 50 6,64 .

Возможные количество

интервалов 7 или 6. Соответствующие им длины интервалов рав-

ны h1 = 74 716 9; h2 = 74 616 10 . Тогда 1 = 9 7 (74 16)= 5

и 2 =10 6 (74 16)= 2 . Так как 1 = 5 > 2 = 2, то для уменьше-

44

ния погрешностей желательно взять шесть интервалов, имеющих длину 10.

30. Графическое изображение вариационного ряда. Графическое изображение вариационного ряда позволяет

представить в наглядной форме закономерности варьирования значений признака. Наиболее широко используются следующие виды графического изображения вариационных рядов: полигон, гистограмма, кумулятивная кривая.

Полигон, как правило, служит для изображения дискретного вариационного ряда. Для его построения в прямоугольной системе координат наносят точки с координатами (xi ;mi ), где xi -вариант,

mi -соответствующая ему частота. Иногда вместо точек (xi ;mi ) строят точки (xi ;ωi ). Затем эти точки последовательно соединяют отрезками в порядке возрастания xi . Полученная линия носит

название полигон частот или полигон относительных частот. Иногда интервальный ряд изображают с помощью полигона. В этом случае интервалы заменяют их серединными значениями и к ним относят интервальные частоты. Для полученного дискретного ряда строят полигон.

Гистограмма служит для изображения только интервального вариационного ряда. Для её построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на них строят прямоугольники с высотами, равными частотам (или частостям) соответствующего интервала. В результате получают ступенчатую фигуру, состоящую из прямоугольников, которую называют гистограммой.

Кумулятивная кривая (кривая накопленных частот или накопленных частостей) строится следующим образом. Если вариационный ряд дискретный, то в прямоугольной системе координат строят точки с координатами (xi ;miнак ), где xi- вариант, тiнак - со-

ответствующая накопленная частота. Иногда вместо точек (xi ;miнак ) строят точки (xi ;ωiнак ). Полученные точки соединяют

отрезками.

Если вариационный ряд интервальный, то по оси абсцисс откладывают интервалы. Верхним границам интервалов соответствуют накопленные частоты (или накопленные частости); нижней

45

границе первого интервала – накопленная частота, равная нулю. Построив кумулятивную кривую, можно приблизительно установить число наблюдений (или их долю в общем количестве наблюдений), в которых признак принял значения, меньшие заданного. Иногда кумулятивную кривую называют кумулятой.

Пример 34. Построить полигон частот, гистограмму, кумуляту для интервального вариационного ряда.

Интервалы

4 - 8

8 - 12

12 -16

16 - 20

20 –24

24 -28

Частоты

4

6

12

14

8

6

Решение. Построим полигон частот. Вынесем на координатную плоскость точки (xi ;mi ), где xi - середины соответствующих

интервалов, то есть точки (6;4),(10;6),(14;12),(18;14),(22;8),(26;6) . Соединив их ломаной кривой, получим полигон частот.

16

14

12

10

8

6

4

2

0

6

10

14

18

22

26

Для построения гистограммы отложим на оси абсцисс интервалы варьирования и на них как на основаниях построим прямоугольники высотами, равными соответствующим частотам.

16

14

12

10

8

6

4

2

0

[4 - 8] [8 - 12] [12 - 16] [16 - 20] [20 - 24] [24 - 28]

46

Для построения кумулятивной кривой отложим на координатной плоскости точки (4;0), (8;4), (12;10), (16;22), (20;36), (24;44), (28;45) и соединим их ломаной линией, получим кумуляту.

60

 

 

 

 

 

 

50

 

 

 

 

 

 

40

 

 

 

 

 

 

30

 

 

 

 

 

 

20

 

 

 

 

 

 

10

 

 

 

 

 

 

0

 

 

 

 

 

 

4

8

12

16

20

24

28

31. Эмпирическая функция распределения Эмпирической функцией распределения случайной величины

Х называют функцию F * (x), определяющую для каждого значе-

ния х частость события (X < x): F * (x)= nnx , где пх – число вари-

антов хi, меньших х; п – объём выборки.

Эмпирическая функция распределения обладает всеми свойствами интегральной функции распределения. Действительно, из определения эмпирической функции распределения следует, что:

1)значения эмпирической функции распределения принадлежат отрезку [0;1];

2)F * (x) - неубывающая функция;

3)если х1 - наименьшее, а хп – наибольшее наблюденное зна-

(x)= 0 при x x1 и F * (x)=1 при x > xn .

Основное значение эмпирической функции распределения состоит в том, что она используется в качестве оценки функции распределения F (x)= p{X < x}.

Пример 35. Построить эмпирическую функцию распределения для интервального вариационного ряда

Варианты

6

10

14

18

Частота

4

8

6

2

47

Решение. Согласно определению эмпирическая функция распределения имеет вид

 

0

,

x 6;

 

0

,2, 6 < x 10;

F * (x)=

 

,5, 10 < x 14;

0

 

 

 

 

 

0

,8, 14 < x 18;

 

 

 

 

 

 

 

x >18.

 

1,

И её график имеет вид

1,5

1

0,5

0

0

6

10

14

18

22

32. Средние величины Средние величины являются как бы «представителями» все-

го ряда наблюдений, поскольку вокруг них концентрируются наблюдавшиеся значения признака. Заметим, что только для качественно однородных наблюдений имеет смысл вычислять средние величины.

Различают несколько видов средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, средняя кубическая и так далее. При выборе вида средней величины необходимо ответить на вопрос: какое свойство ряда мы хотим представить средней величиной или, иначе говоря, какая цель преследуется при вычислении средней? Это свойство, получившее название определяющего, и определяет вид средней. Понятие определяющего свойства впервые введено советским статистиком А. Я. Боярским.

Наиболее распространенной средней величиной является средняя арифметическая. Пусть х1 , х2, K, хn - данные наблюде-

ний; x - средняя арифметическая. Свойство, определяющее среднюю арифметическую, формулируется следующим образом: сум-

ма результатов наблюдений должна остаться неизменной, если

48

каждое из них заменить средней арифметической, то есть

n

n

 

 

 

 

n

 

 

xi =

x

. Так как

x

= const , то

xi = n

x

. Отсюда получаем

i =1

i =1

i =1

следующую формулу для вычисления средней арифметической по

1 n

данным наблюдений: x = n i=1xi . Если по наблюдениям построен

вариационный ряд, то средняя арифметическая x = n1 xi mi , где

xi - вариант, если ряд дискретный, и середина интервала, если ряд интервальный; mi - соответствующая частота.

Очевидно, что если по данным наблюдений построен дискретный вариационный ряд, то обе формулы дают одинаковые значения средней арифметической. Если же по наблюдениям построен интервальный ряд, то средние арифметические, вычисленные по этим формулам могут не совпадать, так как во второй формуле значения признака внутри каждого интервала принимаются равными центрам интервалов. Ошибка, возникающая в результате такой замены, вообще говоря, очень мала, если наблюдения распределены равномерно вдоль каждого интервала, а не скапливаются к одноимённым границам интервалов.

Основные свойства средней арифметической.

1.Сумма отклонений результатов наблюдений от средней арифметической равна нулю, или сумма произведений отклонений вариантов от средней арифметической на соответствующие частоты равна нулю.

2.Если все результаты наблюдений уменьшить (увеличить) на одно и то же число, то средняя арифметическая уменьшится (увеличится) на это же число.

3.Если все результаты наблюдений уменьшить (увеличить) в одно и то же число раз, то средняя арифметическая уменьшится (увеличится) во столько же раз.

4.Средняя арифметическая алгебраической суммы соответст-

вующих значений признака нескольких рядов наблюдений с одинаковым числом наблюдений равна алгебраической сумме средних арифметических этих рядов.

О.1. Среднюю арифметическую вычисленную по данным выборки называют выборочной средней.

49

Пример 36. Найти выборочную среднюю для выборки, представленной интервальным вариационным рядом

Интервалы

 

3 - 7

7 - 11

11 - 15

15 - 19

19 - 23

 

23 – 27

 

Частоты

 

6

 

9

11

12

8

 

4

 

Решение. Середины интервалов равны: 5; 9; 13; 17; 21; 25.

Сумма частот равна

n = mi = 6 +9 +11+12 +8 + 4 = 50. Тогда

выборочная средняя равна

 

 

 

726

 

 

 

 

 

=

1

 

(5 6 +9 9 +13 11+17 12+21 8 +25 4)=

=14,52.

 

 

x

 

 

 

 

 

 

50

 

 

 

 

 

 

50

 

 

 

33. Медиана и мода Наряду со средними величинами в качестве описательных

характеристик вариационного ряда применяют медиану и моду.

(~ )

О.1. Медианой Me называют значение признака, приходя-

щее на середину ранжированного ряда наблюдений.

Пусть проведено нечётное число наблюдений, то есть n = 2q 1, и результаты наблюдений проранжированы и выписаны

в следующий ряд x(1), x(2),K, x(q1), x(q), x(q+1),K, x(n). Здесь x(i )- значение признака, занявшее i-е порядковое место в ранжированом ряду. На середину ряда приходится значение x(q). Следова-

~ =

тельно: Me x(q).

Если проведено чётное число наблюдений, то есть n = 2q , то на середину ранжированного ряда x(1),x(2),K,x(q1),x(q),x(q+1),K,x(n) приходятся значения x(q) и x(q+1). В этом случае за медиану при-

нимают среднюю арифметическую значений x(q) и x(q+1), то есть

~

 

=

(x

(q)

+ x

(q+1)

)

 

.

 

 

 

 

 

 

 

 

 

M

e

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для интервального вариационного ряда медиана определяет-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

m

нак

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

ся

 

 

 

по

 

 

формуле

Me = ae + h

 

 

 

 

 

или

 

 

 

 

 

 

 

me

 

 

 

 

 

 

 

 

(0

,5 ωeнак )

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

Me

= ae + h

 

 

 

 

 

 

, где ae - начало медианного интервала, то

 

me

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

есть такого, которому соответствует первая из накопленных частот (накопленных частостей), большая или равная половине всех

Соседние файлы в предмете Высшая математика