Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие С.Д. Шапорев ПРИКЛАДНАЯ СТАТИСТИКА.pdf
Скачиваний:
502
Добавлен:
26.03.2015
Размер:
2.25 Mб
Скачать

С.Д. Шапорев

ПРИКЛАДНАЯ СТАТИСТИКА

Учебное пособие

Санкт-Петербург

2003

Министерство образования Российской Федерации Балтийский государственный технический университет «Военмех»

С.Д. Шапорев

ПРИКЛАДНАЯ СТАТИСТИКА

Учебное пособие

Санкт-Петербург

2003

55

УДК 519.23 (075.8) Ш 24

Шапорев С.Д.

Ш 24 Прикладная статистика: Учебное пособие / Балт.

гос. техн. ун-т. СПб., 2003. 254 с.

В пособии рассмотрены основные статистические методы, приемы вычислений и программы часто используемые в практике инженерных расчетов по специальностям выпускающих кафедр БГТУ. Содержит наиболее важные разделы математической статистики: методы описательной статистики, метод статистических испытаний, оценивание числовых характеристик и закона распределения случайной величины, проверка гипотез, дисперсионный и корреляци- онно-регрессионный анализ. Подробно рассмотрены вопросы статистического моделирования случайных величин на ЭВМ. Приведены примеры, их разбор и решения, графические иллюстрации. Использованы популярные пакеты STATGRAPHICS и MATHCAD.

Большое внимание уделяется практической работе с описанными алгоритмами, предлагаются лабораторные работы по всем изучаемым темам, написанные в статистическом пакете STATGRAPHICS и математическом пакете MATHCAD. Каждая лабораторная работа включает серию индивидуальных заданий.

Предназначено для студентов дневного и вечернего отделения. Его использование поможет активизировать самостоятельную работу студентов по курсу «Прикладная статистика» и даст возможность преподавателям контролировать индивидуальную работу студентов в течение всего семестра.

УДК 519.23 (075.8)

Р е ц е н з е н т ы: кафедра высшей математики ПГУПС (зав. каф. д-р техн. наук, проф. В.Г. Дегтярев), д-р техн. наук, проф. М.С. Попов

Утверждено редакционно-издательским советом университета

© БГТУ, СПб., 2003

1.СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

1.1.Законы распределения дискретных случайных величин

Случайной величиной X называется числовая функция X = X (ω) от

элементарного события, определенная на множестве элементарных исходов Ω , и такая, что при любом x множество тех ω, для которых

X (ω) < x , принадлежит алгебре событий.

Дискретной случайной величиной называется случайная величина с конечным или счетным множеством возможных значений.

Законом распределения случайной величины называется любое правило, позволяющее находить вероятности всевозможных событий, связанных с этой случайной величиной. Для дискретных случайных величин простейшей формой закона распределения является ряд распределения - это таблица, в одной строке которой перечислены все значения случайной величины, а во второй строке - соответствующие им вероятности. Например,

 

X

x1

x2

x3

 

...

xn

 

 

P

p1

p2

p3

 

...

pn

 

Итак, дискретная случайная величина X

в результате опыта примет

одно из своих возможных значений, то есть произойдет одно из полной

группы

 

событий

ω1 = (X = x1),

ω2 = (X = x2 ),..., ωn = (X = xn ),

Ω = {ω1, ω

2 ,..., ωn }.

Вероятности, соответствующие этим событиям, тако-

вы

p1

= P(X = x1), p2 = P(X = x2 ),..., pn = P(X = xn ).

Очевидно,

n

pi =1 , так как xi , i = 1, n образуют полную группу событий.

i=1

Графическое изображение ряда распределения называется многоугольником распределения дискретной случайной величины.

Наиболее общей формой закона распределения является функция распределения. Функцией распределения случайной величины X называ-

ется вероятность неравенства X < x , рассматриваемая как функция параметра x ,

F(x) = P(X < x).

(1.1.1)

Чаще всего определенную таким образом функцию распределения называют интегральной функцией распределения или интегральным законом распределения. Функция распределения - самая универсальная характеристика, она полностью определяет случайную величину. Функция распределения любой случайной величины обладает следующими свойствами:

3

1) 0 F(x) ≤ 1 для всех x ;

2) F(x1) ≤ F(x2 ), если x1 < x2 ; 3) F(− ∞) = 0, F(∞) = 1 ;

4) во всех точках области определения функция непрерывна слева,

т.е. F(x 0) = F(x) или lim F(x) = F(x0 ).

xx0 0

Можно показать, что любая функция F(x), обладающая этими свой-

ствами, может быть функцией распределения некоторой случайной величины. График F(x) в общем случае представляет собой график неубы-

вающей функции, значения которой начинаются от нуля и достигают единицы, причем в отдельных точках функция может иметь разрывы первого рода. Если известен ряд распределения дискретной случайной величины, то можно легко построить функцию распределения

F(x) = P(X < x) = P(X = xi ),

(1.1.2)

xi <x

 

где суммирование распространяется на все те значения

xi , которые мень-

ше x .

 

Пример. На пути движения автомобиля шесть светофоров, каждый из них либо разрешает, либо запрещает дальнейшее движение автомобиля с вероятностью 0.5. Составить ряд распределения и построить функцию распределения числа светофоров, пройденных автомобилем до первой остановки.

Движение автомобиля либо заканчивается на k -м светофоре, если до этого он проходит k 1 светофор без задержки, а на k -м будет остановлен, либо автомобиль пройдет все светофоры и остановлен не будет.

Пусть случайная величина X - число светофоров, пройденных автомобилем. Очевидно, что X может принимать значения 0, 1, 2, 3, 4, 5, 6. X подчинена геометрическому закону распределения с дополнительным условием, что опыт будет закончен, если X примет значение шесть. Следовательно,

 

 

 

P(X = k ) = qpk ,

k = 0,1, 2, 3, 4, 5,

 

 

 

 

 

 

 

 

 

 

 

 

 

P(X = 6)

 

 

5

 

 

 

 

 

 

 

 

(1.1.3)

 

 

 

 

 

=1 P(X = i),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i =0

 

 

 

 

 

 

 

 

 

причем, очевидно,

что p =1 2, q =1 p =1 2.

Тогда ряд распределения

случайной величины X имеет следующий вид.

 

 

 

 

 

 

 

 

 

 

X

 

0

 

 

1

 

2

 

3

 

 

4

 

5

 

6

 

 

 

P

 

1

 

 

 

1

 

 

1

 

 

1

 

 

1

 

 

1

 

 

1

 

 

 

 

2

 

 

4

 

8

 

16

 

 

32

 

64

 

64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

Действительно,

например,

p = P(X = 0) = qp0

= q =1 2,

p2 = P(X =1) = qp =1 4

 

1

 

и так далее.

Зная ряд распределения, легко по-

строить многоугольник распределения и функцию распределения, пользуясь формулой F(x) = P(X < x) = P(X = xi ) (рис. 1.1).

 

 

 

 

 

 

 

 

 

 

 

 

 

xi <x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.0

F(x)

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.5

 

 

 

 

 

 

 

 

 

 

 

 

0.75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.5

 

 

 

 

 

 

 

0.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

2

3

4

 

5

6

0

1

2

3

4

5

6

x

 

 

 

Рис. 1.1. Многоугольник распределения и функция распределения

 

 

 

 

 

 

 

 

 

 

 

 

дискретной случайной величины

 

 

 

 

 

Действительно,

 

F(0) = P(X < 0) = 0, F(1) = P(X <1) =

 

 

 

= P(X = xi ) = p1

=

1

и так далее. Тогда функция распределения мо-

 

 

xi <1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

жет быть выражена в следующем виде:

 

 

 

0, x 0,

 

 

1

= 0.5, 0 < x 1,

 

 

2

 

 

1

 

= 0.75, 1 < x 2,

 

 

4

 

 

 

 

 

 

 

 

7

= 0.875, 2

< x 3,

 

 

8

(1.1.4)

F(x) =

 

 

 

 

15

 

 

 

 

 

16 = 0.938, 3 < x 4,

 

 

31

 

= 0.967, 4

< x 5,

 

 

32

 

 

 

63

 

= 0.984, 5

< x 6,

 

 

64

 

 

 

 

 

 

 

 

 

 

1, x > 6.

 

 

 

 

 

 

 

 

5

 

 

1.2. Числовые характеристики дискретных случайных величин, их свойства

Ряд распределения или функция распределения дискретной случайной величины являются ее исчерпывающими характеристиками, однако они достаточно громоздки, поэтому возникает необходимость в менее «объемных» характеристиках. Таковыми являются характеристики положения и рассеивания. Характеристики положения дают некоторое среднее положение случайной величины, вокруг которого она группируется, а характеристики рассеивания указывают степень рассеивания случайной величины вокруг ее среднего положения.

Наиболее употребительная характеристика положения - математическое ожидание - среднее взвешенное из значений xi , причем каждое xi

при осреднении должно учитываться с весом pi . Таким образом, математическое ожидание дискретной случайной величины равно

mX = M (X ) = x1 p1 ++x2 p2++ ...++ xn pn p1 p2 ... pn

n

xi pi

=i =1n

pi

i =1

n

 

= xi pi .

(1.2.1)

i =1

Если в правой части формулы (1.2.1) стоит ряд, то

M (X ) = xi pi = i =1

n

lim xi pi , причем ряд должен сходиться абсолютно.

n→∞ i =1

Математическое ожидание у данного конкретного распределения может и не существовать.

Математическое ожидание случайной величины X связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины X при большом числе опытов. Эта зависимость того же типа, что между частотой и вероятностью, а именно, при большом числе опытов среднее арифметическое значений X сходится по вероятности к своему математическому ожиданию.

Свойства математического ожидания:

1. M (C) = C, C = const. Постоянную величину можно рассматривать как случайную, принимающую только одно значение с вероятностью рав-

1

ной единице, т.е. M (C) = C 1 = C.

i=1

2.Константу можно выносить за знак математического ожидания,

6

 

M (C X ) =

C M (X ).

 

 

 

 

n

 

т.е.

Действительно,

M (CX ) = Cxi pi =

 

 

 

 

 

 

 

 

i =1

 

n

 

 

 

 

 

 

 

 

 

= C xi pi = CM (X ) .

 

 

 

 

 

 

i =1

 

 

аддитивности: M (X +Y ) = M (X )+ M (Y ),

 

 

3.

Свойство

так

как

 

n

 

n

n

 

 

(Y ).

 

 

M (X +Y ) =

(xi + yi )pi = xi pi + yi pi = M (X )+ M

 

 

 

i=1

 

i=1

i=1

 

 

 

 

 

Совокупность второго и третьего свойств называется свойством

линейности

и

выражается

следующим

равенством

M (C1X1 + C2 X 2 +... + Cn X n ) = C1M (X1)+ C2M (X 2 )+ ... + Cn M

(X n ).

В

частности, если Y = kX + b , то M (Y ) = M (kX + b) = kM (X )+ b.

 

 

4.Свойство монотонности: если X Y , то M (X ) ≥ M (Y ).

5.Мультипликативное свойство: для независимых случайных величин X и Y справедливо M (X Y ) = M (X ) M (Y ).

Кроме математического ожидания в качестве характеристик положения случайной величины часто используются мода и медиана.

Модой дискретной случайной величины X называется такое значе-

ние xk , k =

1, n

, для которого

 

 

 

P(X = d X ) = max P(X = xk ),

(1.2.2)

 

 

k

 

т.е. мода есть наиболее вероятное значение дискретной случайной величины, если это значение единственно. Мода может быть и не единственной, т.е. распределение может иметь несколько мод (мультимодальное распределение).

Медианой дискретной случайной величины X называется число hX ,

удовлетворяющее условию

 

P(X < hX ) = P(X hX ) =1 2.

(1.2.3)

Так как данное уравнение в общем случае может иметь несколько корней, то значение медианы может быть не единственным.

Перейдем теперь к определению характеристик рассеивания случайной величины около своего математического ожидания.

Начальным моментом k -го порядка дискретной случайной величины X называется математическое ожидание k -й степени случайной величины

n

 

α k = M (X k )= xik pi .

(1.2.4)

i =1

Это определение совпадает с определением начального момента в ме-

7

ханике, если вероятности pi интерпретировать как массы точек xi . В ча-

стности из формулы (1.2.4) следует, что первый начальный момент есть математическое ожидание, т.е. α1 = mX .

Центральным моментом k -го порядка дискретной случайной величины X называется математическое ожидание k -й степени соответствующей центрированной случайной величины

 

n

(xi mX )k pi .

 

μk

= M [(X mX )k ]=

(1.2.5)

 

i =1

 

 

Дисперсией

случайной величины X называется

математическое

ожидания квадрата соответствующей центрированной величины, т.е. ее второй центральный момент,

n

 

D(X ) = DX = μ2 = M [(X mX )2 ]= (xi mX )2 pi .

(1.2.6)

i =1

Средним квадратическим отклонением или стандартным отклонением (стандартом) случайной величины X называется величина

σX = DX .

(1.2.7)

Для дисперсии из формулы (1.2.6) легко выводится следующая часто

употребляемая формула:

 

n

 

DX = xi2 pi mX2 .

(1.2.8)

i =1

 

Свойства дисперсии:

 

 

 

 

 

 

 

1.

Дисперсия любой случайной величины X неотрицательна, причем

DX = 0 тогда

и

только тогда,

когда

X -

постоянная,

т.е.

D(X ) ≥ 0, D(C) = 0.

 

 

 

 

 

 

 

 

 

2.

Если Y = X + C , где C = const , то D(Y ) = D(X + C) = D(X ).

 

3.

Если C = const , то D(C X ) = C2D(X ).

 

 

 

4.

Если

случайные

величины

X

и Y

независимы,

то

D(X +Y ) = D(X )+ D(Y ).

 

 

 

 

 

 

 

Коэффициентом

асимметрии называется

число

A , определяемое

формулой

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

μ3

 

(xi mX )3 pi

 

 

 

 

 

 

A =

=

i =1

 

.

 

(1.2.9)

 

 

 

σ3X

σ3X

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент асимметрии служит для характеристики асимметрии многоугольника распределения. В случае отрицательного коэффициента

8