Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие С.Д. Шапорев ПРИКЛАДНАЯ СТАТИСТИКА.pdf
Скачиваний:
504
Добавлен:
26.03.2015
Размер:
2.25 Mб
Скачать

 

m

X

= α

= a

xf (x)dx =

a x

dx

= −

1

a

d (a2 x2 ) =

 

 

1

 

π a2 x2

2π

a2 x2

 

 

 

 

a

 

a

a

 

1

 

a2 x2

a

 

 

 

 

 

 

 

= −

2

= 0 . Этот результат очевиден и из рисунка функции

 

2π

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f / (x) =

 

 

x

плотности вероятности. Найдем моду.

 

= 0, x = 0 , но

π(a2 x2 )3 2

x = 0 - это точка минимума, а не максимума. Следовательно, моды данное

распределение

 

не имеет.

Медиану

также

 

найдем

по

 

определению

h

 

 

 

h

 

dx

 

 

 

 

 

 

 

 

h

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

hX

 

X

f (x)dx = X

 

=

1 arcsin x

 

X

=

.

 

 

 

Отсюда

 

 

arcsin

= 0,

 

 

 

 

 

 

 

 

 

a

 

 

 

a π a2 x2

π

 

 

 

 

 

a a

 

2

 

 

 

 

 

 

 

 

 

 

 

 

a

hX

= 0 . В силу симметричности кривой функции плотности вероятности

этот результат тоже очевиден из рисунка

f (x).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

a

 

 

x

2

dx

 

 

 

 

 

 

 

 

 

 

 

 

DX = μ2 =

(x 0)2 f (x)dx =

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

a

π

a2 x2

 

 

 

 

 

 

 

 

 

 

 

x = a sin t, dx = a cos tdt,

 

 

 

 

1

 

π 2

 

 

 

 

 

 

 

 

 

= x2 = a2 sin2 t,

a2 x2

= a cos t,

 

=

 

 

 

a2 sin2 tdt =

 

 

 

 

 

 

 

 

x = ±a, t = ± π 2

 

 

 

 

 

 

 

π

−π 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

2

π 2

1

cos 2t

 

a

2

 

 

t

 

π 2

 

 

1

 

 

 

 

 

π 2

 

 

a

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

dt =

 

 

 

 

 

 

sin 2t

 

 

=

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

π

 

2

π

2

 

 

 

4

 

−π 2

2

 

 

 

 

 

 

 

 

 

−π 2

 

 

 

 

 

 

 

 

 

 

 

 

−π 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Наконец,

 

найдем

 

 

 

требуемую

 

 

 

 

 

критическую

точку.

a

dx

 

 

 

1

π a

 

acost dt =

1 t

= 0.75

=

 

κ0.75

π a2 x2

 

 

πarcsin (κ a) acost

 

 

π

Отсюда

1

arcsin

κ

= −0.25,

κ

 

π

 

π

a

a

= sin

4

=

 

 

 

 

 

 

 

 

 

π a

 

 

=

1 π

arcsin

κ

= 0.75.

arcsin (κ a)

 

 

 

 

 

 

 

 

 

 

π 2

 

a

 

2

, κ0.75 = −

2a .

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

1.5. Выборочные аналоги интегральной и дифференциальной функций распределения

Предметом математической статистики является изучение случайных величин по результатам наблюдений. В ней развиваются методы обработки результатов опытов, анализа полученной из опытов статистической информации, получения числовых оценок параметров распределений.

13

Центральное понятие математической статистики - понятие выборки. Выборка понимается следующим образом. Пусть проводится некоторый эксперимент, связанный со случайной величиной X функцией распределения F(x).

Выборкой объема n из генеральной совокупности с функцией распределения F(x) называется последовательность x1, x2 ,..., xn наблюдае-

мых значений случайной величины X , соответствующих n независимым повторениям данного эксперимента. Таким образом, выборка или выборочная совокупность – это множество случайно отобранных объектов или наблюдений над некоторой случайной величиной, а генеральная совокупность – это совокупность всех объектов или всех возможных мыслимых значений случайной величины, из которых производится выборка. Каждый элемент выборки представляет собой конкретную реализацию одной и той же случайной величины с функцией распределения F(x). Можно,

поэтому уточнить понятие выборки следующим образом.

Выборкой объема n называется n независимых случайных величин X1, X 2 ,..., X n , каждая из которых распределена так же, как некоторая случайная величина X с функцией распределения P(X x) = F(x). Вы-

борка называется репрезентативной или представительной, если она достаточно хорошо представляет количественные соотношения генеральной совокупности. Репрезентативность выборки обеспечивается случайностью отбора. Это означает, что любой объект выборки отобран случайно, при этом все объекты имеют одинаковую вероятность попасть в выборку.

Как известно, существуют четыре схемы выбора элементов множеств (выборки): схемы с возвращением элемента или без возвращения и с последующим упорядочиванием или без упорядочивания выбранных элементов. Все эти схемы реализуются в конкретных инженерных задачах.

Выборка, упорядоченная по возрастанию наблюдаемых значений случайной величины, называется вариационным рядом.

Пусть теперь имеется выборка x1, x2 ,..., xk объема n . Среди элементов xi могут быть и одинаковые. Пусть в выборке элемент xi встречается

k

ni раз. Число ni называется частотой. Очевидно, что ni = n . Отноше-

i=1

ние частоты ni к объему выборки n называется относительной частотой

 

 

n

 

k

k

n

 

1

 

 

 

 

. wi

=

i

 

 

 

значения xi и обозначается wi

=

i

n

 

=

 

n =1.

n

n

Совокупность пар (xi , ni )

 

 

i =1

i=1

 

 

называется статистическим рядом или ста-

тистическим распределением и обычно записывается в виде таблицы: 14

X

x1

x2

xk

ni

n1

n2

nk

Если X - дискретная случайная величина, то статистический ряд, записанный в виде

X

x1

x2

xk

wi

w1

w2

wk

является аналогом ряда распределения. Если же X - непрерывная случайная величина, то статистический ряд записывается в виде

 

 

 

 

 

X

[x0 , x1]

[x1, x2 ]

[xk 1, xk ]

wi

w1

w2

wk

где wi - относительные частоты попадания случайной величины X в ин-

тервал [xi 1, xi ], i = 1,2,..., k .

При большом объеме выборки n ее элементы объединяются в группы и получается группированный статистический ряд. Для этого все интервалы выборки разделяются на l разрядов (от 6 до 20). Следует помнить, что группировка всегда вносит некоторую погрешность в вычисления. Эта погрешность растет с уменьшением числа разрядов. Графическим представлением выборки являются полигон частот и гистограмма. Полигон частот строится для дискретной случайной величины. Это график, точки которого имеют координаты (xi , ni ) или (xi , wi ). Таким образом,

полигон частот для

выборки является налогом многоугольника распреде-

ления дискретной случайной величины. Для иллюстрации распределения

непрерывной случайной величины строят гистограмму (рис. 1.4). Гисто-

 

 

 

 

 

 

 

 

wi

f (x)

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(w i)

 

(x

i

, n

i

)

 

w

 

 

i

 

 

 

 

 

i

 

 

(x , n )

 

 

(xk , nk )

w1

 

wl

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

1-й разряд

i-й разряд

l-й разряд

xi

 

Рис. 1.4. Полигон частот и гистограмма выборки

 

 

 

 

 

 

 

 

 

15

 

 

 

граммой частот группированной выборки называется ступенчатая фигура, составленная из прямоугольников, построенных на интервалах группировки (разрядах) так, что площадь каждого прямоугольника равна или пропорциональна частоте ni или относительной частоте wi . Очевидно,

что при увеличении числа опытов длину разряда можно неограниченно уменьшать, и тогда гистограмма будет все более и более приближаться к некоторой кривой, ограничивающей единичную площадь. Ясно, что эта кривая – график функции плотности вероятности непрерывной случайной величины X . Таким образом, гистограмма – аналог кривой плотности вероятности.

Введем, наконец, понятие выборочной функции распределения. Пусть имеется выборка объема n , x - некоторое действительное число, а

nx - число выборочных значений случайной величины X , меньших x . Тогда число nx / n является относительной частотой наблюдаемых в вы-

борке значений X , меньших x , т.е. относительной частотой появления события X < x . Ясно, что при изменении x будет меняться и величина nx / n . Это означает, что относительная частота nx / n - функция аргумен-

та x . А так как эта функция находится по выборочным опытным данным, то ее называют выборочной, статистической или эмпирической.

Статистической или эмпирической функцией распределения называ-

ют функцию F (x), определяющую для каждого значения x

относитель-

ную частоту события X < x , т.е.

 

 

 

 

 

 

 

 

 

 

 

0,

x x1

,

 

F (x) =

k

w ,

x

 

< x x

 

, k =1,2,..., n 1,

(1.5.1)

 

k

k +1

 

i

 

 

 

 

 

 

 

 

i =1

 

 

 

1,

x > x

 

.

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Формально эмпирическая функция распределения обладает всеми свойствами интегральной функции распределения (подразд. 1.1). Имея статистический ряд, очень легко получить статистическую функцию распределения. Действительно,

F (x)

F (x1) = 0 ,

F (x2 ) = w1 ,

1

F (x ) = w + w ,…,

 

3

1

2

w1 + w2

w1

16

x0

x1 x2

xn 1 xn

k 1

F (xk ) = wi ,

i=1

n

F (xn+1 ) = wi =1 . i=1

Рис. 1.5. График эмпирической функции распределения

На графике этой функции (рис. 1.5) видны все основные особенности эмпирической функции распределения. Она не убывает, а ее значения на-

ходятся в интервале [0,1]. Резкие скачки графика функции F (x), при-

дающие ей ступенчатый вид, имеют место в тех точках, которым соответствуют концы разрядов, а величина скачка равна относительной частоте

разряда. Часто график F (x) строят в виде непрерывной кривой, соединяя

 

 

F (x)

 

 

точки графика, соответст-

 

1

 

 

вующие

концам

или

сере-

 

 

 

 

 

 

динам разрядов,

отрезками

 

 

 

 

 

 

 

 

 

 

 

 

 

 

прямой (рис. 1.6).

 

 

 

 

 

 

 

 

 

Отметим,

что подобный

 

 

 

 

 

 

 

график эмпирической функ-

w1 + w2

 

 

 

ции распределения, даю-

 

 

 

щий приближенное

пред-

 

 

 

 

 

 

 

ставление о графике теоре-

 

w1

 

 

 

 

 

тической

функции

F(x),

 

 

 

 

 

 

часто называют кумулятив-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ной кривой (от англ. accu-

 

 

 

 

 

 

 

x0

 

x1

x2

xn 1

xn

mulation – накопление).

 

 

 

 

Рис. 1.6. Кумулятивная кривая

 

Так

как по теореме

 

 

 

 

 

Бернулли

относительные

 

 

 

 

 

 

 

частоты

wi

при n → ∞ сходятся по вероятности к соответствующим ве-

роятностям событий, то при n → ∞ F (x) приближается к интегральной

функции распределения. О сходимости

F (x) к F(x)

доказана теорема,

носящая имя авторов.

 

 

 

 

Теорема 1.1 (Гливенко-Кантелли ). Эмпирическая функция рас-

пределения F (x) равномерно по x

с вероятностью 1 сходится при

n → ∞ к теоретическому распределению F(x), т.е.

 

 

 

F (x)− F(x)

 

 

(1.5.2)

 

 

P lim sup

 

 

= 0 = 1 .

n→∞ −∞<x<+∞

 

 

 

 

 

 

 

 

 

Смысл этой теоремы в том, что при увеличении объема выборки n у эмпирической функции распределения исчезают свойства случайности и

Яков Бернулли (1654 – 1705) – швейцарский математик.

Валерий Иванович Гливенко (1896-1940) – советский математик, Франческо Паоло Кантелли (1875-1966) – итальянский математик.

17