Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Конспект

.pdf
Скачиваний:
82
Добавлен:
10.06.2015
Размер:
1.35 Mб
Скачать

51

подсчитаем какое количество nj из общего числа N измерений попадает в каждый отдельный. Здесь 1 j k - номер класса, а nj - частота попада-

ния в класс с номером j . Количество классов определяют часто по формуле

Стерджесса:

k 1 3,3 lg N 1 1,4 ln N .

Сумма частот попадания по всем классам должна удовлетворять усло-

вию:

k

nj N .

j 1

Отношение частоты попадания nj к объему выборки N , т.е. pj nj N , называют относительной частотой. Эта величина должна

удовлетворять условию:

k

pj 1.

j 1

Допустим, выборка разбита на 7 классов, а значения частот попадания в серии опытов объемом N = 52 соответствуют табл. 2.1.

 

Распределение результатов измерений по классам

Таблица 2.1.

 

 

 

 

Номер

j

1

2

3

4

5

6

 

7

 

класса

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nj

 

3

6

12

15

9

5

 

2

 

pj nj

N

0,0577

0,1154

0,2307

0,2884

0,1731

0,0962

 

0,0385

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

pm

 

0,0577

0,1731

0,4038

0,6922

0,8653

0,9615

 

1,0000

 

m 1

 

 

 

 

 

 

 

 

 

 

Отложив результаты, данные в табл. 2.1, на графике, как показано на рис. 2.1.а, получаем ступенчатую фигуру, называемую гистограммой. Ломаную линию, получаемую после соединения средних точек гистограммы, на-

зывают полигоном распределения.

Если распределение случайной величины X статистически устойчиво, то можно ожидать, что при повторных сериях наблюдений той же величины,

52

в тех же условиях, относительные частоты попаданий в каждый интервал будут близки к первоначальным. Это означает, что построив гистограмму один раз, при последующих сериях наблюдений можно с определенной долей уверенности заранее предсказать распределение результатов наблюдений по интервалам.

При бесконечном увеличении числа наблюдений N и бесконечном уменьшении ширины интервалов b 0, полигон распределения превращается в плавную кривую f x , называемую функцией распределения

плотности вероятности. Уравнение, описывающее ее, называют диффе-

ренциальным законом распределения.

Рис. 2.1. Графическое изображение статистического ряда

а – гистограмма и полигон (многоугольник) распределения; б – кривая накопления (куму-

лятивная кривая).

Дифференциальная функция распределения определяет вероятность попадания случайной величины в бесконечно малый интервал от x до x dx, отнесенную к величине этого интервала, т.е. к dx.

Свойства дифференциальной функции распределения:

-

она положительна, т.е.

f x 0;

 

-

ее значение изменяется от 0 до 1, т.е. 0 f x 1;

-

площадь под линией

f x в интервале

X равна единице,

т.е. f x dx 1. Это свойство называют условием нормировки: вероят-

ность попадания величины X в интервал от до равна единице. Событие, вероятность которого равна единице, называют достоверным;

-вероятность попадания случайной величины X в интервал от x1 до

x2 определяется интегралом:

53

x2

P x1 X x2 f x dx.

x1

Графически эта вероятность определяется площадью фигуры между линией f x и осью абсцисс между ординатами x1 и x2 (см. рис. 2.2).

Дифференциальный закон распределения позволяет вычислить такие важные величины, как математическое ожидание и моду.

Математическое ожидание mx - значение случайной величины, определяющее центр фигуры, лежащей под линией f x :

mx x f x dx.

 

 

Мода xp – наиболее вероятное значение случайной

величины, т.е.

f xp max f x . По количеству максимумов функции f x

распределения

могут быть одномодальными, двухмодальными и т.д. При равномерном распределении, т.е. при f x = const, мода отсутствует.

Рис. 2.2. Интегральная и дифференциальная функции распределения

Возвратимся к результатам измерений, представленным в табл. 2.1. В последней строке таблицы даны суммы относительных частот попадания в отдельные классы. Отложив их на графике, как показано на рис. 2.1.б, полу-

чает кривую накопления относительных частот (кумулятивную кривую). При бесконечном увеличении числа наблюдений N эта кривая превращается

54

в интегральную функцию распределения F(x), являющуюся другой важной характеристикой случайных величин.

Величина F(x) определяет вероятность того (события), что случайная величина X в предстоящем опыте примет значение, меньшее x, т.е.:

F x P X x P X x .

(2.7)

Свойства интегральной функции распределения (см. рис. 2.2):

-она положительна, т.е. F x 0;

-неубывающая, т.е. F x2 F x1 , если x2 x1;

-F 0; F 1, или 0 F x 1.;

-вероятность попадания случайной величины X в интервал от x1 до

x2 равна разности F x2 и F x1 , т.е. P x1 X x2 F x2 F x1 .

Дифференциальная и интегральная функции распределения взаимосвязаны очевидными соотношениями:

 

x

f x dF x dx.

 

F x

f d ;

(2.8)

С помощью интегральной функции распределения легко определить значение медианы, называемой 50% квантилем.

Медиана xm – значение случайной величины, вероятность появления которой равна ½ (50%). Медиана делит всю совокупность значений случайной величины на две равные части по количеству полученных результатов.

Распределения могут быть симметричными и несимметричными. При симметричном распределении ветви функции f x располагаются симметрично относительно ординаты, проходящей через моду xp , а числовые зна-

чения моды xp , медианы xm и математического ожидания mx совпадают.

При несимметричном такого совпадения не наблюдается.

2.4.Нормальный закон распределения (закон Гаусса)

Одним из наиболее часто используемых законов распределения случайной величины является нормальный закон.

Нормальный закон реализуется при воздействии на случайную величину большого количества независимо действующих факторов, каждый из которых оказывает незначительное влияние на результат по сравнению с суммарным влиянием всех факторов.

55

Математически нормальный закон описывается уравнением:

f x

 

1

 

 

x m

x

2

 

 

 

 

 

exp -

 

 

 

,

(2.9)

 

 

 

 

 

2 2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где 2 - генеральная дисперсия;

- генеральное среднее квадратичное от-

клонение (рис. 2.3); mx - математическое ожидание случайной величины. Величины mx и являются параметрами нормального закона, поэтому

этот закон относится к классу двухпараметрических законов распределения.

Свойства нормального закона:

- большие отклонения случайной величины от ее математического ожидания маловероятны;

- точки перегиба отстоят от математического ожидания mx на вели-

чину среднего квадратичного отклонения см. рис. 2.3.

- площадь фигуры, заключенной между кривой f x , осью абсцисс и ординатами mx и mx равна 0,683, т.е. вероятность отклонения слу-

чайной величины от ее математического ожидания на величину составляет

68,3%.

Рис. 2.3. Параметры нормального закона распределения

Значения

f x согласно формулы (2.9) зависят от параметров mx и .

С изменением

математического ожидания mx происходит смещение поло-

жения моды вдоль оси Х; изменение дисперсии 2 (и среднего квадратичного отклонения ) является причиной изменения высоты и ширины фигуры f x так, что площадь, лежащая под линией f x остается неизменной и рав-

ной 1.

Замена в формуле (2.9) размерной переменной x на нормированную t x mx дает нормированное нормальное распределение

 

 

 

56

 

 

 

 

 

 

f t

 

1

 

 

 

t

2

 

 

 

 

 

exp

-

 

 

,

(2.10)

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

графическое изображение которого одинаково для всех значений mx и .

Интегральная функция нормированного распределения определяется

формулой:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F t

1

 

 

 

t

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

exp -

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

(2.11)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

1 t

 

2

1 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

exp

-

 

 

 

d

2

 

exp -

 

d 0,5 t .

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

0

 

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

0

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

 

 

 

 

2

 

exp

 

2

 

 

d 0,5;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

t

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

exp

 

 

d - функция Лапласа (табличный интеграл).

 

 

 

0

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Свойства функции Лапласа:

 

 

0,5;

t t .

0,5;

 

 

 

 

 

 

 

0 0;

Вероятность попадания случайной величины Х в интервал от x1

до x2

может быть найдена по таким формулам:

P x1 X x2

P t1 t t2

t2

f d

 

 

 

(2.12)

 

 

 

t1

 

F t2 F t1 t2 t1 ,

где t1 x1 mx ;

t2 x2

mx .

Лекция IX.

2.5. Числовые характеристики случайных величин

Функции распределения описывают поведение непрерывных случайных величин. На практике все результаты являются дискретными величинами. В таких случаях для характеристики случайных величин используют числовые характеристики, которыми являются начальные и центральные моменты.

Начальный момент порядка l определяется по одной из формул:

57

 

 

 

1

N

 

 

1

k

а) Ml

xl f (x) dx;

б) Ml

xil ;

в) Ml

 

xlj nj .

 

 

 

 

 

N i 1

 

 

N

j 1

 

 

 

 

 

 

 

 

(2.13)

Формула (2.13.а) применима для непрерывных случайных величин, формулы (2.13.б) и (2.13.в) – для дискретных. Здесь N – количество случайных величин (объем выборки); nj – частота попадания в j- й класс (группу); k

– количество классов, на которое разбит размах варьирования случайной величины. Формула (2.13.б) применяется для вариационного ряда, а формула (2.13.в) – для статистического ряда.

Наиболее важное значение из начальных моментов имеет момент первого (l = 1) порядка, определяющий положение центра результатов:

 

 

 

 

 

 

1

N

 

x f (x) dx;

 

 

 

 

а) M1 mx

 

б) M1

x

пр

i 1 xi ;

 

N

 

 

1

k

 

 

 

 

 

 

 

в) M1

x

вз

xj nj ,

(2.14)

 

 

 

 

 

 

N j 1

 

который определяет или математическое ожидание в случае непрерывной ве-

личины, или простое среднее значение xпр в случае представления дискрет-

ной величины вариационным рядом, или взвешенное среднее значение xвз – в случае представления статистическим рядом.

Центральный момент порядка l определяется для вариантов а, б и в

так:

 

 

 

 

 

 

 

 

 

1

N

а) l (x mx)l f (x) dx;

 

 

 

 

б) l

(xi

 

)l ;

 

 

 

 

x

 

 

 

 

 

 

 

 

k

 

 

 

 

 

N i 1

 

 

1

 

 

 

 

 

 

 

 

 

в) l

 

(xj

 

 

)l

nj .

 

 

(2.15)

x

 

 

N

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

Наиболее употребительным из центральных моментов является момент второго (l = 2) порядка, определяющий рассеяние результатов относительно центра; он называется дисперсией генеральной, простой и взвешенной:

 

 

1

N

а) 2 f (x)(x mx)2dx;

б) S12

(xi

 

)2 ;

x

 

 

 

N i 1

58

 

 

 

 

 

 

 

 

 

 

1

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в) S12

nj (xj

 

 

)2 .

 

 

 

 

 

 

 

 

(2.16)

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь S12 - одномоментная (точечная) дисперсия. Значение S12 дает

оценку генеральной

дисперсии

2 ,

умноженной

на

 

N 1 N :

S2

 

N 1

2 . Другими словами,

S2 смещена относительно 2

на ве-

 

 

1

N

 

 

N

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

личину 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Несмещенной оценкой генеральной дисперсии 2 является другая то-

чечная дисперсия, а именно:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

2

 

 

 

Sx2

 

 

N

S12

1

xi

 

2

 

N

 

pj xj

 

 

 

2

 

b

 

.

(2.17)

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

N 1 i 1

 

 

 

 

 

 

 

N 1 j 1

 

 

 

 

12

 

 

 

Здесь b ширина классов статистического ряда; b2 /12

 

поправка

Шеппарда.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В качестве меры рассеяния случайной величины чаще используется

среднее квадратичное отклонение:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

;

 

 

 

 

 

Sx

Sx2

.

 

 

 

 

(2.18)

Здесь Sx - точечное среднее квадратичное отклонение случайной вели-

чины Х.

Для более подробного описания распределения случайной величины используют моменты более высоких порядков. Так, третий центральный момент 3 служит для характеристики асимметрии, или скошенности распре-

деления – он входит в коэффициент асимметрии:

1

 

3

.

(2.19)

 

 

 

S3

 

При симметричном распределении 1 0, при смещении моды вправо относительно центра распределения 1 0, при смещении влево 1 0 (см.

рис. 2.4).

59

Рис. 2.4. Вид дифференциальной функции

Рис. 2.5. Вид дифференциальной

распределения при разных значениях коэффи-

функции распределения при разных зна-

циента асимметрии.

чениях показателя эксцесса.

Четвертый центральный момент 4 служит для характеристики остро-

ты вершины – он входит в показатель эксцесса:

 

 

2

4

3.

 

(2.20)

 

 

Sx4

 

 

 

 

 

 

 

 

Для нормального распределения

2

0, в случае

тупой вершины

2

0, при острой вершине 2

0 (рис. 2.5).

 

2.6. Доверительная вероятность и доверительный интервал

Числовые характеристики дают оценки искомого параметра, наиболее близкие к истинному значению. Для практики важно не только получить оценку параметра, но и определить интервал, называемый доверительным, между границами которого с заданной вероятностью, называемой доверительной, находится истинное значение оцениваемого параметра:

P xн xи xв 1 p,

где p – уровень значимости, определяющий вероятность ошибочности выдвинутой нуль-гипотезы: истинный размер xи находится в интервале от xн до xв.

Для определения доверительного интервала надо знать оценку средне-

го квадратичного отклонения , которой является Sx Sx N , где Sx - не-

смещенная оценка точечного среднего квадратичного отклонения - определяется по формуле (2.18); N – общее число многократных измерений.

60

При нормальном законе распределения доверительному интервалу

x отвечает доверительная вероятность = 68,3%; интервалу x 2 -

вероятность = 95%; интервалу x 3 - вероятность = 99,7%.

В общем случае при нормальном законе распределения и доверительной вероятности 1 p границы доверительного интервала при симмет-

ричном положении относительно x будут отстоять от x на величину tp 2Sx,

где tp 2 – аргумент функции Лапласа, отвечающей уровню значимости p2.

Поэтому доверительный интервал при нормальном законе распределения за-

пишется так:

 

 

 

 

 

 

 

 

tp /2S

 

 

xи

 

tp/ 2S

 

.

(2.21)

 

x

x

 

x

x

Величину tp 2 определяют по таблице функции Лапласа.

Например,

при доверительной вероятности = 0,95 (95%) и p2 = 0,025 (2,5%) функция Лапласа равна: t 0,5 p2 = 0,5 – 0,025 = 0,475. Этому значениюt по таблице соответствует t = 1,96. В этом случае доверительный интер-

вал составит:

x 1,96 Sx xи x 1,96 Sx .

Такой способ оценки применим при нормальном законе распределения погрешностей результатов измерения и большом количестве опытов. При малом количестве опытов (N < 20…30) и нормальном законе распределения величина дисперсии (среднего квадратичного отклонения) отличается от значения, даваемого законом Гаусса. В таких случаях оценку границ доверительного интервала производят с привлечением распределения Стьюдента (табл. 2.2), которое описывает плотность распределения отношения (дроби Стьюдента):

t , x mx Sx N x mx Sx .

Отсюда следует, что отклонение среднего значения результата измере-

ния x

от

истинного значения

(математического ожидания) mx составит

t , S

 

,

где

t , – коэффициент

Стьюдента, определяемый по таблице (см.

x

табл. 2.2).

Из табл. 2.2. видно, что уже при N > 20…30 распределение Стьюдента переходит в нормальное распределение.