Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МУ Морозова Чирина 2014

.pdf
Скачиваний:
102
Добавлен:
09.04.2019
Размер:
434.37 Кб
Скачать

Функция φ(t) 0.5cos3t 0.5cos2t представляет собой выпуклую комбина-

цию косинусов и, следовательно, также является характеристической функ-

цией случайной величины. Это дискретная случайная величина, которая с ве-

роятностями 14 принимает значения 2, –2, 3, –3.

в) Как известно, функция φ(t) exp iat σ2t22 является характеристи-

ческой функцией гауссовской случайной величины, имеющей математиче-

ское ожидание a и дисперсию σ2. В рассматриваемом случае a 2 и σ2 4.

Задача 7. Случайные величины X и Y независимы и имеют гауссовские плотности с параметрами (a1 1, σ12 4) и (a2 1, σ22 1) соответственно.

Найти совместную плотность случайного вектора (X + Y, X Y). Являются ли его компоненты независимыми?

Решение. Все линейные комбинации компонент гауссовского случайного вектора также являются гауссовскими и полностью определяются своими мо-

ментами первого и второго порядков. Независимость гауссовских случайных ве-

личин равносильна их некоррелированности, поэтому для ответа на последний вопрос надо лишьсравнить ковариацию или коэффициент корреляции с нулем.

Первый способ. В двумерном случае можно воспользоваться формулой для плотности:

fX,Y (x, y)

 

1

 

 

 

 

exp

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 1

 

2

 

 

 

 

2

 

 

 

 

 

2πσ1σ2 1 ρ

 

 

 

 

 

 

 

ρ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x a

2

x a

y a

2

 

 

 

y a

2

 

 

1

 

 

1

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

σ 2

 

σ1σ2

 

 

 

 

σ

2

 

 

.

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

Для нового случайного вектора (U, V) = (X + Y, X Y) имеем

EU E(X Y) EX EY a1 a2 1 ( 1) 0,

EV E(X Y) EX EY a1 a2 1 ( 1) 2;

из независимости X и Y:

DU DX DY 4 1 5, DV DX D( Y) DX DY 1 4 5;

из линейности ковариации по обоим аргументам:

cov(U,V) cov(X Y,X Y) cov(X,X) cov(Y,X) cov(X,Y) cov(Y,Y)

DX DY 1 4 3;

11

коэффициент корреляции вычисляется по формуле

ρ

 

cov(U,V)

 

 

3

 

 

3

0.6.

 

 

 

 

 

 

 

 

 

 

 

 

 

DU DV

5 5

5

 

Для самопроверки: дисперсии всегда неотрицательны, а для невырожденных случайныхвеличин положительны; коэффициент корреляции всегда не превосходит по модулю 1.

Теперь можно ответить на вопрос о независимости: поскольку коэффициент корреляции отличен от нуля, компоненты случайного вектора являют-

ся зависимыми. Выпишем плотность случайного вектора (U, V):

f

(x, y)

 

1

 

 

exp

 

 

1

 

 

 

 

 

 

 

 

 

 

 

2 1 ( 0.6)

 

 

 

 

 

 

 

 

U,V

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

2π 5

 

5 1 ( 0.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

x y 2

 

y 2 2

 

 

 

2 ( 0.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

5 5

 

5

 

 

 

 

 

 

 

1

 

1

 

 

 

 

exp

 

 

x2

1.2x(y 2) (y 2)2 .

 

 

 

6.4

 

 

Второй способ. Все вычисления, приведенные ранее, можно записать в матричной форме. Такая запись более компактна и, вместе с тем, более универсальна. Случайный вектор (X, Y) имеет вектор математических ожиданий

(1, –1) и ковариационную матрицу

 

 

 

σ2

ρσ σ

 

1

0

 

R

1

1 2

 

 

.

 

 

 

ρσ1σ2

2

 

0

4

 

 

 

σ2

 

Новый случайный вектор (U, V) связан с (X, Y) соотношением (U, V) =

1

1

– матрица преобразования. По линейности матема-

= (X, Y)C, где C

 

1

1

 

 

 

 

 

 

 

 

 

 

 

1

1

 

(0,2).

тических ожиданий (EU, EV) = (EX, EY)C (1, 1)

 

 

 

 

 

 

 

1

1

 

Ковариационная матрица нового вектора вычисляется по формуле

1

1 T 1

0 1

1

5

3

CTRC

 

 

 

 

 

3

 

.

1

1

0

4 1

1

 

 

5

Плотность невырожденного случайного вектора с вектором математиче-

ских ожиданий a1, a2 и ковариационной матрицей R выражается формулой

 

 

1

 

 

 

1

 

 

 

1 x a ,y a

 

T

f

X,Y

(x, y)

 

 

 

exp

 

 

x a ,y a

2

R

2

 

.

 

 

 

2

2π det R

 

 

 

 

 

1

 

1

 

 

12

Для нового вектора имеем

 

 

1

 

 

 

 

1

x,y 2 CTRC

1

 

f

(x, y)

 

 

exp

 

x,y 2 T

.

 

 

 

 

 

 

U,V

 

2πdet C det R

 

 

 

2

 

 

 

 

 

 

 

 

 

Легко проверить, что это выражение совпадает с выражением, получен-

ным первым способом.

Задача 8. Распределение дискретного случайного вектора (X, Y) задано табл. 1.1. Найти: а) распределения случайных величин X и Y; б) их математи-

ческие ожидания, дисперсии, ковариацию и коэффициент корреляции; в) ус-

ловное распределение X при условии Y = 0.

 

 

 

 

 

 

 

 

Решение. а) Табл. 1.2 и 1.3 распределений

 

 

 

 

 

Таблица 1.1

случайных величин X и Y соответственно полу-

Y

 

 

 

 

X

 

 

 

0

1

2

чаются суммированием вероятностей по столб-

 

 

–1

 

0.07

0.11

0.02

цам и строкам. Например, P(X 2) 0.02 0.1

0

 

0.15

0.05

0.1

0.2 0.32 и P(Y 0) 0.15 0.05 0.1 0.3;

1

 

0.1

0.2

0.2

 

 

 

 

 

Таблица 1.2

б) EX 0 0.32 1 0.36 2 0.32 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

аi

 

0

 

1

 

2

EY ( 1) 0.2 0 0.3 1 0.5 0.3;

 

 

 

P X ai

 

0.32

 

0.36

 

0.32

EX2 02 0.32 12 0.36 22 0.32 1.64,

 

 

 

 

 

Таблица 1.3

EY2 ( 1)2 0.2 02 0.3 12 0.5 0.7;

bi

 

–1

 

0

 

1

P X bi

 

0.2

 

0.3

 

0.5

DX EX2 (EX)2 1.64 12 0.64, DY EY2 (EY)2 0.7 0.32 0.61.

Замечания: 1. Можно заметить, что случайная величина X симметрична относитель-

но точки 1, поэтому ее математическое ожидание можно было угадать без вычислений:

это центр симметрии. 2. Для вычисления дисперсии можно воспользоваться и другой формулой:

DX E(X EX)2 0.32 (0 1)2 0.36 (1 1)2 0.32(2 1)2 0.64.

Ковариацию вычислим по формуле

cov(X,Y) P X ai,Y bj aibj EX EY.

i, j

Опустив слагаемые, равные нулю, получим:

cov(X,Y) 0.11 1 ( 1) 0.02 2 ( 1) 0.2 1 1 0.2 2 1 0.7 1 0.25.

Коэффициент корреляции ρ

cov(X,Y)

 

 

 

0.25

0.4.

 

 

 

 

 

 

DX DY

0.64 0.61

 

 

 

 

 

 

13

Таблица 1.4 в) По определению условной вероятности

ai

 

0

1

2

 

P X Xi

 

Y 0

P X Xi,Y 0

.

 

P X ai

 

Y 0

 

1/2

1/6

1/3

 

 

 

 

 

 

 

P(Y 0)

 

 

 

 

 

 

 

 

 

 

 

 

 

P X 0,Y 0

 

0.15

 

Например,

P X 0

 

Y 0

 

0.5. Полученные ре-

 

 

P(Y 0)

 

 

 

 

 

 

 

 

 

 

 

0.3

 

 

зультаты запишем в табл. 1.4.

Раздел 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

2.1. Предмет математической статистики

Математическая статистика – наука, разрабатывающая методы регистрации, описания и анализа данных наблюдений и экспериментов с целью получения вероятностно-статистических моделей случайных явлений.

Основными задачами математической статистики являются следующие:

1.Определение вероятности события по относительной частоте.

2.Нахождение приближенного закона распределения случайной величины по данным экспериментов.

3.Проверка статистических гипотез о свойствах случайного явления.

4.Определение эмпирической (регрессионной) зависимости между переменными, описывающими случайное явление, на основе экспериментальных данных.

При решении указанных задач схема исследования обычно такова:

1.Сначала путем наблюдений и экспериментов собирают и регистрируют статистические данные.

2.Затем эти данные упорядочивают, представляют в компактной наглядной или функциональной форме.

3.Далее получают достаточно обоснованные выводы о свойствах исследуемого случайного явления.

2.2. Генеральная совокупность. Выборка. Выбор

Рассмотрим абстрактный эксперимент Е. Результатом его проведения является значение x случайной величины X. Множество возможных значений изучаемой случайной величины X с приписанным этому множеству законом распределения X: G(x) называют генеральной совокупностью. Числа, состав-

ляющие генеральную совокупность, называют ее элементами. Закон G(x) рас-

пределения случайной величины X называют генеральным законом распределе-

ния, а числовые характеристики X генеральными числовыми характеристи-

14

ками. Так как генеральная совокупность велика, то перебрать все ее элементы невозможно. Поэтому для изучения генеральной совокупности из нее делают выборку, по свойствам которой судят о свойствах генеральной совокупности. Выборкой называют множество измеренных значений x1, x2,..., xn случайной величины X. Выборку записывают в виде n-мерной точки x1, x2,..., xn . Числа,

составляющие выборку, называют ее элементами; их количество n объемом выборки. Процесс составления выборки называют выбором.

Будем рассматривать простой случайный выбор. Таким выбором называют выбор, удовлетворяющий следующим условиям:

1.Выбор является случайным.

2.Каждый элемент генеральной совокупности может быть выбран.

3.Каждый элемент выбирается независимо от остальных.

4.Все элементы выборки получаются в равных условиях.

Реальный выбор лишь приближенно можно считать простым случайным. К выборкам, как и к выбору, предъявляется ряд требований. Важнейшим является требование репрезентативности (представительности). Это требование означает, что выборка должна хорошо представлять всю генеральную совокупность. Требование однородности выборки означает, что условия проведения экспериментов для получения выборки не должны меняться. Выборка должна быть получена из одной генеральной совокупности, а не из нескольких. В ней должны отсутствовать выбросы. Неоднородная выборка не может дать правильного прогноза. Малые и большие выборки отличаются методами обработки. Для обработки большой выборки привлекаются асимптотические методы, основанные на центральной предельной теореме. В статистической практике принято считать выборку с объемом n > 30 большой.

2.3. Вариационные и статистические ряды. Выборочная функция распределения

Вариационным рядом называют последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются: x(1), x(2),..., x(n). Элементы вариационного ряда называют поряд-

ковыми статистиками. Минимальный и максимальный элементы называют

экстремальными элементами вариационного ряда: xmin x(1), xmax x(n).

Статистическим рядом называют последовательность различных элементов xi вариационного ряда с указанными частотами mi повторениями элементов m1 m2 ... ml n .

15

Из вариационного ряда составим ряд распределения выборки – измерен-

ные значения случайной величины xi i 1,2,...,l , расположенные в порядке их возрастания и соответствующие им относительные частоты pi* mi n.

l

Сумма всех относительных частот равна единице: pi* 1. i 1

Графическое изображение ряда распределения (или статистического ря-

да) выборки – полигон относительных частот (или частот), для построе-

ния которого по оси абсцисс откладывают значения xi, по оси ординат – со-

ответствующие им относительные часто-

ты pi* (или частоты mi), а полученные точки соединяют отрезками (рис. 2.1). Полигон относительных частот дает хо-

рошее представление о распределении частот в выборке.

Эмпирической функцией распределения Fn*(x) называют относительную частоту события X x в данной выборке: Fn*(x) vn(X x). При достаточном объеме выборки n эмпирическая функция распределения Fn*(x) дает представ-

ление о теоретической функции распределения F(x) случайной величины X.

Для построения графика Fn*(x) удобно исходный вариационный ряд допол-

нить двумя графами – графой накопленных частот Ni m1 m2 ... mi и

графой накопленных относительных частот Nin (табл. 2.1). Последняя из на-

копленных частот равна объему выборки Nl n. Последняя из накопленных относительных частот равна единицеNl n 1. Это служит проверкой пра-

вильности составления табл. 2.1.

Таблица 2.1

xi

mi

Ni m1 ... mi

Ni

n

x1

m1

m1

N1

n

x2

m2

N2 m1 m2

N2

n

xl

ml

n

1

 

Графы выборочных значений xi и соответствующих им накопленных относительных частот Nin и служат для построения графика эмпирической функции распределения Fn*(x), которая выражается следующим образом:

16

 

 

 

0,

x x1;

 

 

 

N

n,

x x x ;

 

 

 

1

 

1

2

 

 

 

.............

 

Fn*

 

(2.1)

(x)

 

 

xi x xi 1;

 

Ni

n,

 

 

 

 

 

 

 

 

1,

x x .

 

 

 

 

 

 

 

 

 

 

 

l

 

 

Функция Fn*(x) представляет собой разрывную ступенчатую функцию

(рис. 2.2). График этой функции – кумулята.

Если объем выборки значителен и случайная величина X по своей при-

роде непрерывная, то составляют так называемый сгруппированный вариационный ряд. Для этого весь интервал, в котором заключены измеренные зна-

чения случайной величины X, разбивают на ряд частичных интервалов xi...xi 1 (i 1,2,...,l). Для каждого из них подсчитывают частоты mi (число попаданий случайной величины X в данный интервал).

Для наглядной характеристики распределения выборки строят гистограмму выборки. Для построения гистограммы по оси абсцисс (рис. 2.3)

откладывают граничные значения интервалов xi...xi 1; ширина интервала hi xi 1 xi. Затем на каждом интервале как на основании строят прямо-

угольник высотой, равной плотности относительной частоты на данном ин-

тервале: pi*hi, где pi* min – относительная частота.

Гистограмма оценивает кривую плотности распределения случайной ве-

личины (пунктир на рис. 2.3). Площадь каждого частичного прямоугольника равна соответствующей относительной частоте: Si pi*. Вся площадь, огра-

l l

ниченная гистограммой выборки, равна единице: S Si pi* 1. График i 1 i 1

17

эмпирической функции распределения Fn*(x) строят приближенно по край-

ним точкам интервалов, полагая

F*

(x) 0,

x x ;

 

 

n

 

 

 

 

 

1

 

 

*

(x2) N1 n;

 

 

Fn

 

 

 

(2.2)

F*

(x

 

) N

 

n;

 

i 1

i

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F*

(x) 1,

x x .

 

 

n

 

 

 

 

 

l 1

 

 

Полученные точки соединяют ломаной линией (рис. 2.4). Для построе-

ния графиков, вариационных рядов, эмпирической функции распределения и дальнейших числовых точечных и интервальных характеристик можно вос-

пользоваться ресурсами Excel или R-пакетом.

2.4.Выборочные числовые характеристики

Вслучае вариационного ряда (см. табл. 2.1) выборочный начальный мо-

мент k-го порядка вычисляется по формуле

 

 

1

l

 

mk*

[X]

xikmi.

(2.3)

 

 

 

ni 1

 

В частности, если в (2.3) полагать k 1, получим выборочный началь-

ный момент первого порядка, называемый выборочным средним

 

m1*[X]

1

l

 

x

ximi.

(2.4)

 

 

 

ni 1

 

Выборочный центральный момент k-го порядка вычисляется по формуле

 

 

1

l

 

μ*k

[X]

xi

x

kmi.

(2.5)

 

 

 

ni 1

 

Если в (2.5) полагать k 2, получим выборочную дисперсию (второй центральный выборочный момент)

 

1

l

 

D*[X] D*X μ*2[X]

xi

x

2mi.

(2.6)

 

 

ni 1

 

При практическом вычислении выборочной дисперсии удобно пользоваться следующей формулой:

18

*

1

l

2

 

 

2

 

 

 

 

 

 

DX

 

 

xi mi x

 

.

(2.7)

 

 

 

 

ni 1

 

 

 

 

 

 

Положительное значение квадратного корня из выборочной дисперсии

дает выборочное среднеквадратическое отклонение:

 

 

σ*X

 

 

 

 

 

D*X

.

 

 

(2.8)

В случае сгруппированного вариационного ряда для нахождения выбо-

рочных моментов его заменяют вариационным рядом, в котором частота i-го интервала mi соответствует середине i-го интервала: xiср xi xi 1 2,

i 1,2,...,l. В частности, (2.4) и (2.6) перепишутся в виде

x1 l xiсрmi;

ni 1

*

1

l

 

 

2

 

1

l

2

 

2

 

xiср x

 

 

 

 

DX

 

 

mi

 

xiсрmi x

 

.

 

 

 

 

 

ni 1

 

 

ni 1

 

 

 

 

(2.9)

(2.10)

Для уменьшения ошибок, вносимых группировкой, применяют так называемые поправки Шеппарда. Если все интервалы имеют ширину h hi const,

то основные выборочные моменты с учетом поправок Шеппарда находят по формулам:

x

Ш

x

;

 

 

 

 

*

 

 

*

h2

 

(2.11)

 

 

 

DX Ш DX

 

.

 

 

 

 

 

 

 

 

12

 

При выполнении условия h 0.5σ*X поправками Шеппарда можно пре-

небречь, так как при этом σ*X σ*X Ш 0.01σ*X .

2.5. Статистические оценки параметров теоретического распределения

Одной из задач математической статистики является оценивание неизвестных параметров теоретического распределения (случайной величины X)

на основании выборки. Приближенное значение параметра θ теоретического распределения, полученное из выборки, называется статистической оцен-

кой параметра θ (или статистикой). Точечной называют статистическую

оценку которая определяется одним числом (одной случайной величиной). θ,

Для данной конкретной выборки θ θ x1, x2,..., xn – число, но от выборки к выборке оно меняется, так что в общем случае θ θ X1, X2,..., Xn – слу-

19

чайная величина, где X1, X2,..., Xn – результаты 1-го, 2-го, ..., n-го измере-

ний случайной величины X. В литературе по математической статистике

 

X1, X2,..., Xn и ее численное значение для

принято случайную величину θ

 

 

 

данной выборки θ x1, x2,..., xn

обозначать одним и тем же символом θ.

Найти точечную статистическую оценку параметра θ теоретического

 

 

X1, X2,..., Xn , яв-

распределения – это значит найти случайную величину θ

ляющуюся функцией случайных величин X1, X2,..., Xn,

которая для каждой

 

 

 

выборки x1, x2,..., xn дает приближенное значение θ x1, x2,..., xn оцени-

ваемого параметра θ. К точечным статистическим оценкам обычно предъяв-

ляют следующие требования:

1) состоятельность (сходимость по вероятности при n к оцени-

ваемому параметру); 2) несмещенность (равенство математического ожидания оценки оцени-

ваемому параметру); 3) эффективность (наименьшая возможная дисперсия оценки при дан-

ном объеме выборки) или асимптотическая эффективность (наименьшая возможная дисперсия при n ).

Можно показать, что в качестве точечной статистической оценки E математического ожидания E теоретического распределения следует взять вы-

борочное среднее x, т. е. E x. Эта оценка является состоятельной, несме-

щенной, а для нормального закона – также и эффективной.

Если в качестве точечной статистической оценки дисперсии D теорети-

ческого распределения взять выборочную дисперсию

D*X , то можно дока-

*

 

 

n 1

 

 

*

зать, что E DX X1, X2

,..., Xn

 

 

n

 

D D, т. е. оценка DX является сме-

 

 

 

 

 

 

 

щенной оценкой дисперсии D. Чтобы ликвидировать этот недостаток, рас-

сматривают исправленную выборочную дисперсию

 

 

 

 

 

n

 

*

 

 

D

 

 

 

DX ,

(2.12)

 

 

 

 

n 1

 

которая является состоятельной несмещенной, а для нормального закона асимптотически эффективной оценкой дисперсии.

В случае обработки сгруппированного вариационного ряда выборочная дисперсия с учетом поправки Шеппарда (2.11) уже является несмещенной оценкой дисперсии (можно доказать), т. е. в этом случае

20