Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Экзамен 2021 / Панков Пособие по ТВиМС часть 2

.pdf
Скачиваний:
35
Добавлен:
28.01.2022
Размер:
730.29 Кб
Скачать

МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РОССИЙСКОЙ ФЕДЕРАЦИИ

Ордена Трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования

Московский технический университет связи и информатики

К.Н. Панков

ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

ЧАСТЬ 2

Учебное пособие

для обучающихся в бакалавриате по направлению 11.03.02 - Инфокоммуникационные технологии и системы связи

Москва 2021

Панков К.Н. Теория вероятностей и математическая статистика. Ч.2. Учебное пособие / МТУСИ. – М., 2021. - 58 с.

В данном учебном пособии рассматриваются основные понятия математической статистики; выборка и эмпирическое распределение, оценка параметров распределений, точечные и интервальные оценки параметров распределений, оценка законов распределений вероятностей случайных чисел, проверка гипотез о значениях параметров распределений. Теоретический материал изложен с многочисленными примерами.

Для подготовки бакалавров, обучающихся по направлению 270800 «Строительство».Учебное пособие ориентировано на обучающихся в бакалавриате по направлению подготовки 11.03.02 - Инфокоммуникационные технологии и системы связи.

Ил. __, табл. __, список лит.__ назв.

Издание утверждено Методическим советом университета в качестве учебного пособия. Протокол No __от __.__.____г.

Рецензенты:

© Московский технический университет связи и информатики, 2021

2

,A,P .
,A,P .

Раздел № 2 Математическая статистика

Тема № 11 Основные понятия

Математическая статистика – это прикладная математическая дисциплина, родственная теории вероятностей. Она базируется на понятиях и методах теории вероятностей, но решает свои специфические задачи своими методами.

Математическая модель случайных явлений, изучаемых в теории вероятностей, основывается на понятии вероятностного пространства

При этом в каждой конкретной ситуации функция вероятностей P , заданная на сигма-алгебре A, считается полностью определенной, и основной задачей теории вероятностей является разработка методов нахождения вероятностей различных сложных событий (исходя из известных вероятностей более простых событий) для данной вероятностной модели.

Однако на практике при изучении конкретного эксперимента вероятность P редко известна полностью. Часто можно изначально утверждать лишь то, что P является элементом некоторого заданного класса функций вероятностей P (пэ готическое). Этот класс P может включать в себя все функции вероятностей, которые можно задать на A (т. е. ситуация полной неопределенности). В других же случаях P представляет собой некоторое более узкое семейство вероятностей, заданное в той или иной явной форме. В любом случае P - это совокупность допустимых в данной ситуации (для описания данного эксперимента) функций вероятностей P . Если задан класс P, то говорят, что имеется вероятностно – статистическая (или просто статистическая)

модель, понимая под этим набор Пример. Пусть в качестве эксперимента мы рассматриваем схему Бернулли с

вероятностью успеха p , а исход эксперимента в нем – 0,1 n ,

 

1,..., n , i 0,1 ,

A P

- множество всех подмножеств ,

 

 

 

n

 

n

i

n i

p pi 1

 

q i 1 .

Пусть теперь вероятность успеха неизвестна. Обозначив её через , мы

можем только сказать, что

0,1

. Поэтому здесь семейство допустимых

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вероятностей имеет вид

 

 

 

 

 

 

 

P P , ,

 

 

 

 

 

n

 

 

n

 

 

 

 

i

 

 

 

 

 

 

 

n

 

 

где P

задается вероятностями P

i 1

1

 

i

.

 

i 1

Исходя из статистической модели, выделяют следующие основные задачи математической статистики, которые часто встречаются на практике.

1. Определение неизвестных параметров распределения.

3

Часто теоретические соображения позволяют сделать вывод о типе функции распределения интересующей нас случайной величины: в примере – это случайная величина, равная числу успехов в исходе, т. е. бернуллиевская с неизвестной вероятностью успеха , с функцией распределения F x , лежащей

в некотором классе F (эф готическое):

F x F.

Если функция распределения из класса F задана с точностью до значений некоторого параметра , то такая статистическая модель называется

параметрической:

FF x F x, , .

2.Определение неизвестной функции распределения.

Если неизвестен тип наблюдаемой случайной величины, то говорят уже о непараметрической статистической модели.

3. Задача проверки правдоподобия гипотез (т. е. предположения о виде функции распределения) по опытным данным.

В этом случае мы пытаемся ответить на вопрос, совместимы ли наблюдаемые значения с гипотезой о том, что случайная величина имеет распределение F x .

Итак, статистическая модель описывает такие ситуации, когда в вероятностной модели изучаемого эксперимента имеется та или иная неопределенность в задании вероятности P , и задача математической статистики состоит в том, чтобы уменьшить эту неопределенность, используя информацию, доставленную наблюдаемыми исходами эксперимента (т. е. статистическими данными).

В большинстве случаев исходные статистические данные – это результат наблюдения некоторой конечной совокупности случайных величин 1,..., n ,

характеризующей исход изучаемого эксперимента.

 

Определение. Выборкой из распределения F x объема n

называется

наблюдение над n – мерным случайным вектором

 

1,..., n ,

координаты

 

которого являются независимыми, одинаково распределенными случайными величинами с функциями распределения F x P i x , i 1,n .

Будем обозначать выборку следующим образом:

x1,...,xn .

Множество всех значений или наблюдений над x1,...,xn мы будем называть

выборочным пространством.

Под наблюдением мы будем понимать значение вектора 1 ,..., n при

некотором элементарном событии .

На практике часто вектор x1,...,xn является вектором n-кратного наблюдения одной и той же случайной величины.

4

Прежде чем переходить к детальному анализу наблюдаемых статистических данных, обычно производят их предварительную обработку. Иногда результаты такой обработки уже сами по себе дают наглядную картину исследуемого явления. В большинстве же случаев они служат исходным материалом для получения более подробных статистических выводов.

Определение. Если элементы выборки упорядочить в порядке неубывания, то полученный вектор называется вариационным рядом и обозначается

x 1 ,x 2 ,...x n ,

где x 1 x 2 .. x n .

Элементы вариационного ряда называют порядковыми статистиками с соответствующим номером.

К примеру, x 1 min x1,...,xn .

Определение. Пусть

x . Через

n x

 

 

обозначим

число элементов

выборки, строго меньших чем x :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n x

xi

x1,...,xn : xi x,i 1,n

Ind xi

x .

Функция

 

n x

 

 

 

i 1

 

 

 

 

 

 

 

 

 

Fn x

,

x

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

называется эмпирической функцией распределения.

По определению, функция распределения F x

x , а эмпирическая функция распределения частота события x .

- это вероятность того, что

Fn x - это относительная

Теорема (Гливенко

 

без

доказательства).

Пусть F x

функция

распределения

случайной

 

величины , и

Fn x -

её эмпирическая

функция

распределения.

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда P

x

n

x

 

F

 

x

 

n

 

1.

 

 

 

sup

F

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Пусть некоторый эксперимент проводится 5 раз. В результате мы получаем выборку:

x1,...,x5 3,1,2,1,0 .

Вариационный ряд этой выборки: x 1 ,x 2 ,...x 5 3,0,1,1,2 , а график эмпирической функции распределения будет выглядеть следующим образом:

5

Определение. Вся прямая разбивается на равные промежутки

длиной h .

Обозначим через k число элементов выборки, попавших в к –

й интервал

разбиения. Над каждым интервалом построим прямоугольник высотой

k

.

 

 

 

n h

Полученная фигура называется гистограммой.

Пример. В условиях предыдущего примера построим гистограмму. Выберем в качестве начала промежутка точку 0,5, а в качестве длины h 1.

Заметим, что в качестве начала промежутка можно выбрать любую точку вещественной прямой, но на практике ее стараются выбрать так, чтобы ни одна точка выборки не попала на границу промежутков.

По теореме Бернулли с ростом n площадь каждого из прямоугольников гистограммы, построенного над k-м интервалом, сходится к вероятности попасть в этот интервал (проверьте это самостоятельно).

Определение. Если построена гистограмма, то полигоном частот будет называться ломаная, состоящая из отрезков прямых, последовательно соединяющих ординаты, соответствующие средним точкам интервалов:

Полигон частот и гистограмма, исходя из определений, взаимно-однозначно определяют друг друга.

С помощью построения вариационного ряда, эмпирической функции распределения, гистограммы и (или) полигона частот проводится первичная статистическая обработка результатов эксперимента.

Введем новое определение.

6

Определение. Статистикой называется всякая функция f от выборкиx1,...,xn , в случае если f 1,..., n является случайной величиной.

Итак, у нас имеется случайная величина с теоретической функцией распределения F x . Мы измеряем n раз и получаем выборку объёма n

x1,...,xn c эмпирической функцией распределения Fn x . По этой выборке мы

можем построить новые характеристики (аналогичные уже полученным для случайной величины) .

Определение. Статистика

 

 

 

 

1

 

n

Mk

 

 

xik

 

n

называется начальным выборочным

 

 

 

i 1

моментом k-го порядка. Если k=1, то

 

1

 

n

 

начальный выборочный момент М1

xi называется выборочным средним

 

n

 

 

 

i 1

(так как является средним арифметическим элементов выборки) и обозначается

М1 x .

Статистика

 

 

1

n

 

 

Sk

 

xi x k

n

 

 

i 1

называется выборочным центральным моментом k – го порядка. При k 2

 

 

 

 

1

n

 

 

 

 

центральный выборочный момент

S2

xk x 2

называется

выборочной

 

дисперсией и обозначается

 

n k 1

 

 

 

S2 .

 

 

 

 

S2

 

 

Обозначим через

E k k-й начальный (теоретический) момент случайной

k

 

 

 

 

 

 

 

 

 

величины , а через k

E E k

- k-й центральный (теоретический) момент.

Все выборочные

характеристики

являются случайными

величинами,

поэтому мы имеем право говорить об их распределении и считать их моменты:

 

 

1

 

n

 

 

1

 

n

 

 

 

 

 

 

 

 

1

 

 

 

 

E k

E

xik

 

 

Exik

 

n E k k ,

n

n

n

 

 

i 1

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D k

D

 

xi

 

 

 

2 Dxi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

i 1

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

E 2k

E k

2

 

2k

k

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Если k=1 и M1 x , то

Ex E 1 и Dx 2 1 2 / n D / n .

Найдите самостоятельно ES2, DS2 .

Теорема. Для случая выборки из любой случайной величины выполняется

M P .

k n k

7

 

 

 

1

n

 

 

 

 

Доказательство.

Mk

 

xik - среднее арифметическое независимых,

n

 

 

 

i 1

 

 

 

 

одинаково распределенных случайных величин xk

по всем i

 

, и E хk .

1,n

 

 

 

 

i

 

 

i

k

Следовательно, эти величины подчиняются закону больших чисел по теореме Хинчина.

Так как

1

k

xk

P 0

, то

P .

 

 

i 1

 

n

i

k

n

k

n

k

Теорема доказана. Теорема (без доказательства). Для случая выборки из любой случайной

величины выполняется

S P .

k n k

Определение. Последовательность случайных величин n называется асимптотически нормальной с параметрами n, n2 , если последовательность

n n /

 

сходится по распределению к стандартной нормальной

n2

случайной величине.

Теорема. Для случая выборки из любой случайной величины, для которой

0 2k k 2 , последовательность начальных выборочных моментов k

 

 

 

2

 

асимптотически нормальна с параметрами

 

 

2k k

 

 

,

 

 

 

k

n

.

 

 

 

 

 

 

 

 

 

Доказательство. Согласно определению, k -ые степени элементов выборки xik - независимые одинаково распределенные случайные величины, числовые

характеристики которых равны соответственно

Еxik k ; Dxik 2k k 2 .

К последовательности xik можно применить центральную предельную теорему для независимых одинаково распределенных случайных величин.

Обозначим n kn 1 xik ; тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n E n

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

D n

 

 

0,1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n E n

 

 

n E n /n

 

 

k

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D n

 

 

1/n D n

n 2k k2

 

 

 

 

 

 

 

 

 

 

/n2

 

 

 

 

 

 

 

k k

 

 

D

0,1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2k k2

/n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где 0,1 - стандартная нормальная случайная величина.

Теорема доказана.

8

Тема № 12 Точечное оценивание параметров распределения

Пусть мы наблюдаем случайную величину с функцией распределения F x, 1,..., m , зависящей от одного или нескольких параметров 1,..., m . Пусть вид функции распределения F x известен, а параметры 1,..., m неизвестны.

Наша задача состоит в том, чтобы по наблюдениям за случайной величиной

построить оценки неизвестных параметров

1 1 x1,...,xn ;2 2 x1,...,xn ;

m m x1,...,xn .

Любую статистику g x1,...,xn , зависящую только от выборки, можно считать

оценкой параметра , или точечной оценкой. Но возникает вопрос, насколько хороша или плоха данная оценка.

 

 

 

x1,...,xn называется несмещенной, если

 

Определение. Оценка

E ;

 

 

 

 

 

и асимптотически несмещенной, если E x1,...,xn .

 

 

 

 

n

 

 

 

 

 

 

Разность E b называется смещением оценки.

 

Пример. В случае выборки из произвольной случайной величины, согласно доказанному ранее результату, E k k . Следовательно, статистика Mk -

несмещенная оценка для k . В частности, х - несмещенная оценка для математического ожидания .

Пусть 1, 2 , тогда х - несмещенная оценка для параметра 1 .

 

 

S

2

n 1 D ,

следовательно, S

2

- смещенная оценка для

. Смещение её

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

2

 

равно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b S2

 

1

D .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2*

 

 

 

xi

x 2

- несмещенная оценка для D .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1 i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2

- асимптотически несмещенная оценка для 2 .

 

 

 

 

 

 

Определение.

 

 

Оценка

 

 

называется

 

состоятельной,

если

 

 

 

 

 

 

 

 

x

,...,x

n

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Согласно двум теоремам из предыдущей темы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P , S

k

P

k

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

n

 

k

n

 

 

 

Следовательно, эти выборочные моменты – состоятельные оценки для соответствующих теоретических.

9

Исторически первым общим методом получения оценок неизвестных параметров распределения является предложенный К. Пирсоном в 1894 году метод моментов, состоящий в приравнивании эмпирических начальных моментов теоретическим и составлении системы из m уравнений (по числу параметров):

 

 

1 1,..., m

 

 

1

 

 

 

 

 

 

 

 

 

.

 

...

 

 

 

 

 

 

 

m 1,..., m

 

m

 

 

 

 

 

 

 

 

 

Решением этой системы является набор оценок 1,..., m , называемых

оценками, полученными с помощью метода моментов.

Пример. Пусть выборка производится из нормально распределенной случайной величины с двумя неизвестными параметрами, т. е. 1, 2 .

1 1 ,

D 2 2 2 1 2 2 ,

2 2 12 .

Согласно методу моментов, получаем систему из двух уравнений

 

 

 

 

 

1

 

 

1

 

,

 

2 1

2

 

 

 

2

 

 

 

 

 

 

где 1 x , 2 S22 x 2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

2 ,

 

 

 

 

 

 

2

2

x

 

 

 

2 1

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

1

.

 

 

 

 

 

 

 

 

2

 

 

 

 

S

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Мы видим, что в этом случае оценки, полученные методом моментов, будут состоятельными.

Еще одним универсальным методом оценивания неизвестных параметров является метод максимального правдоподобия, предложенный в 1921 году Р.Фишером.

Сначала дадим определение функции правдоподобия, которая обозначается

как L x1,...,xn,

 

и является

функцией

выборки

x1,...,xn и неизвестных

 

параметров

 

1,..., m , от

которых

зависит

теоретическая функция

 

распределения F x F x, 1,..., m F x,

 

.

 

 

 

 

 

Определение. Если F x, - функция распределения дискретной случайной величины, то функция правдоподобия L x1,...,xn, определяется как

10