Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ФЭФ заочн. ТеорВер и МатСтат / Краткий конспект лекций по ТВ и МС

.pdf
Скачиваний:
54
Добавлен:
10.04.2015
Размер:
442.67 Кб
Скачать

Лекция 8 Элементы математической статистики

Пусть исследуется случайная величина с заранее неизвестной функцией распределения

F(x).

Множество всех значений этой случайной величины называется генеральной совокупностью (Г С).

Единичное значение случайной величины называется выборкой объема 1. Совокупность n значений случайной величины образуют выборку объема n. Выборка имеет то же распределение, что и генеральная совокупность. Выборочные значения называются вариантами.

Изучая выборку, делают заключение о вероятностных свойствах Г С.

 

Основные задачи статистики.

1.

Оценка неизвестных параметров распределения:

-

точечные оценки параметров распределения, например оценка математического

 

ожидания, дисперсии, моментов распределения,

-

интервальные оценки доверительные интервалы – интервалы, в которых

 

находятся параметры распределения с доверительной вероятностью.

2.Проверка статистических гипотез – предположений о законе распределения ГС или параметрах распределения.

3.Установление формы и степени связи между несколькими случайными переменными.

Эмпирические законы распределения.

Вариационным рядом называются варианты, расположенные в порядке их возрастания (не убывания, если варианты повторяются).

Будем обозначать xk – различные варианты вариационного ряда (k = 1, 2, …), n k – их

частоты (число повторений варианты), ω

 

=

nk

- относительные частоты.

k

n

 

 

 

 

 

 

 

Существуют различные формы закона распределения: ряд распределения, полигон

частот, полигон относительных частот, эмпирическая функция распределения,

гистограмма (дискретный аналог плотности распределения).

Рассмотрим, например, вариационный ряд 0,0,0,0.0.1,1,3,5,5. Объем выборки n = 10.

Ряд распределения

xk

0

1

3

5

nk

5

2

1

2

ω k

1/2

1/5

1/10

1/5

 

 

 

 

 

Полигон частот

Полигон относительных частот имеет тот же вид, но по оси ординат откладываются не частоты nk, а относительные частоты ω k (на рисунке черточками отмечены единицы по

осям значений и частот). Xk

1 2 3 4 5

Эмпирическая функция распределения - аналог функции распределения для дискретных случайных величин, она тоже кусочно постоянна и имеет тот же график, только

31

скачки функции в точках – вариантах происходят на относительные частоты вариант (в примере скачки от 0 на 0,5, затем на 0,2 до 0,7, затем на 0,1 до 0,8 и, наконец на 0,2 до единицы).

Fn(x) Эмпирическая функция распределения формально определяется как

1

 

 

n(x)

 

 

Fn (x) = ω k

=

, где n(x) - число

 

 

 

xk < x

 

n

0,4

членов выборки, меньших x.

1 2 3 4 5

x

 

 

 

Для построения гистограммы приходится приписывать значение частоты варианты некоторому интервалу стандартной ширины (в нашем случае, например, 0,5), лежащему справа от варианты так, чтобы площадь ступени над интервалом равнялась относительной частоте варианты.

1

0,4

0,2

0 0,5 1 1,5

 

 

 

 

 

 

3 3,5

 

 

 

5 5,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Точечные оценки параметров распределения.

Пусть неизвестен параметр распределения β ,

любая функция β (x1 ,...xn ) » β на

выборке

x1 ,...xn называется точечной оценкой β .

Оценки тоже являются случайными

величинами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Требования к оценкам.

1.

Несмещенность

M (β )= β

 

2.

Состоятельность

 

 

 

 

 

 

 

β n→∞ ¾¾® β

 

 

 

 

 

 

 

 

 

 

 

 

P

 

3.

Эффективность (по сравнению с другими оценками) – если дисперсия оценки

меньше дисперсий других оценок.

 

Можно показать, что несмещенная оценка состоятельна, если ее выборочная дисперсия стремится к нулю при n → ∞ .

Оценки ищут различными методами: методом моментов, методом максимального правдоподобия, методом наименьших квадратов и др.

32

Оценка среднего значения ГС (математического ожидания) – выборочное среднее.

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

=

xk .

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n k =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

nm

 

 

 

 

 

Оценка несмещенная, т.к. M (

 

) =

 

M (xk ) =

= m .

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n k =1

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

P

 

по закону больших чисел.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценка состоятельная, т.к. xn→∞ ¾¾® m

 

 

 

 

Оценки дисперсии ГС:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

2

 

 

 

 

 

 

1. Выборочная дисперсия Dв

=

(xk

-

 

)

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n k =1

 

 

 

 

 

 

Это – смещенная, состоятельная оценка.

2. Несмещенная, состоятельная оценка дисперсии

s 2 =

 

n

 

D

 

n

-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

2

 

 

n - 3

 

4

 

 

 

 

Можно показать, что M (s

 

) = σ

 

,

 

D(s

 

) = μ4

-

 

 

 

σ

.

 

 

 

 

 

 

 

 

n -1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Вычислим оценки для приведенного выше ряда распределения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xk

 

 

 

0

 

 

 

1

 

 

 

3

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nk

 

 

 

5

 

 

 

2

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ω k

 

 

1/2

 

 

 

1/5

 

 

1/10

 

 

1/5

 

 

 

 

 

 

 

 

 

 

1

 

 

3

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

+

 

+

= 1,5 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

10

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s 2 =

1

[5(1,5)2

+ 2(0,5)2 + (1,5)2

+ 2(3,5)2 ]» 4,2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервальные оценки.

 

 

 

 

Доверительный интервал

это интервал (β1 , β 2 ) , такой, что P(β1 < β < β 2 ) = γ ,

где γ

- доверительная вероятность.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общее правило построения доверительного интервала для любого параметра основано

на центральной предельной теореме, по которой

при больших n (n>50) оценка

β имеет

нормальное

 

распределение с

 

M (β ), D(β ), если

β

- несмещенная оценка, а

функция

распределения случайной величины

 

J =

 

β - β

сходится

по вероятности при

n → ∞ к

 

 

 

D(β )

 

функции стандартного нормального распределения.

 

 

 

 

 

 

 

 

 

 

 

Квантиль

 

hp (уровня p

)

случайной величины X с функцией распределения F(x) –

это такое значение

 

hp случайной величины X, что p = F (hp ).

 

 

 

 

33

p(x)

 

 

Обозначим

 

 

z

α квантиль

 

 

 

 

 

 

1−

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нормального

распределения

 

 

 

уровня

1 − α ,

где

 

α = 1 − γ ,

 

 

 

 

2

 

 

 

 

 

 

 

γ = 1 − α

 

 

γ

-

 

 

доверительная

α / 2

 

α. / 2

 

 

 

 

 

 

 

 

 

α

 

 

 

 

 

 

 

 

 

 

 

 

вероятность, т.е. Φ z

α

 

=1− ,

 

 

 

 

 

 

 

 

 

 

 

 

 

2

z1−α

z1−α

 

 

 

 

 

 

 

1−2

 

 

 

x

t2

 

 

 

 

 

 

2

2

x

гдеΦ(x) = e

 

 

2 dt - функция

−∞

стандартного

нормального распределения.

По симметрии

 

плотности

 

 

z

 

 

 

= α . Так как γ = 1 − α = 1

α α

 

 

 

 

 

z

 

распределения Φ

 

 

 

= Φ z

 

 

 

− Φ

α

 

 

1−

α

2

2 2

 

α

 

1−

 

 

2

 

1

2

 

 

2

нормального

.

Так как распределение случайной величины

J =

 

β − β

стремится к стандартному

 

 

 

 

 

 

 

D(β )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нормальному

распределению,

 

то

P

z

 

<

β − β

< z

 

= γ . Отсюда получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1− α

 

 

 

 

1−

α

 

 

 

 

 

 

 

 

 

 

2

 

 

D(β )

 

2

 

доверительный интервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β − z

 

 

< β < β + z

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

α

D(β )

1−

α

D(β )

 

 

 

 

 

 

 

 

 

 

 

1−

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доверительные интервалы для параметров нормального закона распределения.

Доверительный интервал для математического ожидания.

Если ГС имеет нормальное распределение, то и любая выборка распределена нормально. Известно, что сумма нормальных случайных величин тоже распределена

нормально. Поэтому оценка математического ожидания –

выборочное среднее –

нормально

распределенная случайная величина с M (

 

) = m, D(

 

 

) = σ 2

, σ - известно.

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

n

 

 

3) Поэтому,

если

σ известно,

 

то

 

D(

 

)

=

,

и

доверительный интервал для

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

математического ожидания строится так:

 

 

 

 

 

z

 

σ

m

 

+ z

 

σ

 

с

доверительной

вероятностью γ = 1 − α .

Квантили

x

α

x

α

 

 

 

 

 

 

 

 

1−

2

 

n

 

 

1−

2

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

проще всего искать по таблицам квантилей нормального распределения.

 

 

 

 

m

 

4) Если σ неизвестно, то нормированная случайная величина

 

x

(вместо σ

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

подставлена его оценка s) уже не распределена нормально. Она имеет распределение Стъюдента с n-1 степенями свободы. Есть таблицы квантилей распределения Стъюдента. По доверительной вероятности γ определяют α = 1 − γ , по таблице

34

квантилей определяют

квантиль t

α

уровня

1 − α . Затем по той же

схеме строят

 

1−

2

 

2

 

 

 

 

 

 

доверительный

интервал

 

для

математического

ожидания

 

t

 

s

m

 

+ t

 

 

s

 

.

x

α

x

 

α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1−

2

 

n

1−

2

 

n

Если n> 20, то квантиль можно искать по таблицам квантилей нормального распределения.

Доверительный интервал для среднеквадратического отклонения σ .

Пусть

m, σ неизвестны. Можно показать, что тогда случайная величина

s 2

(n − 1)

 

σ 2

 

 

 

имеет χ 2 распределение с (n – 1) степенями свободы. По доверительной вероятности γ

определяют α = 1 − γ , по таблице квантилей

χ 2

распределения с n – 1

степенями свободы

определяют квантили уровней α и 1 -

α : χ α2 , χ 2

α . Имеет место соотношение

 

 

 

 

 

 

 

 

 

 

 

2

2

2

1−

 

 

 

 

 

(n

1)s

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

P χ

2 <

 

 

< χ 2

 

= 1 − α = γ . Строим доверительный

 

 

 

 

 

интервал для

 

 

 

 

 

 

α

σ

2

 

 

1− α

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

среднеквадратического отклонения

 

 

 

 

 

 

(n − 1)s 2

< σ 2 <

(n − 1)s 2

.

 

 

 

 

 

 

 

χ 2

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

χ α2

 

 

 

 

 

 

 

 

 

1−

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Объяснение причин, по которым параметры распределены по Стъюденту или χ 2 , требуют более глубокого рассмотрения материала. Но для догадки можно использовать два известных результата:

-если x1, … xn распределены нормально, то x12 + ... + xn2 имеет распределение χ 2 с n

степенями свободы

-если x распределена нормально, а y по χ 2 с n степенями свободы, то случайная

величина x распределена по Стъюденту. y

35