Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика и статистика конспект лекций.pdf
Скачиваний:
66
Добавлен:
22.03.2016
Размер:
1.94 Mб
Скачать

Лекция 11.

Точечные оценки параметров генеральной совокупности.

Во многих случаях мы располагаем информацией о виде закона распределения случайной величины (нормальный, бернуллиевский, равномерный и т. п.), но не знаем параметров этого распределения, таких как MN, DN. Для определения этих параметров применяется выборочный метод.

Пусть выборка объема n представлена в виде вариационного ряда.

Назовем выборочной средней величину

x =

x1m1 + x2m2 + ... + xk mk

= x

m1

+ x

 

m2

+ ... +

mk

n

n

2 n

n

 

1

 

 

Величина M i= mni называется относительной частотой значения признака

xi. Если значения признака, полученные из выборки не группировать и не представлять в виде вариационного ряда, то для вычисления выборочной средней нужно пользоваться формулой

1n

x= n åi =1 xi .

Естественно считать величину x выборочной оценкой параметра MN. Выборочная оценка параметра, представляющая собой число,

называется точечной оценкой.

Выборочную дисперсию

 

2

k

2

1

n

2

I

 

= å xi - x Mi =

 

å xi - x

 

 

 

 

i =1

 

n i =1

 

можно считать точечной оценкой дисперсии DN генеральной совокупности.

Приведем еще один пример точечной оценки. Пусть каждый объект генеральной совокупности характеризуется двумя количественными признаками x и y. Например деталь может иметь два размера – длину и ширину. Можно в различных районах измерять концентрацию вредных веществ в воздухе и фиксировать количество легочных заболеваний населения в месяц. Можно через равные промежутки времени

57

Лекция 11.

сопоставлять доходность акций данной корпорации с каким-либо индексом, характеризующим среднюю доходность всего рынка акций. В этом случае генеральная совокупность представляет собой двумерную случайную величину N, D. Эта случайная величина принимает значения x, y на множестве объектов генеральной совокупности. Не зная закона совместного распределения случайных величин N и D, мы не можем говорить о наличии или глубине корреляционной связи между ними, однако некоторые выводы можно сделать, используя выборочный метод.

Выборку объема n в этом случае представим в виде таблицы, где i-тый отобранный объект (i= 1,2,...n) представлен парой чисел xi, yi :

x1

x2

...

xn

y1

y2

...

yn

Выборочный коэффициент корреляции рассчитывается по формуле

xy - xy

rxy =

I xI y

Здесь

 

 

1

n

 

 

2

 

1

n

2

 

 

 

 

 

 

 

 

 

 

 

 

å xi - x ,

xy =

 

åxi yi , I x = I x

=

n

n

 

 

=

 

 

 

 

=

 

 

 

 

i 1

 

 

 

 

 

i 1

 

 

 

 

2

 

1

n

 

2

 

 

 

 

 

 

 

 

 

 

 

I y = I y

=

n

å yi - y .

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

i

1

 

 

 

Выборочный коэффициент корреляции можно рассматривать как точечную оценку коэффициента корреляции HND, характеризующего генеральную совокупность.

Выборочные параметры x, sx, rxy или любые другие зависят от того, какие объекты генеральной совокупности попали в выборку и различаются от выборки к выборке. Поэтому они сами являются случайными величинами.

58

Лекция 11.

Пусть выборочный параметр @ рассматривается как выборочная оценка параметра , генеральной совокупности и при этом выполняется равенство

M@ =,.

Такая выборочная оценка называется несмещенной.

Для доказательства несмещённости некоторых точечных оценок будем рассматривать выборку объема n как систему n независимых случайных величин N1, N2,... Nn , каждая из которых имеет тот же закон распределения с теми же параметрами, что и случайная величина N, представляющая генеральную совокупность. При таком подходе

становятся

очевидными

равенства:

Mxi = MNi =MN;

Dxi = DNi =DN для всех k = 1,2,...n.

 

 

Теперь

можно показать,

что выборочная

средняя x есть

несмещенная оценка средней генеральной совокупности или , что то же самое, математического ожидания интересующей нас случайной величины

N :

Mx = M

x1 + x2 + ... + xn

=

1

MN

+ MN

2

+ ... + MN

=

1

nMN = MN .

 

 

 

 

n

 

n

1

 

n

 

n

 

 

 

 

 

 

 

Выведем формулу для дисперсии выборочной средней:

Dx = D

x1 + x2 + ... + xn

=

1

DN + DN

 

+... + DN

n1

=

1

nDN =

DN

.

n

n2

 

n2

n

 

 

1

2

 

 

 

 

Найдем теперь, чему равно математическое ожидание выборочной дисперсии I 2. Сначала преобразуем I 2 следующим образом:

 

2

 

1

n

2

1

n

2

I

 

=

 

å xi - x =

 

å xi - MN + MN - x =

 

n

n

 

 

 

=

 

=

 

 

 

 

 

i 1

 

 

i 1

 

=1 ån xi - MN 2 - 2 xi - MN x - MN + x - MN 2 =

n i=1

59

Лекция 11.

=1 ån xi - MN 2 - x - MN 2

n i=1

Здесь использовано преобразование:

n

 

 

 

n

å2 xi - MN x - MN = 2 x - MN å xi - MN =

i=1

 

 

 

i=1

æ

n

n

ö

2

ç

 

 

÷

= 2 x - MN ç

åxi - åMN ÷

= 2 x - MN nx - nMN = 2n x - MN

è i=1

i=1

ø

 

Теперь, используя полученное выше выражение для величины I 2, найдем ее математическое ожидание.

 

 

 

2

 

 

æ

1

n

 

2

 

 

2

ö

 

 

 

 

 

 

ç

 

 

 

 

 

 

÷

 

 

 

MI

 

= M

 

 

å xi - MN - x - MN

 

=

 

 

 

ç n

÷

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

è

 

i 1

 

 

 

 

 

 

ø

 

 

1

n

 

 

 

 

 

2

 

2

1

 

 

 

=

 

åM xi - MN - M x - MN =

 

nDN - Dx =

 

n

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= DN -

DN

=

n -1

DN .

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

Так как

Ms 2

¹

 

Dx,

выборочная

 

дисперсия не является

несмещенной оценкой дисперсии генеральной совокупности.

Чтобы получить несмещенную оценку дисперсии генеральной

совокупности, нужно умножить выборочную дисперсию на

n

 

. Тогда

n -1

 

 

 

n

 

 

 

 

получится величина

s2

=

I 2 , называемая исправленной выборочной

 

n -1

дисперсией.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

s2 =

å xi - x 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n -1 i=1

 

 

 

60

Лекция 11.

Пусть имеется ряд несмещенных точечных оценок одного и того же параметра генеральной совокупности. Та оценка, которая имеет наименьшую дисперсию называется эффективной.

Полученная из выборки объема n точечная оценка dn параметра , генеральной совокупности называется состоятельной, если она сходится по вероятности к D. Это означает, что для любых положительных чисел A и C найдется такое число nAC , что для всех чисел n, удовлетворяющих неравенству n > nAC выполняется условие P @ n - D < A > 1- C .

x и s2 являются несмещёнными, состоятельными и эффективными оценками величин MN и DN.

61