Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
практ 7.doc
Скачиваний:
11
Добавлен:
13.02.2016
Размер:
748.03 Кб
Скачать

§ 3.2. Оценка параметров генеральной совокупности по ее выборке

Предположим, что генеральная совокупность является нор­мальным распределением (здесь вместо вероятности следует ис­пользовать относительную частоту). Нормальное распределение полностью определено математическим ожиданием (средним зна­чением) и средним квадратическим отклонением. Поэтому если по выборке можно оценить, т. е. приближенно найти, эти парамет­ры, то будет решена одна из задач математической статистики — определение параметров большого массива по исследованию его части.

Как и для выборки, для генеральной совокупности можно оп­ределить генеральную среднюю — среднее арифметическоезначение всех величин, составляющих эту совокупность. Учиты­вая большой объем этой совокупности, можно полагать, что гене­ральная средняя равна математическому ожиданию:

(3.10)

где X — общая запись случайной величины (значения изучаемого признака) генеральной совокупности.

Рассеяние значений изучаемого признака генеральной сово­купности от их генеральной средней оценивают генеральной дис­персией

(3.11)

где N — объем генеральной совокупности, или генеральным сред­ним квадратическим отклонением

(3.12)

Точечная оценка. Предположим, что из генеральной совокуп­ности производятся разные выборки; делают это так, чтобы вся генеральная совокупность сохранялась неизменной. Для опреде­ленности будем считать объемы этих выборок одинаковыми и рав­ными п. Их выборочные средние являются случай­ными величинами, которые распределены по нормальному зако­ну (см. конец § 2.3), а их математическое ожидание равно математическому ожиданию генеральной совокупности, т. е. генеоалъной средней:

(3.13)

На практике иногда при достаточно большой выборке за генераль­ную среднюю приближенно принимают выборочную среднюю.

Для дисперсий положение получается несколько иным. Мате­матическое ожидание дисперсий различных выборок [M(DBi)], со­ставленных из генеральной совокупности, отличается от гене­ральной дисперсии:

(3.14)

При большом п получаем и

DгM(DBi) (3.14а)

Для генерального среднего квадратического отклонения соответ­ственно из (3.14) и (3.14а) получаем:

(3.15)

На практике иногда при достаточно большой выборке выбороч­ное среднее квадратическое отклонение приближенно принимают за генеральное среднее квадратическое отклонение. Так, если счи­тать, что статистическое распределение (см. табл. 5) является вы­боркой из некоторой генеральной совокупности, то на основании (3.6) и (3.9) можно заключить, что для этой генеральной совокуп­ности 3,468 кг и г 0,3896 кг.

Такого рода оценка параметров генеральной совокупности или каких-либо измерений определенными числами называется то­чечной оценкой.

Интервальная оценка генеральной средней. Точечная оцен­ка, особенно при малой выборке, может значительно отличаться от истинных параметров генеральной совокупности. Поэтому при не­большом объеме выборки пользуются интервальными оценками.

В этом случае указывается интервал (доверительный интер­вал, или доверительные границы), в котором с определенной (до­верительной) вероятностью р находится генеральная средняя.

Иначе говоря, р определяет вероятность, с которой осуществ­ляются следующие неравенства:

(3.16)

где положительное число характеризует точность оценки.

Кроме доверительной вероятности используют «противопо­ложное» понятие — уровень значимости

= 1 – р, (3.17)

который выражает вероятность непопадания генеральной сред­ней в доверительный интервал.

Доверительную вероятность не следует выбирать слишком ма­ленькой (не следует ее обесценивать). Наиболее часто р прини­мают равной 0,95; 0,99; 0,999. Чем больше р, тем шире интервал, т. е. тем больше . Чтобы установить количественную связь между этими величинами, необходимо найти выражение для довери­тельной вероятности. Это можно сделать, используя (2.17), одна­ко нужно понять, что при этом следует взять за функцию распределения вероятностей и какие принять пределы ин­тегрирования. Рассмотрим этот вопрос.

Итак, генеральная совокупность распределена по нормальному закону с математическим ожиданием (средним значением) идисперсией Dг. Если из этой генеральной совокупности брать раз­ные выборки с одинаковым объемом п, то можно для каждой вы­борки получить среднее значение. Эти средние значения самиявляются случайными величинами. Их распределение, т. е. рас­пределение средних значений разных выборок, полученных из одной генеральной совокупности, будет нормальным со средним значением, равным среднему значению генеральной совокупности , дисперсией и средним квадратическим отклонением (см. конец § 2.2).

Таким образом, уже выступает как случайная величина, для нее можно записать следующую функцию распределения вероят­ностей [см. (2.22)]:

(3.18)

Из (3.16) можно записать для следующие неравенства:

(3.19)

Вероятность того, что попадает в этот интервал (доверитель­ную вероятность), можно найти по общей формуле (2.17), используя функцию (3.18). Пределы интегрирования необходимо взять из выражения (3.19):

(3.20)

(3.21)

Результаты интегрирования (3.20) найдем, используя функ­цию Ф (см. § 2.3). По формуле (2.25) получим

Обозначая

(3.22)

и учитывая, что Ф(-) = 1 - Ф(), получим из (3.21):

р = Ф() - Ф(-) = Ф() - 1 + Ф() = () - 1.

Для нахождения рпо или пор можно воспользоваться табл. 7или таблицей функции Ф (см. [2]).

Таблица 7

т

00

01

02

03

04

05

06

07

08

09

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,5239

0,5279

0,5319

0,5359

0,4

6554

6591

6628

6664

6700

6736

6772

6808

6844

6879

0,9

8159

8186

8212

8238

8264

8389

8315

8340

8365

8389

1,4

9192

9207

9222

9236

9251

9265

9279

9292

9306

9319

1,9

9713

9719

9726

9732

9738

9744

9750

9756

9761

9767

Хотя неравенства (3.16) и (3.19) по существу идентичны, но для практических целей важнее запись (3.16), так как она позво­ляет решить главную задачу — при заданной доверительной веро­ятности и найденной выборочной средней найти доверительный интервал, в который попадает генеральная средняя.

Запишем неравенство (3.16), подставив в него выражение из формулы (3.22):

Практически при нахождении доверительного интервала по формуле (3.24) берут выборочную среднюю некоторой конкретной выборки (объем п  30), а вместо генеральной средней квадратично» используют выборочную среднюю квадратичную этой же выборки.

Поясним это некоторым примером. Вновь обратимся к данным табл. 5, считая их выборкой. Найдем доверительный интервал для генеральной средней, из которой эта выборка получена, счи­тая доверительную вероятность равной р = 0,95. Из (3.23) для такой доверительной вероятности получаем: Ф() = 0,975 имеем = 1,9 + 0,06 = 1,96. Подставляя это значение , выборочную среднюю (3.6), выборочное среднее квадратическое отклонение (3.9) и объем вы­борки (п = 100) в выражение (3.24), имеем:

или

Интервальная оценка генеральной средней при малой вы­борке.

При достаточно большом объеме выборки можно сделать вполне надежные заключения о генеральной средней. Однако на практике часто имеют дело с выборками небольшого объема (п < 30). В этом случае в выражении доверительного интервала (3.16) точ­ность оценки определяется по следующей формуле:

(3.26)

где t — параметр, называемый коэффициентом Стьюдента (его на­ходят из распределения Стьюдента; оно здесь не рассматривает­ся), который зависит не только от доверительной вероятности р, но и от объема выборки п. Коэффициент Стьюдента можно найти из табл. 8.

Запишем неравенство (3.16), подставив в него выражение из формулы (3.26):

(3.27)

Таблица 8

Объем

Доверительная вероятность, р

выборки, п

0,9

0,95

0,99

0,999

2

6,31

12,70

63,66

-

3

2,92

4,30

9,93

31,60

10

1,83

2,26

3,25

4,78

15

1,76

2,15

2,95

4,07

Таблица 9

Масса, кг

3,0

3,1

3,2

3,3

3,4

3,5

3,7

3,8

4,0

4,4

Частота

1

1

1

1

1

1

1

1

1

1

Отсюда можно вычислить Db = 0,19156 кг2 и в = = 0,43767 кг. Задав доверительную вероятность р = 0,95, находим из табл. 8 для объема выборки п = 10 параметр t = 2,26. Подставляя эти данные в (3.26), получаем для доверительного интервала [см. (3.27)]:

или(3.28)

Полезно сопоставить соотношения, полученные для большой (3.25) и малой (3.28) выборок.

Интервальная оценка истинного значения измеряемой ве­личины. Интервальная оценка генеральной средней может быть ис­пользована для оценки истинного значения измеряемой величины.

Пусть несколько раз измеряют одну и ту же физическую вели­чину. При этом по разным случайным причинам, вообще говоря, получают разные значения: x1, x2, x3, ... . Будем считать, что нет преобладающего влияния какого-либо фактора на эти измерения.

Истинное значение измеряемой величины (хист) совершенно точ­но измерить невозможно хотя бы по причине несовершенства изме­рительных приборов. Однако можно дать интервальную оценку для этого значения.

Если значения х1, х2, х3, ... рассматривать как варианты выбор­ки, а истинное значение измеряемой величины хист как аналог ге­неральной средней, то можно по описанным выше правилам найти доверительный интервал, в который с доверительной вероятно­стью р попадает истинное значение измеряемой величины. Приме­нительно к малому числу измерений (п < 30) из (3.27) получим:

(3.29)

где — среднее арифметическое значение из полученных измере­ний, а — соответствующее им среднее квадратическое отклоне­ние, t —коэффициент Стьюдента.

Более подробно и разносторонне оценка результатов измере­ний рассматривается в практикуме (см. [1]).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]