Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Российский университет дружбы народов

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

шапкин задачи с решениями

.pdf

Скачиваний:

511

Добавлен:

15.04.2015

Размер:

2.34 Mб

Скачать

☆

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 31 32 3334 / 4434 35 36 37 38 39 40 41 42 43 44 > Следующая >>>

Пример 6.34. Пусть генеральная совокупность Х подчинена нормальному закону. Требуется оценить ее параметры.

Так как параметрами нормального распределения являются

σ= σÃ è a = M (X ) = xÃ , òî

σ≈ σ при объеме выборки n ≤ 30,

σ≈ σ Â при объеме выборки n > 30.

6.4.5. Интервальные оценки параметров распределения. Доверительный интервал для математического ожидания нормального распределения

при известном σ

Пусть СВ Х образуют генеральную совокупность и θ — неизвестный параметр СВ Х. Если статистическая оценка θ * является состоятельной, то чем больше объем выборки, тем точнее пол у- чаем значение θ . Однако на практике мы имеем выборки не очень большого объема, поэтому не можем гарантировать большую точность.

Пусть θ * — статистическая оценка для θ . Величина |θ * – θ | называется точностью оценки. Ясно, что точность является СВ, т.к. θ * — случайная величина. Зададим малое положительное число δ и потребуем, чтобы точность оценки |θ * – θ | была меньше δ , ò.å. | θ * – θ | < δ .

Мы не можем категорически утверждать, что оценка θ * удовлетворяет неравенству | θ * – θ | < δ ; можно лишь говорить о вероятности γ , с которой это неравенство выполнится.

Надежностью γ или доверительной вероятностью оценки θ ïî θ * называется вероятность γ , с которой осуществляется неравенство |θ * – θ | < δ , ò.å.

γ = Ð {|θ * – θ | < δ }.

Обычно надежность g задают наперед, причем, за γ берут число, близкое к 1 (0,9; 0,95; 0,99; …).

Так как неравенство |θ * – θ | < δ равносильно двойному неравенству θ * – δ ≤ θ ≤ θ * + δ , то получаем:

γ = Ð {θ * – δ < θ < θ * + δ }.

331

Интервал (θ * – δ , θ * + δ ) называется доверительным интервалом, т.е. доверительный интервал покрывает неизвестный параметр θ с вероятностью γ . Заметим, что концы доверительного интервала являются случайными и изменяются от выборки к в ы- борке, поэтому точнее говорить, что интервал (θ * – δ , θ * + δ ) покрывает неизвестный параметр θ , à íå θ принадлежит этому интервалу.

Пусть генеральная совокупность задана случайной величи ной Х, распределенной по нормальному закону, причем, среднее кв адратическое отклонение σ известно. Неизвестным является математическое ожидание а = М (Х). Требуется найти доверительный интервал для а при заданной надежности γ .

Выборочная средняя

XÂ = X1 + ... + Xn n

является статистической оценкой для xÃ = a.

Теорема. Случайная величина xÂ имеет нормальное распре-

деление, если Х имеет нормальное распределение, и M (

Â ) = a,

σ (XÂ ) = σ , ãäå σ =

D (X ), a = M (X ).

Доверительный интервал для а имеет вид:

Â -δ < a <

Â + δ

P{|

Â - a | < δ } = γ .

Находим δ .

Пользуясь соотношением

P{| XÂ

n ö

- a | < δ } = 2F ç

= 2F ç

Â ø

ãäå Φ(z) — функция Лапласа, имеем:

	æ	δ	n ö		γ
2F	ç	σ	÷	=	γ	.
2F	ç	σ	÷	=		.
	è		ø

332

Обозначив δ

= t,

получим Φ(t) = γ. Òàê êàê γ задана, то по

таблице значений функции Лапласа находим значение t.

Из равенства

t =

n находим δ = tσ

— точность оценки.

Значит, доверительный интервал для а имеет вид:

- t ×

+ t ×

ç X

÷ .

Если задана выборка из генеральной совокупности Х

õi	õ1	õ2	…	õm
ni	n1	n2	…	nm

n = n1 + … + nm, то доверительный интервал будет:

ni × xi

i=1

- t ×

, i=1

+ t ×

÷ ,

n ÷

ò.å.

- t ×

< a < x

+ t ×

ç x

÷ .

n ø

Пример 6.35. Найти доверительный интервал для оценки математического ожидания а нормального распределения с надеж-

ностью 0,95, зная выборочную среднюю XÂ = 10,43, объем выборки n = 100 и среднее квадратическое отклонение σ = 5.

Решение. Воспользуемся формулой

xÂ - t × σ < a < xÂ + t × σ .
n	n

Найдем t. Из соотношения 2Φ(t) = 0,95 получим: Φ(t) = 0,475. По таблице находим t = 1,96. Найдем точность оценки

δ = tσ	= 1,96×5 = 0,98.
n	100

333

Искомый доверительный интервал (10,43 – 0,98 < a < 10,43 + 0,98) или (9,45 < a < 11,41).

Смысл полученного результата таков: если будет произведе - но большое число выборок, то 95% из них определят такие доверительные интервалы, в которых математическое ожидание б у- дет заключено.

6.5. Методы расчета характеристик выборки

Рассмотрим рациональные методы определения характеристик выборки xÂ è dB.

6.5.1. Условные варианты. Метод произведений

Пусть выборка из генеральной совокупности Х является вариационным рядом с равноотстоящими вариантами, т.е.

õi	õ1	õ2	…	õm
ni	n1	n2	…	nm

õ1 < õ2 < … < õm, õi+1 – õi = h = const, n = n1 + n2 + … + nm. Условными называют варианты ui, определяемые равенством

ui =	xi − C	,
	h

где С — ложный нуль. Обычно полагают С равным варианте с наибольшей частотой.

Нетрудно видеть, что условные варианты принимают только целые значения, и, если xi0 = C, òî ui0 = 0.

Условные варианты u1, u2, …, un образуют условную выборку

ui	u1	u2	…	um
ni	n1	n2	…	nm

334

Тогда можно определить условные эмпирические моменты

порядка k:

å ni ×uik

Mk* =

i=1

Определив условные выборочные моменты первого и второго

порядка

å ni ×ui

å ni ×ui2

M* =

i=1

;

M* =

i=1

можно определить выборочные среднюю и дисперсию:

x = M* × h +C;

= [M*

- (M* )2

]× h2 .

Пример 6.36. Даны выборочные варианты xi и соответствую-

щие частоты ni количественного признака Х:

Найти методом произведений выборочные среднюю, дисперсию и среднее квадратическое отклонение.

Решение. Составим расчетную таблицу, для чего:

1)запишем варианты xi в первый столбец;

2)запишем частоты ni во второй столбец;

3)в качестве ложного нуля С выберем варианту 20 (эта варианта имеет наибольшую частоту); в клетке третьего столбца , которая принадлежит строке, содержащей варианту 20, пишем 0; на д нулем последовательно записываем условные варианты –1, –2 , а под нулем — последовательно 1, 2;

4)произведения частот на условные варианты ui записываем в четвертый столбец; находим сумму этих произведений и помещаем ее в нижнюю клетку столбца;

5)произведения частот на квадраты условных вариант запишем в пятый столбец; сумму чисел столбца (80) помещаем в нижнюю клетку столбца;

335

6) произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой (контрольный) столбе ц; сумму чисел столбца (188) помещаем в нижнюю клетку столбца.

В итоге получим следующую расчетную таблицу:

n · u

× u2

(u + 1)2

–2

–12

–1

–16

n = 100

ni ui

= 4

ui2

= 80

ni (ui +1)2 =188

Контроль

ni × ui2

ni ×ui + n = 80 + 2

×4 +100 =188;

(ui +1)2 =188.

Совпадение найденных сумм свидетельствует о том, что вы- числения произведены правильно.

Вычислим условные моменты первого и второго порядков:

M* = å ni ui		=		4	= 0,04;	M* = å ni ui2		=	80	= 0,8.

1	n		100			2	n	100

Найдем шаг (разность между двумя соседними вариантами): h = 15 – 10 = 5.

Найдем искомую выборочную среднюю:

xâ = M1* × h +C = 0,04×5 + 20 = 20,2.

Найдем искомую выборочную дисперсию:

dâ = [M2* - (M1* )2 ]×h = [0,8 - (0,04)2 ]×52 =19,96.

Найдем искомое среднее квадратическое отклонение:

σ â = dâ = 19,96 = 4,47.

336

6.5.2. Эмпирические и теоретические частоты

Пусть значения СВ Х образуют генеральную совокупность. Закон распределения Х неизвестен.

Рассмотрим некоторую выборку объема n из генеральной совокупности

õi	õ1	õ2	…	õm
ni	n1	n2	...	nm

n = n1 + … + nm.

Частоты ni появления вариант xi также называют эмпирическими частотами.

Пусть Х — дискретная СВ и имеются основания предположить, что изучаемая величина Х распределена по некоторому определенному закону. Зная закон распределения Х, мы можем найти вероятности pi появления значений xi, ò.å.

pi = P {X = xi }.

Теоретическими частотами ni называют частоты, определяемые по формуле ni = n · pi.

Нетрудно видеть, что ni указывает, сколько раз должно появиться в среднем значение xi случайной величины Х с предполагаемым законом распределения.

Пусть теперь Х — непрерывная СВ. Рассмотрим более детально определение теоретических частот, предполагая, что Х — нормально распределенная случайная величина.

Пусть

õi	õ1	õ2	…	õm
ni	n1	n2	...	nm

n = n1 + … + nm , равноотстоящая выборка из генеральной сово-

купности Х, n1 , … , nm — эмпирические частоты, хi+1 – xi = h. Тогда теоретические частоты определяются по формуле

ni¢ = n × pi ,

ãäå pi — вероятность попадания Х в i-ый частичный интервал с концами xi - 2h è xi + 2h .

337

Приближенно вероятности pi могут быть найдены по формуле

		p	=	h		×ϕ (u	),
		p	=			×ϕ (u	),
		i				i
			σ Â
ãäå ui =	xi - xÂ	, i = 1, 2,	...,		m, ϕ (u) = 1			×e−	u2	.
	xi - xÂ								2
									2
	σ Â						2π

Значения функции ϕ (u) находятся по таблице.

6.6. Статистическая проверка гипотез

Во многих случаях результаты наблюдений используются дл я проверки предположений (гипотез) относительно либо само го вида распределения генеральной совокупности, либо значе ния параметров уже известного распределения — статистическ их гипотез. Пусть известно распределение СВ Х (например, это нормальный закон), и по выборке необходимо проверить гипотез у о значении некоторого параметра ( xÃ, DÃ èëè σ Ã) этого распределения.

В дальнейшем выдвигаемую и проверяемую гипотезу будем называть нулевой гипотезой (или основной) и обозначать ее че- рез Н0. Наряду с Н0 рассматривают также одну из альтернативных (конкурирующих) гипотез Н1. Например, если проверяется гипотеза о равенстве параметра θ некоторому заданному зна-

чению θ 0, ò.å. Í0: θ = θ 0, то в качестве альтернативной		ãèïî-
тезы можно рассмотреть одну	из следующих: а) Н1: θ	> θ 0;
á) Í1: θ < θ 0; â) Í1: θ ¹ θ 0;	ã) Í1: θ = θ 1, ãäå θ 1 — другое
заданное значение параметра θ .

Выдвинутая гипотеза Н0 может соответствовать истине или нет. При проверке гипотезы Н0 по результатам выборки могут быть допущены ошибки двух родов: 1) ошибка первого рода — отвергнута правильная гипотеза; 2) ошибка второго рода — пр и- нята неправильная гипотеза. Последствия этих ошибок нера внозначны, и роль каждой оценивается до конца по условиям конк - ретной задачи. Например, если при проверке качества парти и деталей по выборке из нее в качестве Н0 принята гипотеза, что доля брака не более 0,1%, то при допущении здесь ошибки первого рода будет забракована годная продукция, а допустив ошибк у второго рода, выпустим потребителю партию деталей с дол ей

338

брака больше допустимого. Перед началом анализа выборки фиксируют очень малое число α. Вероятность совершить ошибку первого рода называется уровнем значимости α. Обычно берут α = 0,05; 0,01; 0,005.

Правило, по которому принимается решение принять или отклонить гипотезу Н0, называется критерием или статистическим критерием K. Выбор K зависит от конкретной задачи.

Обычно критерий проверки гипотезы реализуется с помощью некоторой статистической характеристики, определенной по выборке, т.е. с помощью некоторой статистики θ . Здесь θ — некоторая СВ, закон распределения которой известен.

В множестве всех возможных значений статистики q критерия K выделим подмножество ω 0, при котором гипотеза Н0 отклоняется. Это подмножество называется критической областью. Т о подмножество значений θ, при котором гипотезу Н0 не отклоняют, называется областью принятия гипотезы (допустимой об ластью). Точки, разделяющие эти области, называются критическ и- ми точками. Для определения критических точек используют принцип практической невозможности событий, имеющих малую вероятность. При этом задаются достаточно малой величино йα, называемой уровнем значимости критерия, и определяют кри ти- ческую область как множество тех значений θ , вероятность которых принадлежать к области ω 0 равнялась бы α, ò.å.

P {θ ω 0 } = α.

Если по данным выборки при данном уровне значимости получается, что θ ω 0, то это может служить основанием для отклонения гипотезы Н0.

Рассмотрим проверку гипотезы о нормальном распределени и генеральной совокупности Х. Пусть распределение Х неизвестно, но есть основание предположить, что Х имеет нормальное распределение, т.е. выдвигается нулевая гипотеза Н0 о нормальности СВ Х. Статистический критерий, с помощью которого проверяется нулевая гипотеза, называется критерием согласия. Име ется несколько критериев согласия. Обычно в них используют ста тистики, имеющие таблицы распределений, подготовленные зара нее: статистику с нормальным нормированным распределением, с татистику χ2 и статистику Фишера. Рассмотрим критерий согласия Пирсона (критерий согласия χ2 Пирсона, χ2 — «xи квадрат»).

339

Пусть для Х получена выборка объема n, заданная в виде статистического ряда с равноотстоящими вариантами:

õi	õ1	õ2	…	õm
ni	n1	n2	…	nm

Найдем по данным выборки величины xÂ è σ B. Предполагая, что Х имеет нормальное распределение, вычислим вели-

÷èíû ni¢ :

æ x

i -

−

n¢

ϕ (u)

ϕ ç

Â ÷

2 ,

2π

называемые теоретическими частотами, в противоположнос ть чему ni здесь называют эмпирическими частотами.

В качестве статистики θ выбирают СВ χ 2:

s	(ni - ni¢ )	2
χ 2 = å			.
	ni¢
i=1

Она подчиняется распределению χ 2 с числом степенной свободы ν = s – r – 1, где s — число различных значений хi; r — число параметров, от которых зависит распределение. Для нормального за-

кона таких параметров два: a = xÂ = M(X ) è σ = s = DÂ ×	n	, ò.å.
	n -1
r = 2, è ν = s – 3. Если эмпирическое и теоретическое распределе-

ния совпадают, то χ 2 = 0. По данному уровню значимости a и числу степеней свободы ν в таблице распределения χ 2 находят кри-

тическое значение χ êðèò2 . и определяют критическую область:

χ 2 < χêðèò2	., ω0 ={χ 2 : χ 2 ³ χêðèò2 .}. Затем вычисляют наблюдаемое
значение χ 2, ò.å. χíàáë2 . по формуле
			s	(n		- n¢ )2
	χíàáë.2		å
	χíàáë.2	=	å		i	i .
			i=1			ni¢

Если окажется, что χíàáë2 . < χêðèò2 . то нулевую гипотезу Н0 о том, что X имеет нормальное распределение, принимают. В этом слу- чае опытные данные выборки хорошо согласуются с гипотезо й о нормальном распределении генеральной совокупности.

340

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 31 32 3334 / 4434 35 36 37 38 39 40 41 42 43 44 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.04.201524.08 Кб21ЧИЧЕРИНА Н.docx
#
15.04.2015693.18 Кб83ЧМнервы.pdf
#
21.03.201684.99 Кб37что явл материалом исследования патанатомии.doc
#
27.11.2019107.52 Кб5Шаблон реферата.doc
#
14.04.2015156.32 Кб17Шанхайская организация сотрудничества .docx
#
15.04.20152.34 Mб511шапкин задачи с решениями.pdf
#
30.08.201933.1 Кб3шиза рус.docx
#
30.08.201942.48 Кб1шизофрения(2).docx
#
14.04.2015137.73 Кб79шпаргалки ТГП.doc
#
01.09.201979.37 Кб2шпора бжд.docx
#
01.09.201967.31 Кб7шпора бжд.docx