Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Харьковский национальный экономический университет им. С. Кузнеца

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ТВиМС.Малярец.Егоршин 22.12.12

.pdf

Скачиваний:

Добавлен:

11.06.2015

Размер:

6.76 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3113 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Совокупности предполагаются независимыми с примерно одинаковой изменчивостью, иными словами, считается, что совокупности могут различаться только центрами (математическими ожиданиями а1 , а2).

Последнее предположение о равенстве дисперсий совокупностей можно проверить по критерию Фишера, который будет рассмотрен позже.

Для малых выборок оценки дисперсий могут оказаться малонадежными, поэтому вычисляем объединенную дисперсию:

ˆ02	SS1	SS2	.

	n1	n2 2

Число степеней свободы для объединенной дисперсии равно (n1 + n2 – 2), так как на отклонения xi xk наложено 2 связи – сумма первых n1 отклонений равна нулю и сумма следующих n2 отклонений также равна нулю (центральное свойство средних).

Согласно центральной предельной теореме, выборочные средние распределены асимптотически нормально:

		0
xk	~ N ak ;	0				.

				nk
				nk
Разность выборочных средних	x1	x2			также распределена нормально
c характеристиками M( ) = a1 – a2 , D	2		1				1		, так как дисперсия суммы
c характеристиками M( ) = a1 – a2 , D	0		n				n		, так как дисперсия суммы
		1						2

(и разности) независимых случайных величин равна сумме дисперсий. В таком случае статистика

SS1

SS2

n2 2

имеет t -распределение Стьюдента с числом степеней свободы df = (n1 + n2 – 2). Нуль-гипотеза заключается в предположении а1 = а2 .

Если окажется, что

t0,05 n1 n2 2 , нуль-

n s 2

s 2

n1n2

гипотеза не может быть отвергнута и с уровнем доверия Р = 0,95 принимаем гипотезу о равенстве центров совокупностей. Нуль-гипотеза отвергается при

| t | t0,01 . Остальные значения t0,05 < t < t0,01 попадают в область неопределенности критерия.

Для примера сравним средние 4-х выборок, характеристики которых приведены в таблице на рис. 12.4.

121

Выборки	Объемы,	Средние,	Несмещенные	Суммы
Выборки	nk	xk	оценки, σˆ k2	квадратов
1	103	32,368	31,004	3162,4
2	3	27,367	67,704	135,4
3	30	22,243	24,566	712,4
4	17	19,247	8,253	132,0

Рис. 12.4. Характеристики 4-х выборок
Для анализа m групп понадобится сравнить Cm2	m m 1	пар; в данном

2
случае получается 6 пар (рис. 12.5).

Группы	ni	nj	dfij		σˆ 2	t	t0,05	t0,01
i – j	ni	nj	dfij	ij	σˆ 2	t	t0,05	t0,01
i – j
1 – 2	103	3	104	5,001	9,537	1,62	1,98	2,62
1 – 3	103	30	131	10,125	1,197	9,26	1,98	2,61
1 – 4	103	17	118	13,121	1,905	9,51	1,98	2,62
2 – 3	3	30	31	5,123	10,193	1,60	2,04	2,74
2 – 4	3	17	18	8,120	10,902	2,46	2,10	2,88
3 – 4	30	17	45	2,996	2,562	1,87	2,01	2,69

Рис. 12.5. Сравнение 6-ти пар выборок

В таблице на рис. 12.5 вычислены ЧСС (dfij ), разности ij xi x j , не-

смещенные оценки дисперсий этих разностей ˆ 2 , статистики Стьюдента tи

табличные значения t0,05(df), t0,01(df). Значимые разности, для которых t > t0,05 , выделены в таблице, откуда видно, что 1-я группа значимо отличается от 3-й и 4-й, 2-я группа значимо отличается от 4-й. Этим выводам явно не хватает наглядности. Трудно представить себе общую картину, особенно при сравнении большого количества групп (например, для 10 групп будет уже 45 сравнений).

Более наглядным является графическое сравнение интервальных оценок центров подсовокупностей (выборок), для чего на рис. 12.6 для каждой группы

вычислены

границы

95-процентных

доверительных

интервалов

HCP

где

HCP t

ˆi

– так называемая наимень-

0,05 i

шая существенная разность; аi – центр подсовокупности.

122

Группы	ni	Средние	HCPi	Нижние	Верхние
1	103	32,368	1,012	31,356	33,380
2	3	27,367	5,928	21,4389	33,295
3	30	22,243	1,875	20,369	24,118
4	17	19,247	2,490	16,757	21,738

Рис. 12.6. Интервальные оценки центров каждой выборки

В таблице на рис. 12.6 определены
нижние и верхние границы довери-
тельных интервалов. На рис. 12.7
эти интервалы изображены графи-
чески в одном масштабе. Картина
во многом прояснилась. Группа 2
содержала всего 3 наблюдения, и
доверительный интервал для оценки
центра этой подсовокупности полу-
чился очень широким – он пере-	Рис. 12.7. Доверительные интервалы
крывает доверительные интервалы	для каждой группы
для групп 1 и 3. Чем больше наблю-

дений в группе, тем уже доверительный интервал, и тем более определенные заключения можно сделать. По данному обследованию можно заключить, что группа 1 значимо отличается от групп 3 и 4. Что касается групп 3 и 4, то для них нуль-гипотеза об отсутствии значимых различий не может быть отвергнута

– их доверительные интервалы перекрываются (однако здесь для сравнения 2-й и 4-й групп потребуется дополнительное исследование, так как для этих групп нарушается предпосылка о равенстве дисперсий).

В данном примере ясность графического анализа была обусловлена малым количеством сравниваемых групп и тем, что эти группы были расположе-

ны регулярно в порядке убывания результативного признака.
Академик Доспехов Б. А. предло-
Академик Доспехов Б. А. предло-	Группы	ni	Средние	Однородные
жил еще более наглядное представление	Группы	ni	Средние	группы
				группы
	4	17	19,247
результатов анализа (рис. 12.8). Группы	4	17	19,247

	3	30	22,243
должны быть отсортированы в порядке	3	30	22,243

	2	3	27,367
возрастания (или убывания) результатив-	2	3	27,367

	1	103	32,368
ного признака (средних по группам). Да-	1	103	32,368

	Рис. 12.8. Символьная диаграмма
лее строится символьная диаграмма (это	Рис. 12.8. Символьная диаграмма
лее строится символьная диаграмма (это

проще, чем рисунок) из нескольких рядов звездочек. Если между некоторыми

123

группами нет значимых различий, они помечаются звездочками в одном вертикальном ряду (однородные группы).

Сравнение двух дисперсий

Английский статистик Р. Фишер изучил распределение отношения несмещенных оценок дисперсии для двух выборок, взятых из одной и той же

	ˆ 2	SS	df	2	, где в числителе
нормально распределенной совокупности: F	1	1		2
нормально распределенной совокупности: F	ˆ 22	SS2	df1
	ˆ 22	SS2	df1

стоит большая из двух оценок дисперсий, а в знаменателе –меньшая оценка. Распределение Фишера зависит только от чисел степеней свободы числителя и знаменателя F(df1 , df2). Внешне график дифференциальной функции распределения Фишера похож на аналогичный график распределения Пирсона. Составлены таблицы с двумя входами (df1 , df2) для определения критических значений F0,05 и F0,01 (определяются границы только для правостороннего критерия).

Если вычисленное значение F не превосходит табличного значения ниж-

ней границы F F0,05 , нуль-гипотеза о равенстве дисперсий	2	2	не может
	1	2

быть отвергнута. Нуль-гипотеза отвергается, если вычисленное значение F превосходит табличное значение для верхней границы F > F0,01 . Остальные значения F попадают в область неопределенности критерия.

Для предыдущего примера (4 группы) сравним все 6 пар дисперсий. В таблице на рис. 12.9 для каждой пары выборок выписаны их объемы (ni ) и несмещенные оценки дисперсий ( ˆi2 ). Вычислены отношения F большей оценки к меньшей и по таблицам для заданной пары чисел степеней свободы числителя

и знаменателя найдены критические значения F0,05						и F0,01 .

	Группы	ni	nj	ˆ 2	σˆ 2	F	F0,05	F0,01
	i – j	ni	nj	σi	j	F	F0,05	F0,01
	i – j
	1 – 2	103	3	31,004	67,704	2,184	3,09	4,82
	1 – 3	103	30	31,004	24,566	1,262	1,71	2,15
	1 – 4	103	17	31,004	8,253	3,757	2,07	2,86
	2 – 3	3	30	67,704	24,566	2,756	3,33	5,42
	2 – 4	3	17	67,704	8,253	8,204	3,63	6,23
	3 – 4	30	17	24,566	8,253	2,977	2,20	3,10

Рис. 12.9. Сравнение дисперсий каждой пары выборок

124

Значимые дисперсионные отношения, для которых F > F0,01 , выделены в таблице, откуда видно, что изменчивость данных в 4-й группе значимо отличается от изменчивости в других группах.

При сравнении 3-й и 4-й групп дисперсионное отношение F = 2,977 попало в область неопределенности критерия Фишера.

Если при оценке значимости разности средних по критерию Стьюдента оказалось, что нельзя пользоваться объединенной оценкой дисперсии, диспер-

сию разности	x1 x2 вычисляют по другой формуле:
	ˆ	2 ˆ12		ˆ 22		.
			n	n	2

		1

Однако при этом возникают проблемы определения соответствующего числа степеней свободы df . Согласно методике Уэлча, ЧСС надо определять так:

ˆ12

ˆ 22

ˆ14

ˆ 24

n 1

Например, для спорного случая при сравнении 3-й и 4-й групп имеем:

x3	x4	22,243				19,247 2,996 ;
ˆ 2	ˆ 2		ˆ 2	24,566		8,253				;
	1		2						1,304
	n1		n2		30		17		1,304
	n1		n2		30		17
df				1,3042				44,9 .
df		24,566 2			8,253 2			44,9 .
		24,566 2			8,253 2
		30 2		29	17 2 16

Все равно получилось то же самое значение ЧСС: df = (n3 + n4 – 2) = 45;

t		2,996	2,62	;
	ˆ
		1,304

t0,05(44) = 2,01; t0,01(44) = 2,69.

Вычисленное t попало в область неопределенности критерия.

Ранее (при объединении дисперсий) был сделан вывод об отсутствии значимых различий между выборками 3 и 4.

125

Вывод дифференциальной функции распределения Стьюдента

Рассмотрим	распределение	статистики	Стьюдента	t	z	,


					V k

где z и V – независимые случайные величины, z распределено по стандартному

нормальному закону

f z

exp

, а

V –

по закону Пирсона (

V C

exp

V 2

с числом степеней свободы k.

Вследствие независимости z и V плотность вероятности их совместного

z 2

распределения равна произведению f

z f

C exp

V 2

Интегральная функция распределения Стьюдента выражается через

двойной интеграл:

z 2

F x

C exp

V 2

dzdV ,

где

область интегрирования

определена

неравенствами

Преобразуем этот интеграл:

z 2

dz .

F x

exp

V 2

exp

Для определения плотности вероятности f(x) дифференцируем полученное выражение по x:

z 2

dz ,

f x

exp

V 2

exp

1 exp

x 2V

x 2

k 1

f x C exp

exp

В последнем интеграле делаем замену переменной:

dV .

x 2

u; V

; dV

2du

;

x 2

k 1

x 2

k 1

f x C 1

exp

u 2

126

Константа Bk определяется из условия равенства единице площади под дифференциальной кривой.

Вывод дифференциальной функции распределения Фишера

Рассмотрим распределение статистики Фишера:

	U k	Uk
v	1		2	,
	V k2
			Vk1

где U и V – независимые случайные величины, распределенные по закону Пирсона с числами степеней свободы k1 и k2 .

Вследствие независимости U и V плотность вероятности их совместного

		U	V		k1	1		k2	1
						1			1
распределения равна произведению f	U f V C exp			U 2			V 2 .
распределения равна произведению f	U f V C exp			U 2			V 2 .
U	V	2	2
		2	2

Интегральная функция распределения Фишера выражается через двойной интеграл, где область интегрирования определена неравенствами

0 U

xk1

V , V

F x P v

x P

C exp

U 2

V 2

dUdV .

xk1

Преобразуем этот интеграл к виду:

xk1

F x C e 2 V 2

e 2 U 2

dU .

Для определения плотности вероятности дифференцируем полученное выражение по x:

xk1

U k1

f x C e 2

V 2

e 2 U 2

dU ;

f x C e

xk1

2k2

VdV ;

V 2

			k1	1	V		xk1		k	k
	xk1		2			1			1		2	1
					2		k2		1		2
					2		k2			2
f x C1				e				V				dV .
f x C1	k	2		e				V				dV .
		2		0
				0

127

В последнем интеграле делаем замену переменной:

	V 1			xk1					w; V						w			; dV					dw						;
	V 1			k	2				w; V							xk		; dV								xk			;
					2								1		1						1						1
													1			k2					1					k2
																k2										k2
							k1	1																		k1	2
					2			1																2
					2																			2
		C	xk1									w		k1 k2 2					C			xk1
		C										w		k1 k2 2					C
	1		k	2																2		k	2							.
f x	1		k								e 2		w 2				dw			2		k

						k k			2																k k
					1				2															1				2
	1		xk1					2		0							1					xk1					2
	1		k2														1					k2
			k2																			k2

Константа C2 определяется из условия равенства единице площади под дифференциальной кривой.

Вопросы для самопроверки

1.Чем отличается распределение Стьюдента от нормального распределения?

2.Как строится интервальная оценка математического ожидания?

3.Какова относительная погрешность интервальной оценки?

4. Как определяется объем выборки, необходимый для получения заключений с заданными надежностью и погрешностью?

5. Как сравниваются центры двух подсовокупностей?

6. Изложите графическую форму представления результатов анализа сравнения выборок.

7. Как сравниваются дисперсии?

8.Как находится дисперсия разности средних при одинаковых дисперсиях выборок?

9.Как находится дисперсия разности средних при разных дисперсиях вы-

борок?

128

13. Дисперсионный анализ

Сравнение групп

Дисперсионный анализ – математический аппарат для сравнения средних нескольких популяций (групп, слоев, классов), которые определяются уровнями некоторых величин (факторов), положенных в основу классификации. Международным обозначением дисперсионного анализа является аббревиатура

ANOVA (analysis of variance).

Вдисперсионном анализе предполагается, что группы (популяции) различаются только средним уровнем результативной переменной, данные в каждой группе распределены нормально с одинаковой дисперсией.

Впредыдущей лекции мы познакомились с методикой Стьюдента сравнения средних двух групп. Это частный случай «однофакторного» дисперсионного анализа, когда группы наблюдений определяются уровнями одного классификационного показателя (фактора).

Рассмотрим общий случай однофакторного дисперсионного анализа.

Пусть имеется р групп (i = 1, 2, … , p), соответствующие уровням xi классификационного фактора X. В каждой группе имеется ki наблюдений результативной

	p
переменной yij (j = 1, 2, … , ki), всего наблюдений n	ki .
i	1

Модель однофакторного дисперсионного анализа yij = ui + ij представляет разложение полного сигнала yij на две компоненты – на полезный сигнал ui и помеху ij (на детерминированную часть ui , которая характеризует определенную группу, и случайный разброс ij в этой группе).

Методом наименьших квадратов из условия минимума суммы квадратов

p ki	ij2
ошибок	ij2	найдено,					что наилучшими оценками для ui являются средние
i 1 j	1
значения ui		1			ki		по данным каждой группы (средние групповые).
	yxi	1				yij
	yxi		k	i		yij
				i	j	1
					j	1

Интересно, что точно такое же разложение имеет сумма квадратов отклонений SSy = SSu + SS и число степеней свободы dfy = dfu + df .

Покажем это. Прежде всего убедимся, что среднее из средних групповых

	1	p ki
равно общему среднему: u y	1	yij .
равно общему среднему: u y	n i	yij .
	n i	1 j 1

129

Действительно,

	p	ki	p		p ki
	1		1		1		y .
u		ui		kiui		yij
			n i 1		n i 1 j 1
	n i 1 j 1

Преобразуем полную (общую) сумму квадратов отклонений:

y 2

p ki

y 2

SSy

1 j 1

i 1 j

p ki

y 2

y u

i 1 j 1

SSu

yij

SSu .

Последняя двойная сумма в этом выражении равна нулю из-за центрального свойства средних – алгебраическая сумма отклонений от своего среднего равна

ki	ki
нулю	ij	yij ui 0.
j 1	j	1
Итак, SSy = SSu + SS .
Докажем		аналогичное соотношение		для	чисел	степеней свободы
dfy = dfu + df :
dfy = n – 1, так как на n отклонений			yij	y наложена одна связь – сумма
всех этих отклонений равна нулю;
dfu = p – 1, так как на р отклонений			ui	y наложена одна связь – взвешен-
		p	ki		p
ная сумма этих отклонений равна нулю			ui	y	ki ui	y 0 ;
		i 1 j 1			i 1

df = n – p, так как в каждой группе сумма отклонений равна нулю

ij 0 .

j 1

Итак, dfy = dfu + df .

Р. Фишер предложил все выкладки дисперсионного анализа оформлять в виде стандартной таблицы (рис. 13.1).

130

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3113 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
03.11.20181.28 Mб31т4.doc
#
11.02.201543.75 Кб1таблицы.docx
#
03.09.201938.28 Кб1Тананян ипотека ИНДЗ.docx
#
11.02.2015128.51 Кб5ТВ і МС Бузько.doc
#
22.04.2019622.59 Кб10ТВ аккк.doc
#
11.06.20156.76 Mб10ТВиМС.Малярец.Егоршин 22.12.12.pdf
#
13.11.20192.56 Mб2текст лекций333333333.doc
#
22.07.201961.44 Кб0ТЕМА 8 СТИМУЛИРОВАНИЕ СБЫТА.doc
#
01.05.2019188.42 Кб6Тема 1. Макроэкономика как наука.doc
#
10.11.201978.85 Кб2Тема 1. Сущность и особенности МЭД.doc
#
10.07.2019154.76 Кб1Тема 1.docx