ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
высшего профессионального образования
«МАТИ» - РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ имени К.Э. ЦИОЛКОВСКОГО
Кафедра «Моделирование систем и информационные технологии»
Проверка гипотезы о нормальном
ЗАКОНЕ РАСПРЕДЕЛЕНИЯ
Методические указания к практическим занятиям
по дисциплине «Математическая статистика»
Составители: Егорова Ю.Б.
Мамонов И.М.
МОСКВА 2008
Проверка гипотезы о нормальном законе распределения: Методические указания к практическим занятиям по дисциплине «Математическая статистика»/ Ю.Б. Егорова, И.М. Мамонов. М.: МАТИ, 2008. – 20 с.
Егорова Ю.Б.,
Мамонов И.М.,
составление, 2008
МАТИ, 2008
ВВЕДЕНИЕ
Методические указания предназначены для студентов дневного отделения факультета №14 специальностей 230102, 220231 и являются учебным руководством при выполнении индивидуального задания. В настоящее время существует достаточно большое количество статистических программ, предназначенных для работы на персональном компьютере. Однако для лучшего понимания изучаемого материала индивидуальное задание рекомендуется выполнить «вручную» (с помощью калькулятора).
ПРОВЕРКА ГИПОТЕЗ О ЗАКОНАХ РАСПРЕДЕЛЕНИЯ
ПО КРИТЕРИЮ ПИРСОНА
Одной из важнейших задач математической статистики является установление теоретического закона распределения изучаемой величины.
Обозначим через Х исследуемую случайную величину. Из генеральной совокупности значений случайной величины Х сделаем выборку объемом n. По выборке можно оценить эмпирический закон распределения, например, с помощью статистического распределения частот и относительных частот, построения полигона, гистограммы, кумуляты, нахождения эмпирической функции распределения F*(x).
Сравнение эмпирического и теоретического законов распределения производится с помощью специально подобранной случайной величины – критерия согласия. Существует несколько критериев согласия: Пирсона, Колмогорова, Смирнова и др.
Выдвигаем нулевую гипотезу Но: случайная величина Х имеет некоторый предполагаемый теоретический закон распределения.
Выдвигаем альтернативную гипотезу Н1: случайная величина Х не имеет предполагаемого теоретического закона распределения.
Пусть эмпирическое распределение задано в виде статистического распределения частот, т.е. в виде перечня вариант xi и соответствующих им эмпирических частот ni (табл.1).
Таблица 1
Статистическое распределение частот
xi |
x1 |
x2 |
… |
xn |
ni |
n1 |
n2 |
|
nn |
Для каждого значения xi определим теоретические (выравнивающие) частоты . При уровне значимости необходимо проверить, насколько сильно эмпирические частоты отличаются от теоретических частот.
В этом случае в качестве критерия согласия для проверки статистической гипотезы о неизвестном законе распределения генеральной совокупности используется случайная величина 2, которая называется критерием согласия Пирсона:
Случайная величина 2 имеет распределение Пирсона с k=s-r-1 степенями свободы, где s – число частичных интервалов выборки,
r – число параметров закона распределения, которые определяются по выборке (табл.2).
Таблица 2
Число степеней свободы критерия Пирсона
Теоретический закон распределения |
Параметры закона распределения |
Число параметров r |
Число степеней свободы k=s-r-1 |
Нормальный |
m; |
2 |
k=s-3 |
Равномерный |
a, b |
2 |
k=s-3 |
Показательный |
λ |
1 |
k=s-2 |
Биномиальный |
p |
1 |
k=s-2 |
Пуассона |
λ |
1 |
k=s-2 |
Порядок проверки нулевой гипотезы:
по выборке определяем наблюдаемое значение критерия.
по таблице распределения Пирсона (см. Приложение 1) определяем критическое значения критерия в зависимости от уровня значимостиα и числа степеней свободы k.
Если , то нулевая гипотеза принимается.
Если , то нулевая гипотеза отвергается.
Для применения критерия Пирсона необходимо, чтобы данные были представлены в виде интервального (группированного) статистического ряда и в каждом интервале частота была не менее 5. Если в каком-нибудь интервале частота меньше 5, то необходимо объединить соседние интервалы.
ПРИМЕР 1. Исследуется случайная величина Х – изменение выработки на одного рабочего механического цеха в отчетном году по сравнению с предыдущим. Получены данные по 100 рабочим цеха, на основании которых был составлен интервальный статистический ряд (табл. 3), определены выборочное среднее , выборочная дисперсия D*(X)=87,48 (%)2 и выборочное среднее квадратическое отклонение *(X)=9,35%.
Таблица 3
Группированный статистический ряд
№ интервала |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
xi, % |
94-100 |
100-106 |
106-112 |
112-118 |
118-124 |
124-130 |
130-136 |
136-142 |
ni |
3 |
7 |
11 |
20 |
28 |
19 |
10 |
2 |
С помощью критерия Пирсона при уровне значимости =0,05 необходимо проверить нулевую гипотезу о том, что случайная величина Х имеет нормальный закон распределения.
РЕШЕНИЕ. Выдвигаем нулевую гипотезу Но: случайная величина Х имеет нормальный закон распределения с параметрами N(119,2; 9,35). Выдвигаем альтернативную гипотезу Н1: случайная величина Х не имеет нормального закона распределения с параметрами N(119,2; 9,35).
Сначала определяем теоретические (выравнивающие) частоты по формуле: гдеpi – вероятность попадания случайной величины Х в i-интервал. Для расчета pi используем функцию Лапласа (см. приложение 3):
где α и – концы i-интервала. Например:
Для определения вероятностей, теоретических частот и критерия Пирсона удобно составить таблицу (см. табл.4). Частоты в первом и последнем восьмом интервале меньше 5, поэтому их целесообразно объединить с соседними.
Таблица 4
Вспомогательная таблица для расчета критерия Пирсона
№ i-интер- вала |
Интервал xi [α] |
Эмпирические частоты ni |
Вероятность попадания в i-интервал pi |
Теоретические частоты
|
|
Эмпирическая плотность распределения вероятностей f*(x) | ||
1 |
2 |
3 |
4 |
5 |
6 |
7 | ||
1 |
94-100 |
3 |
10 |
0,017 |
1,7 |
7,6 |
0,758 |
0,003 |
2 |
100-106 |
7 |
0,059 |
5,9 |
0,010 | |||
3 |
106-112 |
11 |
0,141 |
14,1 |
0,682 |
0,024 | ||
4 |
112-118 |
20 |
0,228 |
22,8 |
0,344 |
0,038 | ||
5 |
118-124 |
28 |
0,247 |
24,7 |
0,441 |
0,041 | ||
6 |
124-130 |
19 |
0,182 |
18,2 |
0,035 |
0,030 | ||
7 |
130-136 |
10 |
12 |
0,087 |
8,7 |
11,6 |
0,14 |
0,015 |
8 |
136-142 |
2 |
0,029 |
2,9 |
0,005 | |||
|
100 |
1,0 |
100 |
2=2,27 |
– |
Порядок проверки нулевой гипотезы:
Определяем наблюдаемое значение критерия(см. табл.4).
Определяем критическое значения критерия в зависимости от уровня значимостиα=0,05 и числа степеней свободы k. Новое число интервалов (с учетом объединения крайних) s=6, поэтому число степеней свободы k=s–3=6–3=3. По таблице распределения Пирсона (см. Приложение 1) определяем
Так как , то нулевая гипотеза принимается. Следовательно, гипотеза о нормальном законе распределения с параметрамиN(119,2; 48) согласуется с опытными данными.