Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы стат_анализа.doc
Скачиваний:
15
Добавлен:
24.12.2018
Размер:
901.12 Кб
Скачать

4.2. Проверка статистических гипотез

Гипотеза о равенстве дисперсий

Исследуются результаты обработки деталей на двух станках Предполагается, что точность обработки одинакова, т.е., что дис­персии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом станке и 24 деталей на втором. Результаты представлены в первых трех столбцах на рис. Л11

Для проверки гипотезы о равенстве дисперсий выберите Сервис / Анализ данных / Двухвыборочный F-тест. Введите в каче­стве значений переменной 1 результаты измерений на первом станке, переменной 2 - на втором; уровень значимости 0 05.

В полученной таблице с результатами, показанными на рис ЛИ справа, приводятся средние значения, дисперсии, количе­ство наблюдений и степени свободы для каждой выборки значе­ние статистики Фишера (определяется как отношение диспер­сии) и критическое значение (квантиль распределения Фишера) на заданном уровне значимости. Гипотеза о равенстве дисперсий принимается, если выборочное значение статистики Фишера по­пало в область принятия решения; в противном случае гипотеза отклоняется.

Гипотеза о равенстве средних

Проверка этой гипотезы проводится по-разному в зависи­мости от того, принята или отклонена гипотеза о значимости дисперсии: используются двухвыборочные /-тесты с одинако­выми или неодинаковыми дисперсиями.

Проверьте гипотезу о равенстве средних для рассмотренного примера (Сервис / Анализ данных / Двухвыборочный t-тест с одинаковыми (или неодинаковыми) дисперсиями). Введите дан­ные по аналогии с двухвыборочным F-тестом.

Результаты замеров

Двухвыборочный F-тест для дисперсии

№ п/п

Станок 1

Станок 2

Станок 1

Станок 2

1

12,05

12,36

2

12,08

12,45

Среднее

12,249

12,449

3

12,33

12,48

Дисперсия

0,04476

0,01712

4

12,34

12,56

Наблюдения

22

24

5

12,75

12,63

df

21

23

6

12,32

12,25

F

2,6136

7

12,12

12,54

одностороннее

0,0136

8

12,05

12,35

Fкритическое одностороннее

2,0356

9

12,08

12,54

10

12,33

12,33

11

12,08

12,85

12

12,75

12,42

13

12,05

12,47

14

12,08

12,41

15

12,33

12,34'

16

12,05

12,51

17

12,08

12,45

18

12,31

12,24

19

12,34

12,55

20

12,42

12,32

21

12,42

12,44

22

12,12

12,41

23

12,38

24

12,51

Рис. K11. Данные и результаты расчета

В таблице с результатами расчета приводятся статистика Стью-дента и критические значения для одностороннего и двухсторон­него критериев. Гипотеза о равенстве средних принимается если выборочное значение статистики Стьюдента попало в область принятия решения, в противном случае гипотеза отклоняется

Сделайте вывод по полученным результатам как для одно­стороннего, так и двухстороннего критериев.

Гипотеза о виде распределения

Смоделируйте нормально распределенную совокупность из 1000 элементов с средним значением 12 и стандартным откло­нением 0,25. Сделайте случайную выборку 200 элементов из этой совокупности. Используя критерий хи-квадрат, проверим, дей­ствительно ли выборка сделана из нормально распределённой генеральной совокупности. В качестве точечных оценок мате­матического ожидания и дисперсии примите соответствующие выборочные характеристики. Найдите их, используя инструмент Описательная статистика пакета Анализ данных.

С помощью инструмента Гистограмма найдите опытные час­тоты ni. При использовании критерия хи-квадрат количество опытных значений в каждом интервале дол­жно быть не менее пяти. Если в каком-то интервале их меньше то интервалы объединяют. Например, если в промежутке от 4 до 6 оказалось три значения, а в промежутке от 6 до 8 - четыре то вводится новый интервал от 4 до 8 с семью значениями. С учетом этого перестройте таблицу частот вручную. На рис. Л12 в колон­ках «Карман» - «Частота» показаны данные, полученные автома­тически, в колонках «Границы» - «Опытные частоты» данные пересчитаны частично вручную.

Расчетные частоты nPi в формуле (2.15) вычисляются через вероятности попадания нормально распределенной величины в соответствующий интервал:

где функция стандартного нормального распределения Ф(.) вычисляется с помощью встроенной статистической функции НОРМРАСП(x, среднее значение т). Аргументы этой функции (рис. Л13): х - грани­ца интервала, вводится адрес соответствующей ячейки- т

F

G

Я

/

J

К

L

М

№ п/п

Карман

Частота

Гра­ницы

Опыт­ные частоты

НОРМ РАСП

Вероят­ности

Расчет­ные частоты

1

11,350

1

11,350

2

11,446

0

11,639

17

0,0972

0,0972

19,45

3

11,543

3

11,736

18

0,1788

0,0815

16,31

4

11,637

13

11,832

33

0,2938

0,1149

22,99

5

11,736

18

11,929

28

0,4345

0,1407

28,14

6

11,832

33

12,025

18

0,5842

0,1496

29,93

7

11,929

28

12,122

29

0,7224

0,1382

27,64

8

12,025

18

12,218

26

0,8333

0,1109

22,18

9

12,122

29

12,315

11

0,9107

0,0773

15,46

10

12,218

26

12,412

10

0,9575

0,0468

9,362

11

12,315

11

12,508

5

0,9821

0,0246

4,923

12

12,412

10

12,701

5

0,9978

0,0157

3,141

13

12,508

5

14

12,605

2

ХИ2ТЕСТ

0,238

15

Еще

3

ХИ20БР

15,5

Рис. Л12. Расчет критерия хи-квадрат

Рис. Л13. Функция НОРМРАСП

Для вычисления статистики хи-квадрат по формуле (3.66) в Excel встроена функция ХИ2ТЕСТ(фактический интервал, ожи­даемый интервал). В качестве фактического интервала вводятся опытные частоты, в качестве ожидаемого — расчетные (рис. Л14).

Рис. Л14. Функция ХИ2ТЕСТ

Граница критической области — квантиль распределения хи-квадрат может быть найдена с помощью встроенной функции ХИ20БР(вероятность, степени свободы). Аргумент вероятность — это уровень значимости (ос = 0,05), а степени свободы к - / — 1 определяются как количество интервалов (на рис. Л12£=11)за вычетом количества оцениваемых параметров (здесь — два: т и а) минус единица.

Гипотеза о нормальности распределения принимается, если выборочное значение статистики ХИ2ТЕСТ окажется меньше критического ХИ20БР.

Подобным образом может быть проверена гипотеза о виде любого распределения.

Дисперсионный анализ

В дисперсионном анализе исследуется влияние одного или нескольких качественных факторов на количественный резуль­тативный признак. Например, требуется оценить влияние ква­лификации наладчиков (фактор А) на рассеяние диаметров ша­риков. Замеры отклонения диаметра от номинала для каждого из пяти наладчиков проводились по 6 раз (табл. Л1):

Таблица Л1

№ п/п

А\

А2

A3

А4

AS

1

1,2

0,6

0,9

1,7

1

2

1,1

1,1

0,6

1,4

1,4

3

1

0,8

0,8

1,3

1,1

4

1,3

0,7

1

1,6

0,9

5

1,1

0,7

1

1,2

1,2

6

0,8

0,9

1,1

1,3

1,5

Проверяется нулевая гипотеза о равенстве математических ожиданий отклонения для всех пяти наладчиков, т.е. предпола­гается, что квалификация наладчика не влияет на точность из­готовления шариков.

Для проведения анализа воспользуйтесь инструментом Однофакторный дисперсионный анализ пакета Анализ данных. В качестве исходных данных введите таблицу замеров. Выводятся две таблицы. В первой таблице приводятся статистические ха­рактеристики для каждого наладчика, во второй (ANOVA) — результаты анализа, в частности, значение статистики Фишера (F) и граница критической области (F критическое). Если выбо­рочное значение статистики оказалось меньше критического, гипотеза об отсутствии влияния квалификации наладчиков при­нимается.

Самостоятельно проведите дисперсионный анализ влияния технологии чистовой обработки на точность изготовления дета­лей по примеру 6.3.

В пакете анализа имеются и инструменты для проведения двухфакторного дисперсионного анализа.