- •4.3. Регрессионный анализ
- •1.Статистические методы как элемент системы качества
- •1. 1. Место статистических методов в управлении качеством
- •1.2. Статистические методы в системах качества
- •1.3. Применение компьютерных технологий в статистических методах
- •2. Основы математической статистики
- •2.1. Описательная статистика
- •2.2. Оценивание параметров
- •2.3. Критерии значимости
- •3. Регрессионный анализ
- •3.1. Парная линейная регрессия
- •3.2. Парная нелинейная регрессия
- •4. Статистические методы
- •4.1. Методы описательной статистики
- •4.2. Проверка статистических гипотез
- •4.3. Регрессионный анализ
4.2. Проверка статистических гипотез
Гипотеза о равенстве дисперсий
Исследуются результаты обработки деталей на двух станках Предполагается, что точность обработки одинакова, т.е., что дисперсии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом станке и 24 деталей на втором. Результаты представлены в первых трех столбцах на рис. Л11
Для проверки гипотезы о равенстве дисперсий выберите Сервис / Анализ данных / Двухвыборочный F-тест. Введите в качестве значений переменной 1 результаты измерений на первом станке, переменной 2 - на втором; уровень значимости 0 05.
В полученной таблице с результатами, показанными на рис ЛИ справа, приводятся средние значения, дисперсии, количество наблюдений и степени свободы для каждой выборки значение статистики Фишера (определяется как отношение дисперсии) и критическое значение (квантиль распределения Фишера) на заданном уровне значимости. Гипотеза о равенстве дисперсий принимается, если выборочное значение статистики Фишера попало в область принятия решения; в противном случае гипотеза отклоняется.
Гипотеза о равенстве средних
Проверка этой гипотезы проводится по-разному в зависимости от того, принята или отклонена гипотеза о значимости дисперсии: используются двухвыборочные /-тесты с одинаковыми или неодинаковыми дисперсиями.
Проверьте гипотезу о равенстве средних для рассмотренного примера (Сервис / Анализ данных / Двухвыборочный t-тест с одинаковыми (или неодинаковыми) дисперсиями). Введите данные по аналогии с двухвыборочным F-тестом.
Результаты замеров |
Двухвыборочный F-тест для дисперсии |
|
|||
№ п/п |
Станок 1 |
Станок 2 |
|
Станок 1 |
Станок 2 |
1 |
12,05 |
12,36 |
|
|
|
2 |
12,08 |
12,45 |
Среднее |
12,249 |
12,449 |
3 |
12,33 |
12,48 |
Дисперсия |
0,04476 |
0,01712 |
4 |
12,34 |
12,56 |
Наблюдения |
22 |
24 |
5 |
12,75 |
12,63 |
df |
21 |
23 |
6 |
12,32 |
12,25 |
F |
2,6136 |
|
7 |
12,12 |
12,54 |
одностороннее |
0,0136 |
|
8 |
12,05 |
12,35 |
Fкритическое одностороннее |
2,0356 |
|
9 |
12,08 |
12,54 |
|
|
|
10 |
12,33 |
12,33 |
|
|
|
11 |
12,08 |
12,85 |
|
|
|
12 |
12,75 |
12,42 |
|
|
|
13 |
12,05 |
12,47 |
|
|
|
14 |
12,08 |
12,41 |
|
|
|
15 |
12,33 |
12,34' |
|
|
|
16 |
12,05 |
12,51 |
|
|
|
17 |
12,08 |
12,45 |
|
|
|
18 |
12,31 |
12,24 |
|
|
|
19 |
12,34 |
12,55 |
|
|
|
20 |
12,42 |
12,32 |
|
|
|
21 |
12,42 |
12,44 |
|
|
|
22 |
12,12 |
12,41 |
|
|
|
23 |
|
12,38 |
|
|
|
24 |
|
12,51 |
|
|
|
Рис. K11. Данные и результаты расчета
В таблице с результатами расчета приводятся статистика Стью-дента и критические значения для одностороннего и двухстороннего критериев. Гипотеза о равенстве средних принимается если выборочное значение статистики Стьюдента попало в область принятия решения, в противном случае гипотеза отклоняется
Сделайте вывод по полученным результатам как для одностороннего, так и двухстороннего критериев.
Гипотеза о виде распределения
Смоделируйте нормально распределенную совокупность из 1000 элементов с средним значением 12 и стандартным отклонением 0,25. Сделайте случайную выборку 200 элементов из этой совокупности. Используя критерий хи-квадрат, проверим, действительно ли выборка сделана из нормально распределённой генеральной совокупности. В качестве точечных оценок математического ожидания и дисперсии примите соответствующие выборочные характеристики. Найдите их, используя инструмент Описательная статистика пакета Анализ данных.
С помощью инструмента Гистограмма найдите опытные частоты ni. При использовании критерия хи-квадрат количество опытных значений в каждом интервале должно быть не менее пяти. Если в каком-то интервале их меньше то интервалы объединяют. Например, если в промежутке от 4 до 6 оказалось три значения, а в промежутке от 6 до 8 - четыре то вводится новый интервал от 4 до 8 с семью значениями. С учетом этого перестройте таблицу частот вручную. На рис. Л12 в колонках «Карман» - «Частота» показаны данные, полученные автоматически, в колонках «Границы» - «Опытные частоты» данные пересчитаны частично вручную.
Расчетные частоты nPi в формуле (2.15) вычисляются через вероятности попадания нормально распределенной величины в соответствующий интервал:
где функция стандартного нормального распределения Ф(.) вычисляется с помощью встроенной статистической функции НОРМРАСП(x, среднее значение т). Аргументы этой функции (рис. Л13): х - граница интервала, вводится адрес соответствующей ячейки- т
F |
G |
Я |
/ |
J |
К |
L |
М |
№ п/п |
Карман |
Частота |
Границы |
Опытные частоты |
НОРМ РАСП |
Вероятности |
Расчетные частоты |
1 |
11,350 |
1 |
11,350 |
|
|
|
|
2 |
11,446 |
0 |
11,639 |
17 |
0,0972 |
0,0972 |
19,45 |
3 |
11,543 |
3 |
11,736 |
18 |
0,1788 |
0,0815 |
16,31 |
4 |
11,637 |
13 |
11,832 |
33 |
0,2938 |
0,1149 |
22,99 |
5 |
11,736 |
18 |
11,929 |
28 |
0,4345 |
0,1407 |
28,14 |
6 |
11,832 |
33 |
12,025 |
18 |
0,5842 |
0,1496 |
29,93 |
7 |
11,929 |
28 |
12,122 |
29 |
0,7224 |
0,1382 |
27,64 |
8 |
12,025 |
18 |
12,218 |
26 |
0,8333 |
0,1109 |
22,18 |
9 |
12,122 |
29 |
12,315 |
11 |
0,9107 |
0,0773 |
15,46 |
10 |
12,218 |
26 |
12,412 |
10 |
0,9575 |
0,0468 |
9,362 |
11 |
12,315 |
11 |
12,508 |
5 |
0,9821 |
0,0246 |
4,923 |
12 |
12,412 |
10 |
12,701 |
5 |
0,9978 |
0,0157 |
3,141 |
13 |
12,508 |
5 |
|
|
|||
14 |
12,605 |
2 |
|
ХИ2ТЕСТ |
0,238 |
||
15 |
Еще |
3 |
|
ХИ20БР |
15,5 |
Рис. Л12. Расчет критерия хи-квадрат
Рис. Л13. Функция НОРМРАСП
Для вычисления статистики хи-квадрат по формуле (3.66) в Excel встроена функция ХИ2ТЕСТ(фактический интервал, ожидаемый интервал). В качестве фактического интервала вводятся опытные частоты, в качестве ожидаемого — расчетные (рис. Л14).
Рис. Л14. Функция ХИ2ТЕСТ
Граница критической области — квантиль распределения хи-квадрат может быть найдена с помощью встроенной функции ХИ20БР(вероятность, степени свободы). Аргумент вероятность — это уровень значимости (ос = 0,05), а степени свободы к - / — 1 определяются как количество интервалов (на рис. Л12£=11)за вычетом количества оцениваемых параметров (здесь — два: т и а) минус единица.
Гипотеза о нормальности распределения принимается, если выборочное значение статистики ХИ2ТЕСТ окажется меньше критического ХИ20БР.
Подобным образом может быть проверена гипотеза о виде любого распределения.
Дисперсионный анализ
В дисперсионном анализе исследуется влияние одного или нескольких качественных факторов на количественный результативный признак. Например, требуется оценить влияние квалификации наладчиков (фактор А) на рассеяние диаметров шариков. Замеры отклонения диаметра от номинала для каждого из пяти наладчиков проводились по 6 раз (табл. Л1):
Таблица Л1
№ п/п |
А\ |
А2 |
A3 |
А4 |
AS |
1 |
1,2 |
0,6 |
0,9 |
1,7 |
1 |
2 |
1,1 |
1,1 |
0,6 |
1,4 |
1,4 |
3 |
1 |
0,8 |
0,8 |
1,3 |
1,1 |
4 |
1,3 |
0,7 |
1 |
1,6 |
0,9 |
5 |
1,1 |
0,7 |
1 |
1,2 |
1,2 |
6 |
0,8 |
0,9 |
1,1 |
1,3 |
1,5 |
Проверяется нулевая гипотеза о равенстве математических ожиданий отклонения для всех пяти наладчиков, т.е. предполагается, что квалификация наладчика не влияет на точность изготовления шариков.
Для проведения анализа воспользуйтесь инструментом Однофакторный дисперсионный анализ пакета Анализ данных. В качестве исходных данных введите таблицу замеров. Выводятся две таблицы. В первой таблице приводятся статистические характеристики для каждого наладчика, во второй (ANOVA) — результаты анализа, в частности, значение статистики Фишера (F) и граница критической области (F критическое). Если выборочное значение статистики оказалось меньше критического, гипотеза об отсутствии влияния квалификации наладчиков принимается.
Самостоятельно проведите дисперсионный анализ влияния технологии чистовой обработки на точность изготовления деталей по примеру 6.3.
В пакете анализа имеются и инструменты для проведения двухфакторного дисперсионного анализа.