Книга 1
.pdfмер D1), ставим флажок напротив «Описательная статистика» (Summary Statistics), нажимаем «ОК». Результат – основные характеристики выборки (сделайте шире столбец D, переместив его границу в заголов- ке).
Задание 1. Для данных из задания 4 лабораторной работы № 1 вычислить основные числовые характеристики выборки обоими спо- собами.
Часть 2. Интервальное оценивание.
Рассмотрим теперь методы интервального оценивания. Дове- рительным интервалом называется интервал (a;b) , в который с задан-
ной вероятностью р попадает оцениваемый параметр. Вероятность р называется доверительной. Вместо нее часто задают величину α = 1− p , называемую уровнем значимости. Если выборка объема п
представляет случайную величину, распределенную нормально, то
доверительные интервалы для матожидания и дисперсии равны
æ |
S ×t |
|
|
|
|
(n -1) |
|
|
|
S ×t |
|
(n -1) ö |
|
||||||||
ç |
1−α |
2 |
|
|
|
|
|
|
|
|
1−α |
2 |
|
|
÷ |
|
|||||
mÎç x - |
|
|
|
|
|
|
|
|
; |
x + |
|
|
|
|
|
|
|
|
÷ |
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|||||||||
ç |
|
|
|
|
n |
|
|
|
|
|
|
|
÷ |
|
|||||||
è |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ø |
|
|
|
æ |
|
2 |
|
|
|
|
|
|
2 |
|
|
|
|
ö |
|
|
|
|||
s2 |
ç |
S |
×(n -1) |
|
S |
×(n -1) |
|
÷ |
|
|
|
||||||||||
Îç |
|
|
|
; |
|
|
÷ |
, |
|
|
|||||||||||
|
|
|
|
|
|
(n -1) |
c2 |
(n -1) |
|
|
|||||||||||
|
ç c2 |
|
|
|
|
|
|
÷ |
|
|
|
||||||||||
|
è |
1−α |
2 |
|
|
|
α |
2 |
|
|
|
ø |
|
|
|
где t p (n) и c2p (n) - квантили распределения Стьюдента и хи-квадрат, α = 1− p .
Возвращаемся на лист 1 электронной таблицы с данными примера и для них вычислим доверительные интервалы при р=0,05. Вводим данные согласно рисунку:
|
S ×t1−α |
2 |
(n -1) |
|||
Для вычисления величины |
|
|
|
служит функция |
||
|
|
|
|
|
n
«ДОВЕРИТ» категории «Статистические» с тремя параметрами «Аль- фа» - уровень значимости α = 1− p , «Станд_откл» - среднеквадрати-
ческое отклонение S, «Размер» - объем выборки п. Таким образом, вводим в Н3 функцию:
11
PDF created with pdfFactory Pro trial version www.pdffactory.com
=СРЗНАЧ(А1:А25)-ДОВЕРИТ(I1;СТАНДОТКЛОН(А1:А25);25)
а в ячейку I3 функцию:
=СРЗНАЧ(А1:А25)+ДОВЕРИТ(I1;СТАНДОТКЛОН(А1:А25);25)
Для вычисления доверительного интервала для дисперсии следует от- метить, что функция вычисления квантили распределения хи-квадрат (обратного распределения хи-квадрат) называется «ХИ2ОБР» (катего- рия «Статистические») и имеет два параметра: первый «Вероятность» содержит доверительную вероятность р, второй – степень свободы п-1. Вводим в соответствии с данными условиями и формулой для довери- тельного интервала в ячейку Н4 запись:
=ДИСП(A1:A25)*24/ХИ2ОБР(0,025;24)
а в ячейку I4 запись: =ДИСП(A1:A25)*24/ХИ2ОБР(0,975;24).
Получаем значения границ доверительных интервалов.
Задание 2. Для данных из задания 4 лабораторной работы № 1
вычислить доверительные интервалы для матожидания и дисперсии при α = 0,01 . Изменяя значение уровня значимости α сделать вывод о его влиянии на ширину интервала.
Лабораторная работа № 3
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ О ВИДЕ РАСПРЕДЕЛЕНИЯ
Цель: Ознакомиться с методами проверки статистических гипотез о принадлежности генеральной совокупности, представлен- ной выборочными данными, к тому или иному типу распределений, используя критерий согласия Пирсона (хи-квадрат) с помощью ЭВМ.
Методы проверки статистических гипотез занимают цен- тральное место в исследованиях математической статистики. Одной из
важнейших групп критериев проверки статгипотез являются критерии проверки гипотез о виде распределений (критерии согласия). Они по
выборочным данным проверяют предположение о принадлежности генеральной совокупности к тому или иному виду распределений. Од- ним из наиболее мощных критериев согласия является критерий Пир- сона, называемый еще критерием хи-квадрат. Его суть заключается в сравнении теоретических частот элементов выборки ni (для дискрет- ных распределений) с теоретическими частотами ni′ = npi , где pi - ве-
роятность принять это значение, рассчитанное по исследуемому зако- ну распределения. Если распределение непрерывное, то строится группированный статистический ряд из k интервалов
12
PDF created with pdfFactory Pro trial version www.pdffactory.com
и pi = F(bi ) − F(ai ) есть вероятность попасть в i-й интервал группиров- ки (здесь F(x) - функция распределения проверяемого закона). Стати-
|
k |
2 |
|
|
стикой критерия является величина χ2 |
= å |
(n − n′) |
. Критическое зна- |
|
n′ |
||||
|
i=1 |
|
чение критерия равно обратному распределению хи-квадрат со степе-
нями свободы (k-r-1): χ2 |
= χ2 |
(k − r −1) , где r – число оцениваемых |
kr |
1−α |
|
параметров закона распределения. Распределение можно считать соот- ветствующим теоретическому если выполняется условие χ2 < χ2kr .
Рассмотрим решение данной задачи на примере.
ПРИМЕР 1. Имеется выборка прибыли (тыс. руб.) коммерче- ской фирмы за 40 дней. Необходимо проверить статистическую гипо- тезу о том, что прибыль данной фирмы распределена по нормальному закону распределения. Взять уровень значимости α = 0,05 .
Выборка прибыли коммерческой фирмы за 40 дней (тыс. руб.)
64 |
56 |
69 |
78 |
78 |
83 |
47 |
65 |
77 |
57 |
61 |
52 |
50 |
58 |
60 |
48 |
62 |
63 |
68 |
64 |
64 |
64 |
79 |
66 |
65 |
62 |
85 |
75 |
88 |
61 |
82 |
52 |
72 |
75 |
84 |
66 |
62 |
73 |
64 |
74 |
Для проверки гипотезы о принадлежности генеральной сово- купности нормальному виду распределений необходимо строить груп- пированный статистический ряд, т.к. нормальное распределение явля- ется непрерывным. Для этого нужно знать размах выборки, который равен разнице между максимальным и минимальным элементами вы- борки. Кроме того, нужно рассчитать точечные оценки математиче- ского ожидания и среднеквадратического отклонения (СКО). Откры-
ваем электронную таблицу и вводим данные выборки в нее в ячейки А2-А41, делаем подписи для расчетных параметров в соответствии с рисунком:
Вычисляем параметры по выборке. Для этого вводим в ячейку В3: «=СЧЁТ(A2:A41)» (здесь и далее кавычки вводить не надо, функ- ции можно вводить с помощью мастера функций из категории «Стати- стические», как в лабораторной работе № 2, ссылки на ячейки можно
13
PDF created with pdfFactory Pro trial version www.pdffactory.com
ввести щелкнув мышью по ячейке). В В5 вводим: «=МАКС(A2:A41)»,
в В7: «=МИН(A2:A41)», в В9: «=СРЗНАЧ(A2:A41)», в В11: «=СТАНДОТКЛОН(A2:A41)».
Видно, что весь диапазон значений элементов лежит на интерва- ле от 47 до 88. Разобьем этот интервал на интервалы группировки: [0; 50], (50; 55], (55; 60], (60; 65], (65; 70], (70; 75], (75; 80], (80; 85], (85; 90]. Для этого вводим в ячейки С2-С11 границы интервалов:
Ячейка |
С2 |
С3 |
С4 |
С5 |
С6 |
С7 |
С8 |
С9 |
С10 |
С11 |
Число |
0 |
50 |
55 |
60 |
65 |
70 |
75 |
80 |
85 |
90 |
Для вычисления частот п используем функцию ЧАСТОТА. Для этого в D3 вводим формулу «=ЧАСТОТА(A2:A41;C3:C11)». Затем обводим курсором ячейки D3-D11, выделяя их и нажимаем F2, а затем одновременно Ctrl+Shift+Enter. В результате в ячейках D3-D11 ока- жутся значения частот.
Для расчета теоретической вероятности pi = F(bi ) − F(ai ) вво-
дим в ячейку Е3 разницу между функциями нормального распределе- ния (функция НОРМРАСП категории «Статистические») с параметра- ми: «Х» – значение границы интервала, «Среднее» - ссылка на ячейку В9, «Стандартное_откл» - ссылка на В11, «Интегральная» - 1. В ре- зультате в Е3 будет формула:
=НОРМРАСП(C3;$B$9;$B$11;1)-НОРМРАСП(C2;$B$9;$B$11;1)
Автозаполняем эту формулу на Е3-Е10 перемещая нижний правый угол Е3 до ячейки Е10. В последней ячейке столбца Е11 для соблюде- ния условия нормировки вводим дополнение предыдущих вероятно- стей до единицы. Для этого вводим в Е11: «=1-СУММ(E3:E10)»
Для расчета теоретической частоты ni′ = npi вводим в F3 форму- лу: «=E3*$B$3», автозаполняем ее на F3-F11.
Для вычисления элементов суммы |
(n − n′)2 |
критерия Пирсона |
|
n′ |
|||
|
|
вводим в G3 значение «=(D3-F3)*(D3-F3)/F3» и автозаполняем его на диапазон G3-G11.
Находим значение критерия χ2 и критическое значение χ2kr .
Для этого вводим в F12 подпись «Сумма», а в F13 подпись «Критич.». Вводим в соседние ячейки формулы – в G12: «=СУММ(G3:G11)», а в G13: «=ХИ2ОБР(0,05;6)», здесь параметр α = 0,05 взят из условия, а
степень свободы (k-r-1)=(9-2-1)=6, так как k=9 – число интервалов группировки, а r=2, т.к. были оценены два параметра нормального
распределения: математическое ожидание и СКО. Видно, что χ2 < χ2kr ,
14
PDF created with pdfFactory Pro trial version www.pdffactory.com
то есть можно считать, что прибыль данной фирмы распределена по нормальному закону распределения.
Проверим это, построив графики плотностей эмпирического и теоретического распределений. Ставим курсор в любую свободную ячейку и вызываем мастер диаграмм (Вставка/Диаграмма). Выбираем тип диаграммы «График» и вид «График с маркерами» самый левый во второй строке, нажимаем «Далее». Ставим курсор в поле «Диапазон» и удерживая кнопку CTRL обводим мышью область ячеек D3-D11 а за- тем F3-F11. Переходим на закладку «Ряд» и в поле «Подписи оси Х» обводим область С3-С11. Нажимаем «Готово». Видно, что графики достаточно хорошо совпадают, что говорит о соответствии данных нормальному закону.
Задание 1. Дана выборка числа посетителей Интернет – сайта за 30 дней. Проверить по критерию Пирсона на уровне значимости α = 0,02 статистическую гипотезу о том, что генеральная совокуп-
ность, представленная выборкой, имеет нормальный закон распреде- ления.
Вариант |
|
|
|
|
|
|
Выборка |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. |
45 |
52 |
49 |
48 |
42 |
51 |
54 |
54 |
50 |
47 |
56 |
53 |
59 |
57 |
50 |
|
45 |
50 |
46 |
55 |
46 |
54 |
55 |
64 |
67 |
51 |
49 |
47 |
47 |
55 |
40 |
2. |
48 |
43 |
52 |
42 |
38 |
57 |
47 |
47 |
51 |
52 |
55 |
53 |
50 |
46 |
53 |
|
50 |
49 |
58 |
53 |
44 |
51 |
49 |
53 |
51 |
51 |
48 |
45 |
46 |
49 |
54 |
3. |
65 |
81 |
76 |
84 |
81 |
80 |
78 |
86 |
85 |
83 |
75 |
85 |
83 |
80 |
77 |
|
69 |
73 |
78 |
75 |
75 |
91 |
79 |
74 |
67 |
68 |
78 |
80 |
81 |
81 |
81 |
4. |
75 |
82 |
79 |
78 |
72 |
81 |
84 |
84 |
80 |
77 |
86 |
83 |
89 |
87 |
80 |
|
75 |
80 |
76 |
85 |
76 |
84 |
85 |
94 |
97 |
81 |
79 |
77 |
77 |
85 |
70 |
5. |
78 |
73 |
82 |
72 |
68 |
87 |
77 |
77 |
81 |
82 |
85 |
83 |
80 |
76 |
83 |
|
80 |
79 |
88 |
83 |
74 |
81 |
79 |
83 |
81 |
81 |
78 |
75 |
76 |
79 |
84 |
6. |
70 |
59 |
57 |
62 |
49 |
63 |
59 |
60 |
57 |
66 |
64 |
57 |
59 |
58 |
59 |
|
56 |
62 |
56 |
57 |
63 |
59 |
55 |
58 |
62 |
61 |
60 |
59 |
59 |
61 |
63 |
7. |
39 |
41 |
35 |
41 |
42 |
38 |
41 |
41 |
36 |
45 |
40 |
39 |
41 |
41 |
40 |
|
42 |
45 |
39 |
39 |
35 |
41 |
36 |
36 |
39 |
41 |
43 |
40 |
41 |
38 |
44 |
8. |
15 |
31 |
26 |
34 |
31 |
30 |
28 |
36 |
35 |
33 |
25 |
35 |
33 |
30 |
27 |
|
19 |
23 |
28 |
25 |
25 |
41 |
29 |
24 |
17 |
18 |
28 |
30 |
31 |
31 |
31 |
9. |
25 |
32 |
29 |
28 |
22 |
31 |
34 |
34 |
30 |
27 |
36 |
33 |
39 |
37 |
30 |
|
25 |
30 |
26 |
35 |
26 |
34 |
35 |
44 |
47 |
31 |
29 |
27 |
27 |
35 |
20 |
10. |
59 |
60 |
65 |
50 |
55 |
64 |
66 |
63 |
55 |
62 |
60 |
58 |
67 |
58 |
65 |
|
63 |
59 |
57 |
65 |
56 |
66 |
59 |
59 |
60 |
61 |
65 |
59 |
50 |
64 |
63 |
11. |
40 |
41 |
37 |
37 |
40 |
42 |
39 |
43 |
38 |
41 |
45 |
44 |
48 |
43 |
28 |
|
39 |
41 |
39 |
38 |
44 |
37 |
41 |
42 |
45 |
40 |
43 |
35 |
44 |
44 |
44 |
12. |
54 |
59 |
55 |
57 |
44 |
42 |
52 |
55 |
49 |
53 |
51 |
50 |
61 |
59 |
53 |
|
46 |
47 |
44 |
52 |
49 |
48 |
56 |
40 |
52 |
46 |
46 |
45 |
52 |
59 |
57 |
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
|
PDF created with pdfFactory Pro trial version www.pdffactory.com
Критерий Пирсона также можно использовать для проверки предположения о том, что полученные в результате наблюдений дан- ные соответствуют нормам. Пусть имеются некоторые показатели, которые должны соответствовать стандартным нормам. Для проверки
из генеральной совокупности получается выборка значений данных показателей. Рассматривается гипотеза о том, что отклонения от норм невелики, и ими можно пренебречь. Рассмотрим проверку гипотезы на примере.
ПРИМЕР 2. На консервном заводе принимаемое зерно го- рошка считается высшего сорта, если в нем не менее 60 % зерна раз- мером более 7 мм в диаметре, не менее 20 % зерна размером 5-7 мм, 10 % зерна 4-5 мм и 10 % зерна менее 4 мм в диаметре. На завод привезли партию зерна, из которой отобрали одну тонну для проверки. В ре- зультате оказалась, что размером более 7 мм в диаметре 550 кг, зерна размером 5-7 мм 220 кг, зерна 4-5 мм 120 кг и зерна размером менее 4 мм 110 кг. Можно ли с вероятностью 0,95 ( α = 0,05 ) говорить о том,
что привезенное зерно высшего сорта?
Если бы зерно точно бы соответствовало норме, то его коли- чество из одной тонны распределялось бы по размерам как 600 кг, 200 кг, 100 кг и 100 кг. Введем в А1 заголовок «НОРМА» и ниже в А2-А5 показатели – числа 600, 200, 100, 100. В ячейку В1 введем заголовок «НАБЛЮДЕНИЯ» и ниже в В2-В5 наблюдаемые показатели 550, 220, 120, 110. В третьем столбце вводятся формулы для критерия: в С1 за- головок «КРИТЕРИЙ», в С2 формулу «=(А2-В2)*(А2-В2)/А2». Авто- заполнением размножим эту формулу на С3-С5. В ячейку С6 запишем общее значение критерия – сумму столбца С2-С5. Для этого поставим курсор в С6 и вызвав функции в категории «Математические» найдем СУММ и в аргументе «Число 1» укажем ссылку на С2-С5. Получится результат критерия Z=11,16667. для ответа на вопрос, соответствуют ли опытные показатели нормам, Z сравнивают с критическим значени- ем Zкр. Вводим в D1 текст «критическое значение» в Е1 вводим функ- цию ХИ2ОБР (категория «Статистические») у которой два аргумента: «Вероятность» – вводится уровень значимости α = 1− p (в нашем слу-
чае 1-0,95=0,05) и «Степени_свободы» – вводят число n-1, где n – чис- ло норм (в нашем случае 4-1=3). Результат 7,814725. Видно, что кри- тическое значение меньше критерия, следовательно опытные данные
не соответствует стандартам и зерно с заданной вероятностью нельзя отнести к высшему сорту.
Задание 2. При производстве микросхем процессоров исполь- зуются кристаллы кварца. Стандартом предусмотрено, чтобы у 50 %
образцов не было обнаружено ни одного дефекта кристаллической
16
PDF created with pdfFactory Pro trial version www.pdffactory.com
структуры, у 15% - один дефект, у 13 % - 2 дефекта, у 12 % - 3 дефекта, у 10 % более 3 дефектов. При анализе выборочной партии оказалось, что из 1000 экземпляров распределение по дефектам следующее (вари- ант соответствует номеру ЭВМ):
Вариант |
0 дефектов |
1 дефект |
2 дефекта |
3 дефекта |
более 3 |
1. |
489 |
144 |
135 |
122 |
110 |
2. |
491 |
145 |
134 |
125 |
105 |
3. |
489 |
155 |
133 |
123 |
100 |
4. |
483 |
153 |
132 |
130 |
102 |
5. |
516 |
148 |
131 |
110 |
95 |
6. |
508 |
152 |
129 |
111 |
100 |
7. |
494 |
147 |
136 |
121 |
102 |
8. |
492 |
155 |
128 |
120 |
105 |
9. |
471 |
160 |
137 |
122 |
110 |
10. |
471 |
159 |
135 |
127 |
108 |
11. |
489 |
156 |
131 |
117 |
107 |
12. |
486 |
153 |
136 |
119 |
106 |
Можно ли с вероятностью 0,99 (при α = 0,01) считать, что партия со- ответствует стандарту?
Лабораторная работа № 4
ПРОВЕРКА ГИПОТЕЗ О РАВЕНСТВЕ ДИСПЕРСИЙ И МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ
Цель: Используя F-критерии Фишера и t-критерий Стьюден- та научиться проверять гипотезы о равенстве дисперсий и матема- тических ожиданий (средних) с помощью ЭВМ.
Часть 1. Критерий Фишера сравнения дисперсий
Используется в случае, если нужно проверить различается ли разброс данных (дисперсии) у двух выборок. Это может использовать- ся, например, при сравнении точностей обработки деталей на двух станках, равномерности продаж товара в течении некоторого периода в двух городах и т.д. Для проверки статистической гипотезы о равен- стве дисперсий служит F- критерий Фишера. Основной характеристи-
кой критерия является уровень значимости α, который имеет смысла вероятности ошибиться, предполагая, что дисперсии и, следовательно,
точность, различаются. Вместо α в задачах также иногда задают дове- рительную вероятность p = 1− α , имеющую смысл вероятности того,
что дисперсии и в самом деле равны. Обычно выбирают критическое значение уровня значимости, например 0,05 или 0,1, и если α больше
17
PDF created with pdfFactory Pro trial version www.pdffactory.com
критического значения, то дисперсии считаются равными, в против- ном случае, различны. При этом критерий может быть односторонним, когда нужно проверить, что дисперсия конкретной выделенной выбор- ки больше, чем у другой, и двусторонним, когда просто нужно пока- зать, что дисперсии не равны. Существует два способа проверки таких гипотез. Рассмотрим их на примерах.
ПРИМЕР 1. Два автомата расфасовывают муку по мешкам, емкостью 50 кг. Необходимо проверить, можно ли с вероятностью не менее 0,95 считать, что точность расфасовки на обоих автоматах оди- накова. Для проверки гипотезы отбираются две выборки весов муки, расфасованной на первом и втором автомате:
1 автом. 47,5 52,9 51,3 48,1 52,6 49,4 48,0 52,3 45,9 52,6 46,8 49,0
2 автом. 52,5 50,5 48,4 48,6 50,6 50,0 50,1 49,5 49,7 51,1 49,2 49,7
По условию задачи критерий двусторонний, так как требуется проверить различие дисперсий (точностей). Доверительная вероят-
ность задана p=0.95, |
следовательно, уровень значимости |
α = 1− p = 1− 0,95 = 0,05 . |
Вводим данные выборок (без подписей) в |
две строчки в ячейки А1-L1 и А2-L2 соответственно. Для вычисления
уровня значимости двустороннего критерия служит функция ФТЕСТ(массив1;массив2). Вводим в А4 подпись «Уровень значимо- сти», а в В4 функцию ФТЕСТ, аргументами которой должны быть ссылки на ячейки А1-L1 и А2-L2 соответственно. Результат 0,011591293 говорит о том, что вероятность ошибиться, приняв гипо- тезу о различии дисперсий, около 0,01, что меньше критического зна- чения, заданного в условии задачи 0,05. Следовательно, можно гово-
рить что опытные данные с большой вероятностью подтверждают предположение о том, что дисперсии разные и точность расфасовки автоматов различна.
Другой способ решения задачи – использовать надстройку «Анализ данных» (Data Analysis). Для ее подключения нужно в меню «СЕРВИС» выбрать «НАДСТРОЙКИ» и поставить флажок напротив «Пакет анализа» (Analysis ToolPak). После этого в меню «СЕРВИС» появится пункт «АНАЛИЗ ДАННЫХ» (Data Analysis). Вызвав его, откроется окно, в котором нужно выбрать «Двухвыборочный F-тест для дисперсий» (F-test Two-Sample for Variances). В открывшемся окне в полях «Интервал переменной 1» (Variable 1 Range) и «Интервал пе- ременной 2» (Variable 1 Range) вводят ссылки на данные (А1-L1 и А2- L2, соответственно), если имеются подписи данных, то ставят флажок у надписи «Метки» (Label) (у нас их нет, поэтому флажок не ставится). Далее вводят уровень значимости в поле «Альфа» (Alpha) (по условия это 0,05, и данное значение уже указано по умолчанию). В разделе «Параметры вывода» (Output Options) ставят метку около «Выходной интервал» (Output Range) и поместив курсор в появившееся поле на-
18
PDF created with pdfFactory Pro trial version www.pdffactory.com
против надписи, щелкают левой кнопкой в ячейке В7. Вывод результа- та будет осуществляться начиная с этой ячейки. Нажав на «ОК» появ- ляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умеща- лись все надписи. В таблице указаны средние и дисперсии каждой вы- борки, значение F-критерия, односторонний критический уровень зна- чимости в строке «P(F<=f) одностороннее» («Р(F<=f) one-tail») и кри- тическое значение F-критерия (F critical one tail). Если значение F- критерия ближе к единице, чем F-критическое, то с заданной вероят- ностью можно считать, что дисперсии равны. Об этом же говорит и то, что критический уровень значимости «P(F<=f) одностороннее» больше
заданного значения α. В нашем случае F-критерий равен 5,128330184 а F-критическое 2,817927225, то есть F-критерий дальше от единицы, чем критическое значение. Это говорит о том, что дисперсии различ- ны и автоматы имеют разную точность расфасовки.
Задание 1. Четыре станка в цеху обрабатывают детали. Для проверки точности обработки. взяли выборки размеров деталей у каж- дого станка. Необходимо сравнить с помощью F-теста попарно точно- сти обработки всех станков (рассмотреть пары 1-2, 1-3, 1-4, 2-3, 2-4, 3-4) и сделать вывод, для каких станков точности обработки (диспер- сии) равны, для каких нет. Взять уровень значимости α = 0,02 .
Вар. |
|
|
Выборки размеров деталей |
|
|
|
|||||
1, |
1 станок |
29,1 |
26,2 |
30,7 |
33,8 |
33,6 |
35,2 |
23,4 |
29,3 |
33,3 |
26,7 |
6, |
2 станок |
29,0 |
28,9 |
34,0 |
29,7 |
29,4 |
28,5 |
35,9 |
32,6 |
37,1 |
28,0 |
11 |
|
|
|
|
|
|
|
|
|
|
|
3 станок |
25,7 |
27,5 |
25,4 |
28,9 |
29,9 |
30,1 |
29,0 |
36,6 |
24,8 |
27,8 |
|
|
4 станок |
32,1 |
31,0 |
27,2 |
29,3 |
30,4 |
31,7 |
30,4 |
27,3 |
35,7 |
31,5 |
2, |
1 станок |
36,6 |
34,3 |
33,9 |
30,3 |
30,0 |
31,4 |
29,9 |
26,8 |
24,7 |
32,5 |
7, |
2 станок |
28,4 |
32,5 |
31,5 |
28,2 |
33,9 |
24,7 |
31,7 |
29,7 |
30,1 |
28,0 |
12 |
3 станок |
33,1 |
30,4 |
33,4 |
29,6 |
27,7 |
33,2 |
28,3 |
31,6 |
31,6 |
29,1 |
|
4 станок |
30,6 |
31,6 |
29,3 |
26,3 |
33,8 |
29,1 |
26,1 |
32,3 |
32,4 |
31,3 |
3, |
1 станок |
34,1 |
35,1 |
30,7 |
30,4 |
35,6 |
29,9 |
28,0 |
32,7 |
30,0 |
33,1 |
8 |
2 станок |
30,8 |
34,4 |
30,3 |
26,6 |
25,8 |
30,6 |
32,9 |
25,5 |
28,2 |
31,6 |
|
3 станок |
30,7 |
30,6 |
30,0 |
26,3 |
30,7 |
30,4 |
32,3 |
27,8 |
31,8 |
30,7 |
|
4 станок |
30,6 |
31,3 |
27,0 |
27,4 |
31,4 |
30,4 |
28,4 |
30,3 |
27,2 |
27,3 |
4, |
1 станок |
28,1 |
27,1 |
33,6 |
32,8 |
24,8 |
33,8 |
29,4 |
26,6 |
24,4 |
27,5 |
9 |
2 станок |
31,8 |
27,1 |
32,6 |
34,3 |
27,8 |
29,1 |
26,0 |
34,1 |
33,1 |
30,6 |
|
3 станок |
27,1 |
34,6 |
26,5 |
28,8 |
26,1 |
34,8 |
30,1 |
31,0 |
32,9 |
35,8 |
|
4 станок |
28,1 |
32,6 |
27,5 |
29,7 |
29,3 |
34,6 |
26,0 |
27,2 |
29,5 |
26,8 |
5, |
1 станок |
29,7 |
30,4 |
35,2 |
28,5 |
27,6 |
27,8 |
31,8 |
33,9 |
25,7 |
32,9 |
10 |
2 станок |
30,0 |
33,0 |
27,0 |
32,3 |
33,7 |
26,5 |
31,2 |
24,7 |
30,2 |
33,0 |
|
3 станок |
28,8 |
30,7 |
35,5 |
22,8 |
30,1 |
29,6 |
33,0 |
33,7 |
34,9 |
24,5 |
|
4 станок |
25,0 |
31,3 |
30,6 |
32,0 |
29,5 |
32,5 |
34,0 |
35,7 |
26,1 |
31,9 |
|
|
|
|
|
19 |
|
|
|
|
|
|
PDF created with pdfFactory Pro trial version www.pdffactory.com
Часть 2. Критерий Стьюдента сравнения средних
Используется для проверки предположения о том, что средние значения двух показателей, представленных выборками, значимо раз- личаются. Существует три разновидности критерия: один – для свя- занных выборок, и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Если выборки не связаны, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Так же как и в случае сравнения дисперсий имеются 2 способа решения задачи, которые рассмотрим на примере.
ПРИМЕР 2. Имеются данные о средненедельных количествах продаж товара (тыс. шт.) до и после смены производителем оформле- ния упаковки.
до смены |
16 |
19 |
14 |
15 |
17 |
|
16 |
|
19 |
16 |
|
19 |
|
14 |
15 |
19 |
13 |
после смены |
18 |
19 |
21 |
15 |
19 |
18 |
15 |
20 |
17 |
16 |
21 |
15 |
Можно ли с вероятностью 0,99 считать, что смена упаковки привела к среднему увеличению количества продаж?
По условию р=0,99, α=0,01, выборки не связаны, критерий односторонний, т.к. нужно показать, что средние показателя, пред- ставленного второй выборкой, больше чем у первой. Вводим в ячейки А1-М1 и А2-L2 исходные данные. Т.к. выборки несвязаны, то предва- рительно сравниваем дисперсии (сделать это самостоятельно анало- гично предыдущему примеру из п. 2 любым способом). В результате проверки дисперсии оказываются равными.
Первый способ решения задачи, как и в случае дисперсий, ис- пользовать стандартную функцию. Ею является ТТЕСТ(массив1;массив2;хвосты;тип), решающий задачу по t- критерию Стьюдента. В ячейке В4 вводим подпись «t-критерий», а в соседнюю С4 функцию ТТЕСТ (категория «Статистические») Аргу- менты функции:
-массив1, массив2 – исходные данные (ссылки на А1-М1 и А2-L2);
-хвосты – вид критерия: если 1 – односторонний критерий, если 2 – двусторонний (в нашем случае ставится единица);
-тип – тип критерия: если выборки связаны, то 1, для несвязанных выборок с равными дисперсиями – ставим 2, для несвязанных выборок
снеравными дисперсиями ставим 3. В нашем случае дисперсии рав- ны, поэтому выбираем 2.
Функция возвращает критическое значение уровня значимо- сти, имеющего смысл ошибиться, приняв гипотезу о различии сред- них. Если критическое значение больше заданного, то средние нужно считать равными. Результат в нашем случае 0,0476828 больше задан-
20
PDF created with pdfFactory Pro trial version www.pdffactory.com