Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Книга 1

.pdf
Скачиваний:
34
Добавлен:
07.05.2015
Размер:
480.86 Кб
Скачать

мер D1), ставим флажок напротив «Описательная статистика» (Summary Statistics), нажимаем «ОК». Результат основные характеристики выборки (сделайте шире столбец D, переместив его границу в заголов- ке).

Задание 1. Для данных из задания 4 лабораторной работы № 1 вычислить основные числовые характеристики выборки обоими спо- собами.

Часть 2. Интервальное оценивание.

Рассмотрим теперь методы интервального оценивания. Дове- рительным интервалом называется интервал (a;b) , в который с задан-

ной вероятностью р попадает оцениваемый параметр. Вероятность р называется доверительной. Вместо нее часто задают величину α = 1− p , называемую уровнем значимости. Если выборка объема п

представляет случайную величину, распределенную нормально, то

доверительные интервалы для матожидания и дисперсии равны

æ

S ×t

 

 

 

 

(n -1)

 

 

 

S ×t

 

(n -1) ö

 

ç

1−α

2

 

 

 

 

 

 

 

 

1−α

2

 

 

÷

 

mÎç x -

 

 

 

 

 

 

 

 

;

x +

 

 

 

 

 

 

 

 

÷

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

ç

 

 

 

 

n

 

 

 

 

 

 

 

÷

 

è

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ø

 

 

æ

 

2

 

 

 

 

 

 

2

 

 

 

 

ö

 

 

 

s2

ç

S

×(n -1)

 

S

×(n -1)

 

÷

 

 

 

Îç

 

 

 

;

 

 

÷

,

 

 

 

 

 

 

 

 

(n -1)

c2

(n -1)

 

 

 

ç c2

 

 

 

 

 

 

÷

 

 

 

 

è

1−α

2

 

 

 

α

2

 

 

 

ø

 

 

 

где t p (n) и c2p (n) - квантили распределения Стьюдента и хи-квадрат, α = 1− p .

Возвращаемся на лист 1 электронной таблицы с данными примера и для них вычислим доверительные интервалы при р=0,05. Вводим данные согласно рисунку:

 

S ×t1−α

2

(n -1)

Для вычисления величины

 

 

 

служит функция

 

 

 

 

 

n

«ДОВЕРИТ» категории «Статистические» с тремя параметрами «Аль- фа» - уровень значимости α = 1− p , «Станд_откл» - среднеквадрати-

ческое отклонение S, «Размер» - объем выборки п. Таким образом, вводим в Н3 функцию:

11

PDF created with pdfFactory Pro trial version www.pdffactory.com

=СРЗНАЧ(А1:А25)-ДОВЕРИТ(I1;СТАНДОТКЛОН(А1:А25);25)

а в ячейку I3 функцию:

=СРЗНАЧ(А1:А25)+ДОВЕРИТ(I1;СТАНДОТКЛОН(А1:А25);25)

Для вычисления доверительного интервала для дисперсии следует от- метить, что функция вычисления квантили распределения хи-квадрат (обратного распределения хи-квадрат) называется «ХИ2ОБР» (катего- рия «Статистические») и имеет два параметра: первый «Вероятность» содержит доверительную вероятность р, второй степень свободы п-1. Вводим в соответствии с данными условиями и формулой для довери- тельного интервала в ячейку Н4 запись:

=ДИСП(A1:A25)*24/ХИ2ОБР(0,025;24)

а в ячейку I4 запись: =ДИСП(A1:A25)*24/ХИ2ОБР(0,975;24).

Получаем значения границ доверительных интервалов.

Задание 2. Для данных из задания 4 лабораторной работы № 1

вычислить доверительные интервалы для матожидания и дисперсии при α = 0,01 . Изменяя значение уровня значимости α сделать вывод о его влиянии на ширину интервала.

Лабораторная работа № 3

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ О ВИДЕ РАСПРЕДЕЛЕНИЯ

Цель: Ознакомиться с методами проверки статистических гипотез о принадлежности генеральной совокупности, представлен- ной выборочными данными, к тому или иному типу распределений, используя критерий согласия Пирсона (хи-квадрат) с помощью ЭВМ.

Методы проверки статистических гипотез занимают цен- тральное место в исследованиях математической статистики. Одной из

важнейших групп критериев проверки статгипотез являются критерии проверки гипотез о виде распределений (критерии согласия). Они по

выборочным данным проверяют предположение о принадлежности генеральной совокупности к тому или иному виду распределений. Од- ним из наиболее мощных критериев согласия является критерий Пир- сона, называемый еще критерием хи-квадрат. Его суть заключается в сравнении теоретических частот элементов выборки ni (для дискрет- ных распределений) с теоретическими частотами ni′ = npi , где pi - ве-

роятность принять это значение, рассчитанное по исследуемому зако- ну распределения. Если распределение непрерывное, то строится группированный статистический ряд из k интервалов

12

PDF created with pdfFactory Pro trial version www.pdffactory.com

и pi = F(bi ) − F(ai ) есть вероятность попасть в i-й интервал группиров- ки (здесь F(x) - функция распределения проверяемого закона). Стати-

 

k

2

 

стикой критерия является величина χ2

= å

(n n)

. Критическое зна-

n

 

i=1

 

чение критерия равно обратному распределению хи-квадрат со степе-

нями свободы (k-r-1): χ2

= χ2

(k r −1) , где r число оцениваемых

kr

1−α

 

параметров закона распределения. Распределение можно считать соот- ветствующим теоретическому если выполняется условие χ2 < χ2kr .

Рассмотрим решение данной задачи на примере.

ПРИМЕР 1. Имеется выборка прибыли (тыс. руб.) коммерче- ской фирмы за 40 дней. Необходимо проверить статистическую гипо- тезу о том, что прибыль данной фирмы распределена по нормальному закону распределения. Взять уровень значимости α = 0,05 .

Выборка прибыли коммерческой фирмы за 40 дней (тыс. руб.)

64

56

69

78

78

83

47

65

77

57

61

52

50

58

60

48

62

63

68

64

64

64

79

66

65

62

85

75

88

61

82

52

72

75

84

66

62

73

64

74

Для проверки гипотезы о принадлежности генеральной сово- купности нормальному виду распределений необходимо строить груп- пированный статистический ряд, т.к. нормальное распределение явля- ется непрерывным. Для этого нужно знать размах выборки, который равен разнице между максимальным и минимальным элементами вы- борки. Кроме того, нужно рассчитать точечные оценки математиче- ского ожидания и среднеквадратического отклонения (СКО). Откры-

ваем электронную таблицу и вводим данные выборки в нее в ячейки А2-А41, делаем подписи для расчетных параметров в соответствии с рисунком:

Вычисляем параметры по выборке. Для этого вводим в ячейку В3: «=СЧЁТ(A2:A41)» (здесь и далее кавычки вводить не надо, функ- ции можно вводить с помощью мастера функций из категории «Стати- стические», как в лабораторной работе № 2, ссылки на ячейки можно

13

PDF created with pdfFactory Pro trial version www.pdffactory.com

ввести щелкнув мышью по ячейке). В В5 вводим: «=МАКС(A2:A41)»,

в В7: «=МИН(A2:A41)», в В9: «=СРЗНАЧ(A2:A41)», в В11: «=СТАНДОТКЛОН(A2:A41)».

Видно, что весь диапазон значений элементов лежит на интерва- ле от 47 до 88. Разобьем этот интервал на интервалы группировки: [0; 50], (50; 55], (55; 60], (60; 65], (65; 70], (70; 75], (75; 80], (80; 85], (85; 90]. Для этого вводим в ячейки С2-С11 границы интервалов:

Ячейка

С2

С3

С4

С5

С6

С7

С8

С9

С10

С11

Число

0

50

55

60

65

70

75

80

85

90

Для вычисления частот п используем функцию ЧАСТОТА. Для этого в D3 вводим формулу «=ЧАСТОТА(A2:A41;C3:C11)». Затем обводим курсором ячейки D3-D11, выделяя их и нажимаем F2, а затем одновременно Ctrl+Shift+Enter. В результате в ячейках D3-D11 ока- жутся значения частот.

Для расчета теоретической вероятности pi = F(bi ) − F(ai ) вво-

дим в ячейку Е3 разницу между функциями нормального распределе- ния (функция НОРМРАСП категории «Статистические») с параметра- ми: «Х» – значение границы интервала, «Среднее» - ссылка на ячейку В9, «Стандартное_откл» - ссылка на В11, «Интегральная» - 1. В ре- зультате в Е3 будет формула:

=НОРМРАСП(C3;$B$9;$B$11;1)-НОРМРАСП(C2;$B$9;$B$11;1)

Автозаполняем эту формулу на Е3-Е10 перемещая нижний правый угол Е3 до ячейки Е10. В последней ячейке столбца Е11 для соблюде- ния условия нормировки вводим дополнение предыдущих вероятно- стей до единицы. Для этого вводим в Е11: «=1-СУММ(E3:E10)»

Для расчета теоретической частоты ni′ = npi вводим в F3 форму- лу: «=E3*$B$3», автозаполняем ее на F3-F11.

Для вычисления элементов суммы

(n n)2

критерия Пирсона

n

 

 

вводим в G3 значение «=(D3-F3)*(D3-F3)/F3» и автозаполняем его на диапазон G3-G11.

Находим значение критерия χ2 и критическое значение χ2kr .

Для этого вводим в F12 подпись «Сумма», а в F13 подпись «Критич.». Вводим в соседние ячейки формулы в G12: «=СУММ(G3:G11)», а в G13: «=ХИ2ОБР(0,05;6)», здесь параметр α = 0,05 взят из условия, а

степень свободы (k-r-1)=(9-2-1)=6, так как k=9 – число интервалов группировки, а r=2, т.к. были оценены два параметра нормального

распределения: математическое ожидание и СКО. Видно, что χ2 < χ2kr ,

14

PDF created with pdfFactory Pro trial version www.pdffactory.com

то есть можно считать, что прибыль данной фирмы распределена по нормальному закону распределения.

Проверим это, построив графики плотностей эмпирического и теоретического распределений. Ставим курсор в любую свободную ячейку и вызываем мастер диаграмм (Вставка/Диаграмма). Выбираем тип диаграммы «График» и вид «График с маркерами» самый левый во второй строке, нажимаем «Далее». Ставим курсор в поле «Диапазон» и удерживая кнопку CTRL обводим мышью область ячеек D3-D11 а за- тем F3-F11. Переходим на закладку «Ряд» и в поле «Подписи оси Х» обводим область С3-С11. Нажимаем «Готово». Видно, что графики достаточно хорошо совпадают, что говорит о соответствии данных нормальному закону.

Задание 1. Дана выборка числа посетителей Интернет сайта за 30 дней. Проверить по критерию Пирсона на уровне значимости α = 0,02 статистическую гипотезу о том, что генеральная совокуп-

ность, представленная выборкой, имеет нормальный закон распреде- ления.

Вариант

 

 

 

 

 

 

Выборка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.

45

52

49

48

42

51

54

54

50

47

56

53

59

57

50

 

45

50

46

55

46

54

55

64

67

51

49

47

47

55

40

2.

48

43

52

42

38

57

47

47

51

52

55

53

50

46

53

 

50

49

58

53

44

51

49

53

51

51

48

45

46

49

54

3.

65

81

76

84

81

80

78

86

85

83

75

85

83

80

77

 

69

73

78

75

75

91

79

74

67

68

78

80

81

81

81

4.

75

82

79

78

72

81

84

84

80

77

86

83

89

87

80

 

75

80

76

85

76

84

85

94

97

81

79

77

77

85

70

5.

78

73

82

72

68

87

77

77

81

82

85

83

80

76

83

 

80

79

88

83

74

81

79

83

81

81

78

75

76

79

84

6.

70

59

57

62

49

63

59

60

57

66

64

57

59

58

59

 

56

62

56

57

63

59

55

58

62

61

60

59

59

61

63

7.

39

41

35

41

42

38

41

41

36

45

40

39

41

41

40

 

42

45

39

39

35

41

36

36

39

41

43

40

41

38

44

8.

15

31

26

34

31

30

28

36

35

33

25

35

33

30

27

 

19

23

28

25

25

41

29

24

17

18

28

30

31

31

31

9.

25

32

29

28

22

31

34

34

30

27

36

33

39

37

30

 

25

30

26

35

26

34

35

44

47

31

29

27

27

35

20

10.

59

60

65

50

55

64

66

63

55

62

60

58

67

58

65

 

63

59

57

65

56

66

59

59

60

61

65

59

50

64

63

11.

40

41

37

37

40

42

39

43

38

41

45

44

48

43

28

 

39

41

39

38

44

37

41

42

45

40

43

35

44

44

44

12.

54

59

55

57

44

42

52

55

49

53

51

50

61

59

53

 

46

47

44

52

49

48

56

40

52

46

46

45

52

59

57

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

PDF created with pdfFactory Pro trial version www.pdffactory.com

Критерий Пирсона также можно использовать для проверки предположения о том, что полученные в результате наблюдений дан- ные соответствуют нормам. Пусть имеются некоторые показатели, которые должны соответствовать стандартным нормам. Для проверки

из генеральной совокупности получается выборка значений данных показателей. Рассматривается гипотеза о том, что отклонения от норм невелики, и ими можно пренебречь. Рассмотрим проверку гипотезы на примере.

ПРИМЕР 2. На консервном заводе принимаемое зерно го- рошка считается высшего сорта, если в нем не менее 60 % зерна раз- мером более 7 мм в диаметре, не менее 20 % зерна размером 5-7 мм, 10 % зерна 4-5 мм и 10 % зерна менее 4 мм в диаметре. На завод привезли партию зерна, из которой отобрали одну тонну для проверки. В ре- зультате оказалась, что размером более 7 мм в диаметре 550 кг, зерна размером 5-7 мм 220 кг, зерна 4-5 мм 120 кг и зерна размером менее 4 мм 110 кг. Можно ли с вероятностью 0,95 ( α = 0,05 ) говорить о том,

что привезенное зерно высшего сорта?

Если бы зерно точно бы соответствовало норме, то его коли- чество из одной тонны распределялось бы по размерам как 600 кг, 200 кг, 100 кг и 100 кг. Введем в А1 заголовок «НОРМА» и ниже в А2-А5 показатели числа 600, 200, 100, 100. В ячейку В1 введем заголовок «НАБЛЮДЕНИЯ» и ниже в В2-В5 наблюдаемые показатели 550, 220, 120, 110. В третьем столбце вводятся формулы для критерия: в С1 за- головок «КРИТЕРИЙ», в С2 формулу «=(А2-В2)*(А2-В2)/А2». Авто- заполнением размножим эту формулу на С3-С5. В ячейку С6 запишем общее значение критерия сумму столбца С2-С5. Для этого поставим курсор в С6 и вызвав функции в категории «Математические» найдем СУММ и в аргументе «Число укажем ссылку на С2-С5. Получится результат критерия Z=11,16667. для ответа на вопрос, соответствуют ли опытные показатели нормам, Z сравнивают с критическим значени- ем Zкр. Вводим в D1 текст «критическое значение» в Е1 вводим функ- цию ХИ2ОБР (категория «Статистические») у которой два аргумента: «Вероятность» – вводится уровень значимости α = 1− p (в нашем слу-

чае 1-0,95=0,05) и «Степени_свободы» – вводят число n-1, где n – чис- ло норм (в нашем случае 4-1=3). Результат 7,814725. Видно, что кри- тическое значение меньше критерия, следовательно опытные данные

не соответствует стандартам и зерно с заданной вероятностью нельзя отнести к высшему сорту.

Задание 2. При производстве микросхем процессоров исполь- зуются кристаллы кварца. Стандартом предусмотрено, чтобы у 50 %

образцов не было обнаружено ни одного дефекта кристаллической

16

PDF created with pdfFactory Pro trial version www.pdffactory.com

структуры, у 15% - один дефект, у 13 % - 2 дефекта, у 12 % - 3 дефекта, у 10 % более 3 дефектов. При анализе выборочной партии оказалось, что из 1000 экземпляров распределение по дефектам следующее (вари- ант соответствует номеру ЭВМ):

Вариант

0 дефектов

1 дефект

2 дефекта

3 дефекта

более 3

1.

489

144

135

122

110

2.

491

145

134

125

105

3.

489

155

133

123

100

4.

483

153

132

130

102

5.

516

148

131

110

95

6.

508

152

129

111

100

7.

494

147

136

121

102

8.

492

155

128

120

105

9.

471

160

137

122

110

10.

471

159

135

127

108

11.

489

156

131

117

107

12.

486

153

136

119

106

Можно ли с вероятностью 0,99 (при α = 0,01) считать, что партия со- ответствует стандарту?

Лабораторная работа № 4

ПРОВЕРКА ГИПОТЕЗ О РАВЕНСТВЕ ДИСПЕРСИЙ И МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ

Цель: Используя F-критерии Фишера и t-критерий Стьюден- та научиться проверять гипотезы о равенстве дисперсий и матема- тических ожиданий (средних) с помощью ЭВМ.

Часть 1. Критерий Фишера сравнения дисперсий

Используется в случае, если нужно проверить различается ли разброс данных (дисперсии) у двух выборок. Это может использовать- ся, например, при сравнении точностей обработки деталей на двух станках, равномерности продаж товара в течении некоторого периода в двух городах и т.д. Для проверки статистической гипотезы о равен- стве дисперсий служит F- критерий Фишера. Основной характеристи-

кой критерия является уровень значимости α, который имеет смысла вероятности ошибиться, предполагая, что дисперсии и, следовательно,

точность, различаются. Вместо α в задачах также иногда задают дове- рительную вероятность p = 1− α , имеющую смысл вероятности того,

что дисперсии и в самом деле равны. Обычно выбирают критическое значение уровня значимости, например 0,05 или 0,1, и если α больше

17

PDF created with pdfFactory Pro trial version www.pdffactory.com

критического значения, то дисперсии считаются равными, в против- ном случае, различны. При этом критерий может быть односторонним, когда нужно проверить, что дисперсия конкретной выделенной выбор- ки больше, чем у другой, и двусторонним, когда просто нужно пока- зать, что дисперсии не равны. Существует два способа проверки таких гипотез. Рассмотрим их на примерах.

ПРИМЕР 1. Два автомата расфасовывают муку по мешкам, емкостью 50 кг. Необходимо проверить, можно ли с вероятностью не менее 0,95 считать, что точность расфасовки на обоих автоматах оди- накова. Для проверки гипотезы отбираются две выборки весов муки, расфасованной на первом и втором автомате:

1 автом. 47,5 52,9 51,3 48,1 52,6 49,4 48,0 52,3 45,9 52,6 46,8 49,0

2 автом. 52,5 50,5 48,4 48,6 50,6 50,0 50,1 49,5 49,7 51,1 49,2 49,7

По условию задачи критерий двусторонний, так как требуется проверить различие дисперсий (точностей). Доверительная вероят-

ность задана p=0.95,

следовательно, уровень значимости

α = 1− p = 1− 0,95 = 0,05 .

Вводим данные выборок (без подписей) в

две строчки в ячейки А1-L1 и А2-L2 соответственно. Для вычисления

уровня значимости двустороннего критерия служит функция ФТЕСТ(массив1;массив2). Вводим в А4 подпись «Уровень значимо- сти», а в В4 функцию ФТЕСТ, аргументами которой должны быть ссылки на ячейки А1-L1 и А2-L2 соответственно. Результат 0,011591293 говорит о том, что вероятность ошибиться, приняв гипо- тезу о различии дисперсий, около 0,01, что меньше критического зна- чения, заданного в условии задачи 0,05. Следовательно, можно гово-

рить что опытные данные с большой вероятностью подтверждают предположение о том, что дисперсии разные и точность расфасовки автоматов различна.

Другой способ решения задачи использовать надстройку «Анализ данных» (Data Analysis). Для ее подключения нужно в меню «СЕРВИС» выбрать «НАДСТРОЙКИ» и поставить флажок напротив «Пакет анализа» (Analysis ToolPak). После этого в меню «СЕРВИС» появится пункт «АНАЛИЗ ДАННЫХ» (Data Analysis). Вызвав его, откроется окно, в котором нужно выбрать «Двухвыборочный F-тест для дисперсий» (F-test Two-Sample for Variances). В открывшемся окне в полях «Интервал переменной 1» (Variable 1 Range) и «Интервал пе- ременной 2» (Variable 1 Range) вводят ссылки на данные (А1-L1 и А2- L2, соответственно), если имеются подписи данных, то ставят флажок у надписи «Метки» (Label) (у нас их нет, поэтому флажок не ставится). Далее вводят уровень значимости в поле «Альфа» (Alpha) (по условия это 0,05, и данное значение уже указано по умолчанию). В разделе «Параметры вывода» (Output Options) ставят метку около «Выходной интервал» (Output Range) и поместив курсор в появившееся поле на-

18

PDF created with pdfFactory Pro trial version www.pdffactory.com

против надписи, щелкают левой кнопкой в ячейке В7. Вывод результа- та будет осуществляться начиная с этой ячейки. Нажав на «ОК» появ- ляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умеща- лись все надписи. В таблице указаны средние и дисперсии каждой вы- борки, значение F-критерия, односторонний критический уровень зна- чимости в строке «P(F<=f) одностороннее» («Р(F<=f) one-tail») и кри- тическое значение F-критерия (F critical one tail). Если значение F- критерия ближе к единице, чем F-критическое, то с заданной вероят- ностью можно считать, что дисперсии равны. Об этом же говорит и то, что критический уровень значимости «P(F<=f) одностороннее» больше

заданного значения α. В нашем случае F-критерий равен 5,128330184 а F-критическое 2,817927225, то есть F-критерий дальше от единицы, чем критическое значение. Это говорит о том, что дисперсии различ- ны и автоматы имеют разную точность расфасовки.

Задание 1. Четыре станка в цеху обрабатывают детали. Для проверки точности обработки. взяли выборки размеров деталей у каж- дого станка. Необходимо сравнить с помощью F-теста попарно точно- сти обработки всех станков (рассмотреть пары 1-2, 1-3, 1-4, 2-3, 2-4, 3-4) и сделать вывод, для каких станков точности обработки (диспер- сии) равны, для каких нет. Взять уровень значимости α = 0,02 .

Вар.

 

 

Выборки размеров деталей

 

 

 

1,

1 станок

29,1

26,2

30,7

33,8

33,6

35,2

23,4

29,3

33,3

26,7

6,

2 станок

29,0

28,9

34,0

29,7

29,4

28,5

35,9

32,6

37,1

28,0

11

 

 

 

 

 

 

 

 

 

 

 

3 станок

25,7

27,5

25,4

28,9

29,9

30,1

29,0

36,6

24,8

27,8

 

4 станок

32,1

31,0

27,2

29,3

30,4

31,7

30,4

27,3

35,7

31,5

2,

1 станок

36,6

34,3

33,9

30,3

30,0

31,4

29,9

26,8

24,7

32,5

7,

2 станок

28,4

32,5

31,5

28,2

33,9

24,7

31,7

29,7

30,1

28,0

12

3 станок

33,1

30,4

33,4

29,6

27,7

33,2

28,3

31,6

31,6

29,1

 

4 станок

30,6

31,6

29,3

26,3

33,8

29,1

26,1

32,3

32,4

31,3

3,

1 станок

34,1

35,1

30,7

30,4

35,6

29,9

28,0

32,7

30,0

33,1

8

2 станок

30,8

34,4

30,3

26,6

25,8

30,6

32,9

25,5

28,2

31,6

 

3 станок

30,7

30,6

30,0

26,3

30,7

30,4

32,3

27,8

31,8

30,7

 

4 станок

30,6

31,3

27,0

27,4

31,4

30,4

28,4

30,3

27,2

27,3

4,

1 станок

28,1

27,1

33,6

32,8

24,8

33,8

29,4

26,6

24,4

27,5

9

2 станок

31,8

27,1

32,6

34,3

27,8

29,1

26,0

34,1

33,1

30,6

 

3 станок

27,1

34,6

26,5

28,8

26,1

34,8

30,1

31,0

32,9

35,8

 

4 станок

28,1

32,6

27,5

29,7

29,3

34,6

26,0

27,2

29,5

26,8

5,

1 станок

29,7

30,4

35,2

28,5

27,6

27,8

31,8

33,9

25,7

32,9

10

2 станок

30,0

33,0

27,0

32,3

33,7

26,5

31,2

24,7

30,2

33,0

 

3 станок

28,8

30,7

35,5

22,8

30,1

29,6

33,0

33,7

34,9

24,5

 

4 станок

25,0

31,3

30,6

32,0

29,5

32,5

34,0

35,7

26,1

31,9

 

 

 

 

 

19

 

 

 

 

 

 

PDF created with pdfFactory Pro trial version www.pdffactory.com

Часть 2. Критерий Стьюдента сравнения средних

Используется для проверки предположения о том, что средние значения двух показателей, представленных выборками, значимо раз- личаются. Существует три разновидности критерия: один для свя- занных выборок, и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Если выборки не связаны, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Так же как и в случае сравнения дисперсий имеются 2 способа решения задачи, которые рассмотрим на примере.

ПРИМЕР 2. Имеются данные о средненедельных количествах продаж товара (тыс. шт.) до и после смены производителем оформле- ния упаковки.

до смены

16

19

14

15

17

 

16

 

19

16

 

19

 

14

15

19

13

после смены

18

19

21

15

19

18

15

20

17

16

21

15

Можно ли с вероятностью 0,99 считать, что смена упаковки привела к среднему увеличению количества продаж?

По условию р=0,99, α=0,01, выборки не связаны, критерий односторонний, т.к. нужно показать, что средние показателя, пред- ставленного второй выборкой, больше чем у первой. Вводим в ячейки А1-М1 и А2-L2 исходные данные. Т.к. выборки несвязаны, то предва- рительно сравниваем дисперсии (сделать это самостоятельно анало- гично предыдущему примеру из п. 2 любым способом). В результате проверки дисперсии оказываются равными.

Первый способ решения задачи, как и в случае дисперсий, ис- пользовать стандартную функцию. Ею является ТТЕСТ(массив1;массив2;хвосты;тип), решающий задачу по t- критерию Стьюдента. В ячейке В4 вводим подпись «t-критерий», а в соседнюю С4 функцию ТТЕСТ (категория «Статистические») Аргу- менты функции:

-массив1, массив2 исходные данные (ссылки на А1-М1 и А2-L2);

-хвосты вид критерия: если 1 – односторонний критерий, если 2 – двусторонний (в нашем случае ставится единица);

-тип тип критерия: если выборки связаны, то 1, для несвязанных выборок с равными дисперсиями ставим 2, для несвязанных выборок

снеравными дисперсиями ставим 3. В нашем случае дисперсии рав- ны, поэтому выбираем 2.

Функция возвращает критическое значение уровня значимо- сти, имеющего смысл ошибиться, приняв гипотезу о различии сред- них. Если критическое значение больше заданного, то средние нужно считать равными. Результат в нашем случае 0,0476828 больше задан-

20

PDF created with pdfFactory Pro trial version www.pdffactory.com