- •Статистика Методические указания по выполнению практических и лабораторных работ
- •Часть 3
- •Содержание
- •Введение
- •Практическая работа 5 дисперсионный анализ
- •Статистические данные для самостоятельного решения задач
- •Статистические данные для самостоятельного решения задач
- •Лабораторная работа 7 однофакторный дисперсионный анализ в ппп “statistica”
- •Дисперсионный анализ в ппп “Statistica”.
- •Лабораторная работа 8 дисперсионный анализ в ms excel
- •1 Однофакторный дисперсионный анализ
- •2 Двухфакторный дисперсионный анализ без повторений
- •3 Двухфакторный дисперсионный анализ с повторениями
- •Рекомендуемая литература
- •Приложение а
- •Приложение б
Статистические данные для самостоятельного решения задач
ЗАДАНИЕ 1
Вариант 1.
Известны данные о прибыли 24 предприятий, млн. руб.:
26,0 |
30,0 |
27,3 |
38,1 |
30,0 |
28,0 |
31,5 |
40,0 |
30,0 |
21,5 |
33,0 |
35,1 |
29,1 |
20,0 |
33,0 |
31,5 |
30,0 |
29,1 |
25,1 |
34,1 |
29,1 |
30,0 |
33,5 |
22,0 |
Определить степень влияния опыта работы предприятий на величину прибыли, если известно, что первые 10 предприятий имели опыт работы менее 2-х лет, а остальные 14 – более 2-х лет.
Вариант 2.
Известны данные об объеме вложений в ценные бумаги 24 банков России, млрд. руб.:
2,7 |
4,6 |
4,0 |
3,7 |
4,1 |
3,2 |
4,8 |
1,9 |
4,8 |
4,0 |
4,9 |
4,3 |
2,8 |
4,3 |
3,2 |
2,4 |
4,0 |
3,7 |
4,0 |
3,4 |
5,6 |
3,4 |
4,6 |
2,5 |
Определить степень влияния прибыли на объемы вложений в ценные бумаги, если первые 15 банков имели прибыль до 50 млрд. руб., а остальные 9 – свыше 50 млрд. руб.
Вариант 3.
Имеются данные о чистых активах 24 банков России, млрд. руб.:
39,9 |
49,5 |
44,2 |
54,2 |
42,9 |
39,6 |
43,0 |
35,1 |
42,9 |
39,6 |
48,6 |
41,7 |
48,1 |
41,0 |
49,0 |
43,0 |
39,1 |
51,8 |
39,6 |
45,0 |
39,0 |
39,9 |
49,0 |
39,6 |
Определить степень влияния прибыли на величину чистых активов, если известно, что первые 10 банков имели прибыль до 111 млрд. руб., а остальные 14 – свыше 111 млрд. руб.
Вариант 4.
Имеются данные о кредитных вложениях 24 банков России, млрд. руб.:
19,8 |
21,4 |
19,9 |
21,1 |
19,9 |
24,0 |
21,1 |
22,0 |
18,0 |
21,5 |
26,0 |
18,9 |
24,2 |
18,2 |
24,6 |
19,9 |
18,5 |
23,5 |
19,5 |
25,0 |
20,0 |
23,0 |
21,5 |
19,8 |
Определить степень влияния ставки кредитов на величину кредитных вложений банков, если известно, что кредитные вложения до 20 млрд. руб. имели банки с минимальной ставкой кредита, а свыше 20 млрд. руб. – с максимальной ставкой кредита.
Вариант 5.
Известны данные о прибыли 24 предприятий региона, млн. руб.:
15,2 |
23,9 |
17,7 |
16,9 |
13,2 |
19,1 |
26,2 |
17,6 |
22,7 |
20,0 |
19,1 |
15,1 |
14,3 |
23,1 |
11,6 |
17,6 |
22,5 |
26,2 |
19,1 |
16,9 |
23,1 |
24,1 |
17,7 |
14,7 |
Определить степень влияния формы собственности предприятия на прибыль, если известно, что величина прибыли до 17 млн. руб. принадлежит АО, а свыше 17 млн. руб. – кооперативам.
Вариант 6.
Известны данные о заработной плате 24 работников фирмы, тыс. руб.:
3,3 |
2,4 |
2,6 |
3,0 |
1,8 |
4,2 |
2,2 |
2,9 |
4,2 |
2,8 |
3,5 |
2,5 |
2,6 |
2,8 |
1,5 |
2,6 |
2,4 |
3,5 |
2,3 |
2,5 |
3,0 |
2,9 |
3,3 |
2,6 |
Определить степень влияния формы оплаты труда на заработную плату работников, если работники со сдельной оплатой труда имели заработную плату до 3 тыс. руб., с повременной – свыше 3 тыс. руб.
ЗАДАНИЕ 2
Необходимо проанализировать производительность труда рабочих одного из цехов НПО “Виктория”. С этой целью была образована контрольная группа рабочих, имеющих стаж работы до 1 года, во вторую группу вошли рабочие со стажем от 1 до 3 лет и в третью группу объединили рабочих с большим стажем. Для чистоты эксперимента были сформированы пять групп, приблизительно равноценных по показателям. Результаты приведены в таблице 10.
Таблица 10 - Производительность труда рабочих цеха НПО “Виктория”, деталей за смену, штук.
Номер варианта |
Вариант опыта |
Повторность |
||||
1 |
2 |
3 |
4 |
5 |
||
1 |
I группа (контр.) |
411 |
419 |
426 |
432 |
430 |
II группа |
460 |
472 |
478 |
480 |
470 |
|
III группа |
475 |
440 |
500 |
482 |
495 |
|
2 |
I группа |
278 |
285 |
200 |
256 |
291 |
II группа |
330 |
319 |
344 |
336 |
327 |
|
III группа |
378 |
388 |
391 |
387 |
399 |
|
3 |
I группа |
426 |
440 |
434 |
442 |
437 |
II группа |
540 |
535 |
560 |
550 |
552 |
|
III группа |
552 |
546 |
564 |
558 |
560 |
|
4 |
I группа |
511 |
519 |
526 |
532 |
530 |
II группа |
560 |
572 |
578 |
580 |
570 |
|
III группа |
575 |
540 |
600 |
582 |
595 |
|
5 |
I группа |
464 |
470 |
472 |
468 |
480 |
II группа |
478 |
482 |
500 |
498 |
502 |
|
III группа |
530 |
536 |
540 |
527 |
534 |
|
6 |
I группа |
328 |
336 |
327 |
319 |
329 |
II группа |
423 |
426 |
411 |
409 |
411 |
|
III группа |
456 |
462 |
468 |
470 |
457 |
Пример 3. Дисперсионный анализ при группировке данных по двум признакам (неслучайное распределение повторностей в группе)
Проанализировав результаты по реализации литературы (пример 2), правление фирмы пришло к выводу о необходимости продолжения эксперимента. Цель опыта состояла в том, чтобы уловить эффект взаимодействия между стажем работы и полом сотрудников.
Участники эксперимента предварительно были разделены на 2 части (блока). Одну часть (блок) составляли одни мужчины, другую – женщины. Каждый блок включал в себя группы по стажу работы: контроль – проработавшие в этой сфере менее года, 1 гр. – со стажем 1 год, 2 гр. – соответственно – 2 года и 3 гр. – 3 и более лет. Опыт проведен в трехкратной повторности. Следовательно, распределение в каждом варианте неслучайное.
Результаты эксперимента приведены в таблице 11.
Таблица 11 - Количество проданной научной литературы, шт. (в среднем за месяц)
Пол |
Вариант опыта |
Повторности |
Сумма |
Средние |
||
1 |
2 |
3 |
||||
Мужской |
Контроль |
133 |
154 |
134 |
421 |
140 |
Стаж: |
|
|
|
|
|
|
1 год |
162 |
171 |
179 |
512 |
171 |
|
2 года |
200 |
214 |
210 |
624 |
208 |
|
3 года |
240 |
217 |
229 |
686 |
229 |
|
Суммы |
735 |
756 |
752 |
2243 |
Х |
|
Средние по группе |
184 |
189 |
188 |
Х |
187 |
|
Женский |
Контроль |
211 |
186 |
190 |
587 |
196 |
Стаж: |
|
|
|
|
|
|
1 год |
222 |
216 |
214 |
652 |
217 |
|
2 года |
228 |
214 |
230 |
672 |
224 |
|
3 года |
235 |
231 |
246 |
712 |
237 |
|
Суммы |
896 |
847 |
880 |
2623 |
Х |
|
Средние по группе |
224 |
212 |
220 |
Х |
219 |
|
|
Суммы |
1631 |
1603 |
1632 |
4866= |
Х |
Средние по повторностям |
204 |
201 |
204 |
Х |
203 |
|
Средние по подгруппам: |
|
|
|
|
|
|
Контроль |
172 |
170 |
162 |
Х |
168 |
|
Стаж: |
|
|
|
|
|
|
1 год |
192 |
194 |
197 |
Х |
194 |
|
2 года |
214 |
214 |
220 |
Х |
216 |
|
3 года |
238 |
224 |
238 |
Х |
233 |
Требуется оценить достоверность различий между средними по вариантам опыта, используя дисперсионный метод анализа.
Решение.
Выдвигаем гипотезу о том, что факторы не оказывают влияния на реализацию литературы. Заключение по гипотезе сделаем с вероятностью 0,05. Количество реализуемой литературы варьировало в зависимости от пола, стажа работы, от сочетания этих факторов, от различий в составе групп, а так же не исключается случайное варьирование. Исходя из перечисленного, общую сумму квадратов отклонений следует представить как сумму:
Разложение проведем в два этапа.
На первом этапе разложим:
;
а на втором -
.
Определим число наблюдений. Анализируются 2 части (блока), т.е. k = 2. Второй фактор – стаж работы имеет 4 группы, l = 4. Каждый вариант представлен 3 повторами, т.е. n = 3. Общее число наблюдений N = k · l · n = 2 · 4 · 3 = 24.
Для упрощения вычислений выразим результаты эксперимента в отклонениях от постоянной величины А. За А принимается величина, близкая к общей средней (А = 200).
Результаты занесем в таблицу 12.
Таблица 12 - Таблица отклонений.
Пол |
Вариант опыта |
Повторности |
Сумма |
||
1 |
2 |
3 |
|||
Мужской |
Контроль |
-67 |
-46 |
-66 |
-179 |
Стаж: |
|
|
|
|
|
1 год |
-38 |
-29 |
-21 |
-88 |
|
2 года |
0 |
14 |
10 |
24 |
|
3 года |
40 |
17 |
29 |
86 |
|
Женский |
Контроль |
11 |
-14 |
-10 |
-13 |
Стаж: |
|
|
|
|
|
1 год |
22 |
16 |
14 |
52 |
|
2 года |
28 |
14 |
30 |
72 |
|
3 года |
35 |
31 |
46 |
112 |
|
Сумма |
31 |
3 |
32 |
66 |
3. Проверим правильность проведенных преобразований:
Определим общую сумму квадратов, суммы квадратов всех вариантов опыта, повторностей:
.
Возводя в квадрат данные табл. 12, получим значения для определения и . Результаты вычислений поместим в таблицу 13:
Таблица 13 - Таблица квадратов отклонений.
Пол |
Вариант опыта |
Повторности |
Сумма квадратов |
Квадрат сумм |
||
1 |
2 |
3 |
||||
Мужской |
Контроль |
4489 |
2116 |
4356 |
10961 |
32041 |
1 год |
1444 |
841 |
441 |
2726 |
7744 |
|
2 года |
0 |
196 |
100 |
296 |
576 |
|
3 года |
1600 |
289 |
841 |
2730 |
7396 |
|
Женский |
Контроль |
121 |
196 |
100 |
417 |
169 |
1 год |
484 |
256 |
196 |
936 |
2704 |
|
2 года |
784 |
196 |
900 |
1880 |
5184 |
|
3 года |
1225 |
961 |
2116 |
4302 |
12544 |
|
Сумма квадратов |
10147 |
5051 |
9050 |
24248 |
68358 |
|
Квадрат сумм |
961 |
9 |
1024 |
1994 |
4356 |
Воспользуемся данными таблицы и рассчитаем:
4. Определим число степеней свободы вариации:
Проведем предварительный анализ дисперсий, разделив суммы квадратов отклонений на соответствующее число степеней свободы (табл. 14):
Таблица 14 - Предварительный анализ дисперсий.
Источник вариации |
Сумма квадратов отклонений |
Степень свободы вариации |
Дисперсия |
Отношение дисперсий |
|
Fфакт |
Fтабл |
||||
Пол + стаж |
22604,0 |
7 |
3229,1 |
32,4 |
2,77 |
Повторности |
67,3 |
2 |
33,7 |
Х |
Х |
Остаточная |
1394,7 |
14 |
99,6 |
1 |
Х |
Общая |
24066,0 |
23 |
X |
|
|
5. По приложению А определяем Fтабл. При 5% уровне вероятности для 7 и 14 степеней свободы .
.
Проведя предварительный анализ существенности средних (Fфакт > Fтабл ), делаем вывод о достоверности различий в средних и целесообразности перехода к дальнейшим расчетам.
Приступим к рассмотрению вариации реализованной литературы, которая характеризуется различиями по полу, стажу и их взаимодействием. Для этого, используя суммы отклонений по повторностям (табл. 12), составим вспомогательную таблицу:
Таблица 15 - Отклонения по вариантам опыта.
Пол |
Контроль |
Стаж работы, лет |
Сумма |
||
1 |
2 |
3 |
|||
Мужской |
-179 |
-88 |
24 |
86 |
-157 |
Женский |
-13 |
52 |
72 |
112 |
223 |
Сумма |
-192 |
-36 |
96 |
198 |
66 |
Результаты вычислений возведем в квадрат и занесем в таблицу:
Таблица 16 - Таблица квадратов отклонений по вариантам опыта.
Пол |
Контроль |
Стаж работы, лет |
Сумма |
Квадрат суммы |
||
1 |
2 |
3 |
||||
Мужской |
32041 |
7744 |
676 |
7396 |
47857 |
24025 |
Женский |
169 |
2704 |
5184 |
12544 |
20601 |
49729 |
Сумма |
32210 |
10448 |
5860 |
19940 |
68458 |
73754= |
Квадрат сумм |
36864 |
1296 |
9604 |
39204 |
86968= |
4624= |
Полученная таблица квадратов позволяет установить:
(вычисление см. в п.3)
Определим число степеней свободы:
Перейдем к заключительному этапу анализа. Объединим результаты вычислений в общую таблицу:
Таблица 17 - Анализ дисперсий.
Источник вариации |
Сумма квадратов отклонений |
Степень свободы вариации |
Дисперсия |
Отношение дисперсий |
|
Fфакт |
Fтабл |
||||
Пол |
5953,5 |
1 |
5953,5 |
59,7 |
4,60 |
Стаж |
14302,0 |
3 |
4767,3 |
47,8 |
3,34 |
Взаимодействие факторов |
2348,5 |
3 |
782,8 |
7,8 |
3,34 |
Повторности |
67,3 |
2 |
33,7 |
0,3 |
3,74 |
Остаточная |
1394,7 |
14 |
99,8 |
1,0 |
X |
Общая |
24066,0 |
23 |
X |
X |
X |
Путем сопоставлений вычислим фактическое отношение дисперсий. За базу сравнения принимается . Например:
и т.д.
По таблице 5%-го уровня распределения F (см. приложение А) установим Fтабл (аналогично тому, как это было сделано в примере 2).
Сопоставление Fфакт с Fтабл показывает, что существенны различия в среднем количестве реализуемой литературы по первому и второму факторам. Значительно менялось количество литературы и в результате взаимодействия факторов. Таким образом, приходим к выводу, что выдвинутая гипотеза о том, что различия в количестве реализуемой литературы случайны, должна быть отвергнута.
Поскольку выдвинутая первоначально гипотеза на основании данных дисперсионного анализа отвергнута, следует оценить достоверность различий между парами средних.
Для этого вычислим среднюю и предельную ошибки.
шт / в месяц,
.
При вероятности 0,05 и 14 степенях свободы вариации критическое значение нормированного отклонения t (см. приложение Б) составляет 2,1448 ≈ 2,14.
Предельная ошибка:
шт. в месяц.
Следовательно, величина возможных случайных колебаний при данном уровне вероятности не должна превышать 17,5 шт. в месяц.
Определим существенность разности в количестве реализованной литературы.
Выполним следующие сопоставления (см. табл. 11).
В первом блоке, который составили одни мужчины, все разности между средним количеством проданной литературы при меняющемся стаже работы существенны, так как превышают по абсолютной величине предельную ошибку ε 0,05=17,5 шт. в месяц.
В о втором блоке, представленном женщинами, две из шести разностей лежат в границах случайных колебаний. Несущественны разности то есть увеличение стажа работы с одного года до двух и с двух до трех дают соответственно разности в количестве проданной литературы 7 и 13 шт. в месяц, что меньше предельной ошибки.
Четыре из шести приведенных разностей больше 17,5 шт. в месяц и, следовательно, они существенны, а две – несущественны.
Таким образом, в рассмотренном примере, когда анализируется работа женщин, несколько ослабляется воздействие стажа на объем проданной литературы.
В целом же, в десяти случаях из двенадцати разности превышают по абсолютной величине предельную ошибку, что позволяет рассматривать их как существенные.