- •Тема 7. Дисперсійний аналіз
- •1. Суть і завдання дисперсійного аналізу
- •2. Принципова схема дисперсійного аналізу.
- •3. Особливості дисперсійного аналізу соціально-економічних явищ.
- •1. Суть і завдання дисперсійного аналізу
- •2. Принципова схема дисперсійного аналізу.
- •Розрахунок загальної дисперсії за індивідуальними даними
- •3. Особливості дисперсійного аналізу соціально-економічних явищ.
2. Принципова схема дисперсійного аналізу.
При дисперсійному аналізі одночасно обробляють дані декількох вибірок (варіантів), що складають єдиний статистичний комплекс, оформлений в вигляді спеціальної робочої таблиці. Структура статистичного комплексу та його послідуючий аналіз визначається схемою та методикою експерименту.
Якщо обробляють однофакторні статистичні комплекси, що складаються із декількох незалежних вибірок, наприклад l-варіантів, то загальна мінливість результативної ознаки, яка виміряється загальною сумою квадратів (загальною дисперсією) СY (σ2), розкладається на два компоненти: варіація між вибірками (варіантами) або міжгрупова дисперсія Сv (δ2) та всередині вибірок СZ (), або внутрішньо групової дисперсії. Отже, в загальній формі мінливість ознаки може бути представлена виразом:
Це співвідношення називають правилом додавання дисперсій, за яким, знаючи два види дисперсій, можна визначити третій.
Порядок застосування дисперсійного аналізу для однофакторного дисперсійного комплексу розглянемо на прикладі показників діяльності умовних підприємств, наведених в таблиці 7.1.
Таблиця 7.1.
Розрахунок загальної дисперсії за індивідуальними даними
-
№ підприємства
Прибуток,
млн. грн. yi
Y2i
1
3
9
2
4
16
3
4
16
4
6
36
5
8
64
6
7
49
7
11
121
8
14
196
9
18
324
10
17
289
Разом
92
1120
Загальна дисперсія:
Таблиця 7.2.
Розрахунок міжгрупової дисперсії за результатами групування
№ з/п |
Групи підприємств за обігом коштів, млн. грн. |
Кількість підприємств, f |
Середній прибуток, млн. грн. |
|||
1 |
7-20 |
4 |
4,3 |
-4,9 |
24,01 |
96,04 |
2 |
20-33 |
3 |
8,7 |
-0,5 |
0,25 |
0,75 |
3 |
33-46 |
3 |
16,3 |
7,1 |
50,41 |
151,23 |
|
Разом |
10 |
9,2 |
|
|
248,02 |
Міжгрупова дисперсія:
Середня з групових дисперсій (внутрішньогрупова):
Суть дисперсійного аналізу, як було сказано вище, полягає у зіставленні (порівнянні) різних видів дисперсій: міжгрупової та загальної, загальної та внутрішньогрупової, міжгрупової та внутрішньогрупової. У нашому прикладі вплив розміру обігу коштів підприємств як групувального фактора на розмір прибутку майже у 10 разів (24,802 : 2,558 = 9,7) більший, ніж вплив інших випадкових факторів. Міжгрупова варіація становить 90,6 % у загальній варіації прибутку (24,802 : 27,36 = 0,906).
Для вимірювання тісноти (щільності) зв'язків між ознаками застосовується кореляційний метод, суть якого полягає у визначенні спеціальних співвідношень, що базуються на правилі додавання дисперсій.
Відношення міжгрупової (факторної) дисперсії до загальної розглядається як міра щільності кореляційного зв'язку і називається коефіцієнтом детермінації (D).
(6)
За статистичною структурою це відношення є часткою варіації результативної ознаки, яка пов'язана з варіацією ознаки х. Здобувши квадратний корінь із цього відношення, одержуємо емпіричне кореляційне відношення.
(7)
У нашому прикладі:
Таким чином, в обстеженій сукупності підприємств 90,65 % варіації прибутку пов'язані з варіацією обігу коштів.
Кореляційне відношення змінюється від 0 до 1. Якщо r =0, то міжгрупова дисперсія дорівнює нулю. Це можливо лише за умови, коли всі групові середні однакові і кореляційний зв'язок між ознаками відсутній. При r =1 міжгрупова дисперсія дорівнює загальній, а середня з групових - нулю. В цьому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв'язок між ознаками функціональний.
Слід підкреслити, що значення D > 0 не завжди є доказом наявності кореляційного зв'язку між ознаками. Відмінне від нуля кореляційне відношення може з'явитись і при випадковому розподілі сукупності на групи.
Перевірка істотності відхилень групових середніх здійснюється за допомогою критеріїв математичної статистики. Вона ґрунтується на порівнянні фактичного значення D з так званим критичним. Останнє є тим максимально можливим значенням кореляційного відношення, яке може виникнути випадково при відсутності кореляційного зв'язку. Якщо фактичне значення D більше від критичного, то зв'язок між результативною і факторною ознаками вважається істотним. Якщо фактичне значення D менше критичного, то наявність кореляційного зв'язку між ознаками не доказана і зв'язок вважається неістотним.
Для оцінки надійності кореляційних характеристик використовують критерії Фішера (F) або Стьюдента (t).
Критерій Фішера (F-критерій) визначається за формулою:
(9)
де - міжгрупова дисперсія; - середня групова (залишкова) Дисперсія; k1 і k2 - ступені вільності (свободи) для великої і малої дисперсій. Фішер знайшов розподіл відношень дисперсій і розробив відповідні математичні таблиці, в яких наводиться F-критерій теоретичний FТ при двох ймовірностях 0,95 і 0,99. Якщо FФ < FТ., то з прийнятим ступенем ймовірності можна стверджувати про наявність впливу фактора, який вивчається. Коли ж FФ < FТ то різниця між дисперсіями зумовлена впливом випадкових факторів.
Розподіл у таблицях Фішера для знаходження FТ.залежить від ступенів вільності міжгрупової k1 і середньої з групових k2 дисперсій. В аналітичному групуванні їх обчислюють за формулами:
k1=m-1; k2 =n-m (10)
де n - кількість елементів досліджуваної сукупності; т - число груп.
За даними наведеного вище прикладу (табл. 2):
k1=m-1=3-1=2; k2 =n-m=10-3=7
Знаходимо Fт при ймовірності 0,95 і даних ступенях вільності за математичною таблицею. Воно становить Fт(0,95) = 4,8.
Отже, Fф < Fт (2,7 < 4,8), що свідчить про суттєвий вплив обігу коштів підприємств на їх прибуток.
Надійність кореляційного відношення за критерієм Стьюдента (t - критерію)
(11)
де - середня похибка кореляційного відношення
(12)
Якщо критерій Стьюдента tn ≥ 3, показник кореляційного відношення вважають вірогідним (тобто зв'язок між досліджуваними явищами є доведеним). Якщо ж критерій tn < 3, то висновки про вірогідність зв'язку між досліджуваними явищами сумнівні.
Комбінаційні аналітичні групування і дисперсійний аналіз використовують для вивчення зв'язку результативної ознаки з двома і більше факторними ознаками. Вони дають можливість аналізувати залежність результативної ознаки від кожного з факторів при фіксованих значеннях інших. Методи вимірювання такого зв'язку і перевірку його істотності називають багатофакторними дисперсійними комплексами. Вони пов'язані з громіздкими розрахунками і потребують використання ЕОМ.