Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика-2007 методичка.doc
Скачиваний:
252
Добавлен:
11.02.2016
Размер:
946.69 Кб
Скачать

8.3. Основи кореляційно-регресійного аналізу.

У моделі регресійного аналізу характеристикою кореляційного зв’язку є теоретична лінія регресії , яка являється безперервною і описується функцією:

Y=ƒ(х) яка називаєтьсярівнянням регресії

Залежно від характеру зв’язку використовують:

- лінійні рівняння Y=a+bx, коли із змінноюХознакаУзмінюється більш менш рівномірно;

- нелінійні рівняння, коли зміна взаємопов’язаних ознак відбувається нерівномірно (із прискоренням, уповільненням або із змінним напрямком зв’язку), зокрема:

а) степеневе Y=axb

б)гіперболічне Y=a+b/x

в)параболічне Y=a+bx+cx2 тощо

У лінійному рівнянні параметр bназиваютькоефіцієнтом регресії. Він показує на скільки одиниць у середньому зміниться значення ознаки Y із зміною (збільшенням ) значення ознакиX на одиницю. Він має одиницю виміру результативної ознаки. У випадку прямого зв’язкуbвеличина додатна, а при зворотному – від’ємна.

Параметр a – це вільний член рівняння регресії, тобто це значенняY приx = 0 . Якщох не набуває нульових значень, цей параметр має лише розрахункове призначення. На етапі оцінки лінії регресії визначаються параметри обраного рівнянніметодом найменших квадратів, згідно з яким сума квадратів відхилень емпіричних значеньувід теоретичнихY мінімальна: ∑(y–Y)2→min

Для обчислення параметрів (a,b) треба скласти і розв’язати систему нормальних рівнянь.

звідси

Визначення тісноти зв’язку у кореляційно-регресійному аналізі , як і в методі аналітичного групування, ґрунтується на правилі складання дисперсій. На відміну від аналітичного групування, де оцінками лінії регресії є групові середні результативної ознаки, в кореляційно-регресійному аналізі – теоретичні значення результативної ознаки.Дисперсію теоретичних значень називаютьфакторною і обчислюють:

Як і в аналітичному групуванні, вона характеризує варіацію результативної ознаки у, пов’язану з варіацією факторної ознаких.

Замість середньої з групових дисперсій обчислюють залишкову дисперсію.

Залишкова дисперсія характеризує варіацію результативної ознаки у, не пов’язану з варіацією факторної ознаких.

Мірою тісноти зв’язку в кореляційно-регресійному аналізі є коефіцієнт детермінаціїR2 , аналогічний кореляційному відношенню:

Цей коефіцієнт характеризує ту частину варіації результативної ознаки y, яка відповідає лінійному рівнянню регресії. Коефіцієнт детермінаціїR2, як і кореляційне відношення, приймає значення від 0 до 1 .

При R2 = 0 теоретична дисперсія=0, всі теоретичні значенняYзбігаються з середнім значенняму. Лінійний кореляційний зв’язок міжхтаувідсутній .

При R2 = 1 теоретична дисперсія дорівнює загальні, залишкова дорівнює нулю, емпіричні значенняуі теоретичніYзбігаються, зв’язок між ознаками хта улінійно-функціональний.

Індекс кореляції – це корінь квадратний з коефіцієнта детермінації, він змінюється від 0 до 1 і характеризує тісноту зв’язку, але економічної суті немає.

    1. Оцінка щільності та перевірка істотності кореляційного зв’язку. Множинна регресія.

Поряд з визначенням характеру зв’язку та ефектів впливу факторів хна результатуважливе значення має оцінка щільності зв’язку, тобто оцінка узгодженості варіації взаємопов’язаних ознак. Якщо вплив факторної ознаких на результативну у значний, це виявиться в закономірній зміні значеньузі зміною значеньх, тобто фактор хсвоїм впливом формує варіаціюу. За відсутністю зв’язку варіаціяуне залежить від варіаціїх.

Для оцінки щільності зв’язку статистика використовує низку коефіцієнтів з такими спільними властивостями:

1). За відсутності будь-якого зв’язку значення коефіцієнта наближається до нуля; при функціональному зв’язку – до 1.

2). За наявності кореляційного зв’язку коефіцієнт виражається дробом, який за абсолютною величиною тим більший, чим щільніший зв’язок.

Для вимірювання тісноти зв’язку при лінійній залежності використовують лінійний коефіцієнт кореляції Пірсона:

Однією з модифікацій зазначеної формули є :

або

Чим щільніший зв’язок між ознаками х тау, тим більша алгебраїчна сума добутків відхилень .

Значення r коливаються від –1 до +1 і характеризують не тільки тісноту , але й напрям зв’язку.Додатне значення r означаєпрямий зв’язок між ознаками, від’ємне – зворотний. На практиці застосовують різні модифікації лінійного коефіцієнту кореляції, наприклад таку:

=

Перевірка істотності зв’язку в кореляційно-регресійному аналізі здійснюється таким же чином, як і в моделі аналітичного групування, шляхом порівняння R2 і R21-a( k1, k2 ) (тобто фактичне значення з його критичним значенням, де а – це певний рівень істотності, аk1 і k2 – це число ступенів свободи).

У невеликих за обсягом сукупностяхкоефіцієнт регресіїсхильний довипадкових коливань. Томуслід визначити межі цих коливань,тобто довірчий інтервал коефіцієнта регресії.Середня помилка коефіцієнта регресіїобчислюється за формулою.

Величина граничної помилки залежить від імовірності Р:

Δх=tμx де коефіцієнт довіри при імовірності = 0,954t = 2, а гранична помилка у два рази більше від середньої.

Як правило кореляційно-регресійний аналіз проводиться за не згрупованими даними, але вихідна інформація може бути подана у вигляді аналітичного групування або комбінаційного розподілу.

Множинна регресіядає змогу оцінити зв’язок результативної ознаки з будь-якою факторною при фіксованому значенні інших, включених в регресійну модель. На практиці часто використовують множинні, факторні (багатофакторні лінійні) рівняння регресії, коли на величину результативної ознаки впливають два, три і більше факторів. Також можуть використовуватись рівняння, що приводяться до лінійного виду відповідними перетвореннями, тобто:

Y=b0+b1x1+b2x2+ … +bmxm

Параметр рівняння biназивають частинним коефіцієнтом регресії. Він показує, як у середньому змінюється результативна ознакаyзі зміною факторної ознаки хі на одиницю за умови, що інші факторні ознаки залишаються незмінними.

Для визначення параметрів b0 , b1bm треба скласти і розв’язати систему нормальних рівнянь:

.................................................................