- •Структура навчальної дисципліни «Статистика»
- •Тема 1. Методологічні засади статистики
- •Термінологічний словник
- •Завдання для самоконтролю
- •Тема 2. Статистичне спостереження
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 3. Зведення і групування статистичних даних
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 4. Подання статистичних даних: таблиці, графіки, карти
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 5. Узагальнюючі статистичні показники
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 6. Аналіз рядів розподілу
- •Термінологічний словник.
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 7. Аналіз концентрації, диференціації та подібності розподілів
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 8. Статистичні методи аналізу зв’язків
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 9. Аналіз інтенсивності динаміки
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 10. Аналіз тенденцій розвитку та коливань
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема11. Індекси
- •Термінологічний словник
- •Запитання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 12. Вибірковий метод
- •Термінологічний словник
- •Запитання для самоконтролю
- •Практичні завдання для самоконтролю
- •Список рекомендованої літератури
- •Ресурси
Тема 8. Статистичні методи аналізу зв’язків
Основні поняття та категорії:
кореляція;
кореляційно-регресійний аналіз;
криволінійна залежність;
лінійний коефіцієнт кореляції;
прямолінійна залежність;
регресія;
результативна ознака;
факторна ознака;
щільність зв’язку;
функціональний та стохастичний зв’язок.
Методичні вказівки.
Усі явища, що відбуваються в природі і суспільстві взаємозв’язані й взаємозумовлені. Розкриваючи взаємозв’язки і взаємозалежності між явищами, можна пізнати їх суть і закони розвитку. Тому вивчення взаємозв’язків є основним завданням статистичного аналізу.
Суспільні явища або окремі їх ознаки, які впливають на інші і обумовлюють їх зміну, називаються факторними, а суспільні явища або окремі їх ознаки, які змінюються під впливом факторних, називаються результативними (тобто характеризують наслідки).
Розрізняють два типи зв’язків – функціональні та стахостичні.
При функціональному зв’язку кожному значенню фактора х відповідає одне або кілька чітко визначених значень у.
Наприклад, залежність довжини ртутного стовпчика залежить від температури навколишнього середовища.
Стохастичним називається зв’язок, при якому кожному значенню факторної ознаки х відповідає декілька значень або певна множина значень ознаки у, які утворюють так званий умовний розподіл.
Якщо умовні розподіли змінюються одним параметром – середньою , то такий зв’язок називається кореляційним. Отже, кореляційний зв’язок є різновидом стохастичного і виявляється зміною середніх умовних розподілів.
Прикладом кореляційної залежності може служити залежність продуктивності праці від стажу роботи робочих, залежність врожайності від строку посіву і т.д.
В основі кореляційно-регресивного аналізу лежить припущення про те, що залежність між значенням факторної і результативної ознаки може бути представлена у вигляді функції:
і називається рівнянням регресії.
В залежності від форми зв’язку кореляційні залежності бувають прямолінійними і криволінійними.
При прямолінійній кореляційній залежності рівним змінам середніх значень факторної ознаки відповідають рівні зміни середніх значень результативної ознаки.
При криволінійній залежності рівним змінам середніх значень факторної ознаки відповідають нерівні зміни середніх значень результативної ознаки.
Різні явища по різному реагують на зміну факторів. Якщо зі зміною фактора х результат у змінюється більш-менш рівномірно, такий зв’язок описується лінійною функцією:
- лінійне рівняння,
де: у – значення результативної ознаки;
а – вільний член рівняння регресії, це значення у при х = 0
(реального економічного змісту немає);
b – коефіцієнт регресії, який показує на скільки одиниць в середньому зміниться результативна ознака при зміні факторної на одиницю і розглядається як ефект впливу х на у;
х – зміна, значення факторної ознаки.
Параметри наведеного рівняння визначаються методом найменших квадратів:
Σ(у-У)2 = min
Відповідно до умови мінімізації параметри розраховуються шляхом розв’язання системи нормальних рівнянь
{ |
Σy = na + bΣx |
Σxy = aΣx + bΣx2 |
Розв’язавши систему одержимо:
Коли йдеться про нерівномірне співвідношення варіацій взаємозв’язаних ознак (наприклад, коли прирости значень у зі зміною х прискорені чи сповільнені або напрям зв’язку змінюється), застосовують нелінійні регресії, зокрема:
степеневу У = axb;
гіперболічну
параболічну У = а + bх + сх2.
Важливою характеристикою регресійної моделі є відносний ефект впливу фактора х на результат у – коефіцієнт еластичності
Він показує, на скільки процентів у середньому змінюється результат у зі зміною фактора х на 1%.
Ступінь кореляційної залежності визначається за допомогою показників щільності зв’язку:
лінійним коефіцієнтом кореляції;
кореляційним відношенням;
частковим і множинним коефіцієнтом кореляції.
Два останні показники використовуються у випадку множинної кореляції.
Лінійний коефіцієнт кореляції або коефіцієнт Пірсона (γ) використовується для визначення щільності зв’язку при прямолінійній залежності. За абсолютною величиною він змінюється в межах від -1 до +1.
Якщо лінійний коефіцієнт кореляції зі знаком „плюс” – зв’язок між ознаками прямолінійний (при зростанні факторної ознаки зростає і результативна). якщо цей показник із знаком „мінус” – зв’язок зворотній (при зростанні факторної ознаки зменшується результативна).
У випадку, коли значення лінійного коефіцієнта кореляції дорівнює 0 – зв’язок між ознаками відсутній, коли дорівнює 1 – зв’язок функціональний.
Лінійний коефіцієнт кореляції можна визначити, використовуючи наступні залежності:
де: r – лінійний коефіцієнт кореляції;
b – коефіцієнт регресії в рівнянні зв’язку;
σх, σу – відповідно середнє квадратичне відхилення ознаки х і ознаки у.
Середнє квадратичне відхилення обчислюється:
Для незгрупованих даних |
Для згрупованих даних |
|
|
|
|
Отже, для визначення лінійного коефіцієнта кореляції можна користуватися:
Приклад.
На основі даних обчислити параметри а і б для виявлення зв’язку між чисельністю клієнтів банку та обсягом кредитового обороту та зробити розрахунок лінійного коефіцієнту кореляції.
Обласні дирекції банку |
Кредитовий оборот, (у) млн. грн. |
Чисельність клієнтів банку, (х) |
Розрахункові величини |
|||
х2 |
ху |
Ух = 2 + 0,98 |
у2 |
|||
1 |
7,4 |
6 |
36 |
44,4 |
7,8 |
54,76 |
2 |
7,2 |
5 |
25 |
36,0 |
6,9 |
51,84 |
3 |
8,6 |
7 |
49 |
60,2 |
8,9 |
73,96 |
4 |
9,5 |
8 |
64 |
76,0 |
9,8 |
90,25 |
5 |
4,6 |
4 |
16 |
18,4 |
5,9 |
21,16 |
6 |
7,3 |
5 |
25 |
36,5 |
6,9 |
53,29 |
7 |
8,6 |
7 |
49 |
60,2 |
8,9 |
73,96 |
8 |
9,8 |
7 |
49 |
68,6 |
8,9 |
96,04 |
9 |
7,0 |
4 |
16 |
28,0 |
5,9 |
49,00 |
10 |
4,8 |
3 |
9 |
14,4 |
4,9 |
23,04 |
n = 10 |
Σу = 74,8 |
Σх = 56 |
Σх2 = 338 |
Σху = 442,7 |
ΣУх = 74,8 |
Σу2 = 587,3 |
Рішення:
Розраховуємо параметри а і b:
Звідси, рівняння зв’язку між кредитовим оборотом (у) і чисельністю клієнтів банку (х) набуло такого вигляду:
Ух = 2 + 0,98х
Обчислюємо середнє значення факторної ознаки:
Обчислюємо середнє значення факторної ознаки:
Середнє значення добутку факторної і результативної ознаки:
Середнє квадратичне відхилення факторної ознаки:
Середнє квадратичне відхилення результативної ознаки:
Лінійний коефіцієнт кореляції:
Отже, рівень зв’язку між кредитовим оборотом і чисельністю клієнтів банку значно високий.
При розрахунку коефіцієнта кореляції, особливо якщо він обчислений для невеликої кількості значень (n), дуже важливо оцінити його надійність (значимість). Для цього розраховується середня помилка коефіцієнта кореляції (σr) за формулою:
де (n-2) – число степеней свободи при лінійній залежності.
А потім знаходиться відношення коефіцієнта кореляції до його середньої помилки, тобто , яке зрівнюється з табличним значенням t-критерія Стьюдента.
Отже, порівнявши дані з табличними t (розрахункове) більше t (табличного), то лінійний коефіцієнт кореляції r = 0,919 рахується значимим,
а зв’язок між х і у ,– реальним.
Крім лінійного коефіцієнта кореляції, для вимірювання щільності зв’язку можна використовувати теоретичне кореляційне відношення:
замість δ2 можна використовувати залишкову дисперсію.
Згідно з правилом складання дисперсії можна записати, що: