Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТИСТИКА практикум новий.doc
Скачиваний:
11
Добавлен:
17.08.2019
Размер:
3.61 Mб
Скачать

Тема 8. Статистичні методи аналізу зв’язків

Основні поняття та категорії:

  • кореляція;

  • кореляційно-регресійний аналіз;

  • криволінійна залежність;

  • лінійний коефіцієнт кореляції;

  • прямолінійна залежність;

  • регресія;

  • результативна ознака;

  • факторна ознака;

  • щільність зв’язку;

  • функціональний та стохастичний зв’язок.

Методичні вказівки.

Усі явища, що відбуваються в природі і суспільстві взаємозв’язані й взаємозумовлені. Розкриваючи взаємозв’язки і взаємозалежності між явищами, можна пізнати їх суть і закони розвитку. Тому вивчення взаємозв’язків є основним завданням статистичного аналізу.

Суспільні явища або окремі їх ознаки, які впливають на інші і обумовлюють їх зміну, називаються факторними, а суспільні явища або окремі їх ознаки, які змінюються під впливом факторних, називаються результативними (тобто характеризують наслідки).

Розрізняють два типи зв’язків – функціональні та стахостичні.

При функціональному зв’язку кожному значенню фактора х відповідає одне або кілька чітко визначених значень у.

Наприклад, залежність довжини ртутного стовпчика залежить від температури навколишнього середовища.

Стохастичним називається зв’язок, при якому кожному значенню факторної ознаки х відповідає декілька значень або певна множина значень ознаки у, які утворюють так званий умовний розподіл.

Якщо умовні розподіли змінюються одним параметром – середньою , то такий зв’язок називається кореляційним. Отже, кореляційний зв’язок є різновидом стохастичного і виявляється зміною середніх умовних розподілів.

Прикладом кореляційної залежності може служити залежність продуктивності праці від стажу роботи робочих, залежність врожайності від строку посіву і т.д.

В основі кореляційно-регресивного аналізу лежить припущення про те, що залежність між значенням факторної і результативної ознаки може бути представлена у вигляді функції:

і називається рівнянням регресії.

В залежності від форми зв’язку кореляційні залежності бувають прямолінійними і криволінійними.

При прямолінійній кореляційній залежності рівним змінам середніх значень факторної ознаки відповідають рівні зміни середніх значень результативної ознаки.

При криволінійній залежності рівним змінам середніх значень факторної ознаки відповідають нерівні зміни середніх значень результативної ознаки.

Різні явища по різному реагують на зміну факторів. Якщо зі зміною фактора х результат у змінюється більш-менш рівномірно, такий зв’язок описується лінійною функцією:

- лінійне рівняння,

де: у – значення результативної ознаки;

а – вільний член рівняння регресії, це значення у при х = 0

(реального економічного змісту немає);

b – коефіцієнт регресії, який показує на скільки одиниць в середньому зміниться результативна ознака при зміні факторної на одиницю і розглядається як ефект впливу х на у;

х – зміна, значення факторної ознаки.

Параметри наведеного рівняння визначаються методом найменших квадратів:

Σ(у-У)2 = min

Відповідно до умови мінімізації параметри розраховуються шляхом розв’язання системи нормальних рівнянь

{

Σy = na + bΣx

Σxy = aΣx + bΣx2

Розв’язавши систему одержимо:

Коли йдеться про нерівномірне співвідношення варіацій взаємозв’язаних ознак (наприклад, коли прирости значень у зі зміною х прискорені чи сповільнені або напрям зв’язку змінюється), застосовують нелінійні регресії, зокрема:

степеневу У = axb;

гіперболічну

параболічну У = а + bх + сх2.

Важливою характеристикою регресійної моделі є відносний ефект впливу фактора х на результат укоефіцієнт еластичності

Він показує, на скільки процентів у середньому змінюється результат у зі зміною фактора х на 1%.

Ступінь кореляційної залежності визначається за допомогою показників щільності зв’язку:

  • лінійним коефіцієнтом кореляції;

  • кореляційним відношенням;

  • частковим і множинним коефіцієнтом кореляції.

Два останні показники використовуються у випадку множинної кореляції.

Лінійний коефіцієнт кореляції або коефіцієнт Пірсона (γ) використовується для визначення щільності зв’язку при прямолінійній залежності. За абсолютною величиною він змінюється в межах від -1 до +1.

Якщо лінійний коефіцієнт кореляції зі знаком „плюс” – зв’язок між ознаками прямолінійний (при зростанні факторної ознаки зростає і результативна). якщо цей показник із знаком „мінус” – зв’язок зворотній (при зростанні факторної ознаки зменшується результативна).

У випадку, коли значення лінійного коефіцієнта кореляції дорівнює 0 – зв’язок між ознаками відсутній, коли дорівнює 1 – зв’язок функціональний.

Лінійний коефіцієнт кореляції можна визначити, використовуючи наступні залежності:

де: r – лінійний коефіцієнт кореляції;

b – коефіцієнт регресії в рівнянні зв’язку;

σх, σу – відповідно середнє квадратичне відхилення ознаки х і ознаки у.

Середнє квадратичне відхилення обчислюється:

Для незгрупованих даних

Для згрупованих даних

Отже, для визначення лінійного коефіцієнта кореляції можна користуватися:

Приклад.

На основі даних обчислити параметри а і б для виявлення зв’язку між чисельністю клієнтів банку та обсягом кредитового обороту та зробити розрахунок лінійного коефіцієнту кореляції.

Обласні дирекції банку

Кредитовий оборот, (у) млн. грн.

Чисельність клієнтів банку, (х)

Розрахункові величини

х2

ху

Ух = 2 + 0,98

у2

1

7,4

6

36

44,4

7,8

54,76

2

7,2

5

25

36,0

6,9

51,84

3

8,6

7

49

60,2

8,9

73,96

4

9,5

8

64

76,0

9,8

90,25

5

4,6

4

16

18,4

5,9

21,16

6

7,3

5

25

36,5

6,9

53,29

7

8,6

7

49

60,2

8,9

73,96

8

9,8

7

49

68,6

8,9

96,04

9

7,0

4

16

28,0

5,9

49,00

10

4,8

3

9

14,4

4,9

23,04

n = 10

Σу = 74,8

Σх = 56

Σх2 = 338

Σху = 442,7

ΣУх = 74,8

Σу2 = 587,3

Рішення:

  1. Розраховуємо параметри а і b:

Звідси, рівняння зв’язку між кредитовим оборотом (у) і чисельністю клієнтів банку (х) набуло такого вигляду:

Ух = 2 + 0,98х

  1. Обчислюємо середнє значення факторної ознаки:

  1. Обчислюємо середнє значення факторної ознаки:

  1. Середнє значення добутку факторної і результативної ознаки:

  1. Середнє квадратичне відхилення факторної ознаки:

  1. Середнє квадратичне відхилення результативної ознаки:

  1. Лінійний коефіцієнт кореляції:

Отже, рівень зв’язку між кредитовим оборотом і чисельністю клієнтів банку значно високий.

При розрахунку коефіцієнта кореляції, особливо якщо він обчислений для невеликої кількості значень (n), дуже важливо оцінити його надійність (значимість). Для цього розраховується середня помилка коефіцієнта кореляціїr) за формулою:

де (n-2) – число степеней свободи при лінійній залежності.

А потім знаходиться відношення коефіцієнта кореляції до його середньої помилки, тобто , яке зрівнюється з табличним значенням t-критерія Стьюдента.

Отже, порівнявши дані з табличними t (розрахункове) більше t (табличного), то лінійний коефіцієнт кореляції r = 0,919 рахується значимим,

а зв’язок між х і у ,– реальним.

Крім лінійного коефіцієнта кореляції, для вимірювання щільності зв’язку можна використовувати теоретичне кореляційне відношення:

замість δ2 можна використовувати залишкову дисперсію.

Згідно з правилом складання дисперсії можна записати, що: