Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
T8_EK_Korell.doc
Скачиваний:
12
Добавлен:
15.12.2018
Размер:
147.46 Кб
Скачать

3. Щільність зв’язку між ознаками. Коефіцієнти детермінації і кореляції. Індекс кореляції.

Визначення суттєвості коефіцієнту регресії і кореляції, одержаних за вибірковими даними.

Визначення інтервалів надійності показників зв'язку.

Для вимірювання тісноти (щільності) зв'язків між ознаками застосовується кореляційний метод, суть якого полягає у визначенні спеціальних співвідношень, що базуються на правилі додавання дисперсій.

Відношення міжгрупової (факторної) дисперсії до загальної розглядається як міра щільності кореляційного зв'язку і називається коефіцієнтом детермінації (r2 або ).

(6)

За статистичною структурою це відношення є часткою варіації результативної ознаки, яка пов'язана з варіацією ознаки х. Здобувши квадратний корінь із цього відношення, одержуємо емпіричне кореляційне відношення.

(7)

У нашому прикладі:

Таким чином, в обстеженій сукупності банків 95,21% варіації прибутку пов'язані з варіацією обігу коштів.

Кореляційне відношення змінюється від 0 до 1. Якщо r =0, то міжгрупова дисперсія дорівнює нулю. Це можливо лише за умови, коли всі групові середні однакові і кореляційний зв'язок між ознаками відсутній. При r =1 міжгрупова дисперсія дорівнює загальній, а середня з групових - нулю. В цьому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв'язок між ознаками функціональний.

Індекс кореляції визначають зіставленням внутрішньогрупової і загальної дисперсії, і обчислюють за формулою:

(8)

Як бачимо величина R збіглася з показником r. Чим ближче R до 1, тим тісніший зв'язок між ознаками.

Слід підкреслити, що значення r2 > 0 не завжди є доказом наявності кореляційного зв'язку між ознаками. Відмінне від нуля кореляційне відношення може з'явитись і при випадковому розподілі сукупності на групи.

Перевірка істотності відхилень групових середніх здійснюється за допомогою критеріїв математичної статистики. Вона ґрунтується на порівнянні фактичного значення r2 з так званим критичним. Останнє є тим максимально можливим значенням кореляційного відношення, яке може виникнути випадково при відсутності кореляційного зв'язку. Якщо фактичне значення r2 більше від критичного, то зв'язок між результативною і факторною ознаками вважається істотним. Якщо фактичне значення r2 менше критичного, то наявність кореляційного зв'язку між ознаками не доказана і зв'язок вважається неістотним.

Для оцінки надійності кореляційних характеристик використовують критерії Фішера (F) або Стьюдента (t).

Критерій Фішера (F-критерій) визначається за формулою:

(9)

де - міжгрупова дисперсія; - середня групова (залишкова) Дисперсія; k1 і k2 - ступені вільності (свободи) для великої і малої дисперсій. Фішер знайшов розподіл відношень дисперсій і розробив відповідні математичні таблиці, в яких наводиться F-критерій теоретичний FТ при двох ймовірностях 0,95 і 0,99. Якщо FФ > FТ., то з прийнятим ступенем ймовірності можна стверджувати про наявність впливу фактора, який вивчається. Коли ж FФ < FТ то різниця між дисперсіями зумовлена впливом випадкових факторів.

Розподіл у таблицях Фішера для знаходження FТ.залежить від ступенів вільності міжгрупової k1 і середньої з групових k2 дисперсій. В аналітичному групуванні їх обчислюють за формулами:

k1=m-1; k2 =n-m (10)

де n - кількість елементів досліджуваної сукупності; т - число груп.

За даними наведеного вище прикладу (табл. 10.6):

Знаходимо F^ при ймовірності 0,95 і даних супенях вільності за математичною таблицею. Воно становить F^(0,95) = 4,8.

Отже, Рф > F.r (33,935 > 4,8), що свідчить про суттєвий вплив обігу коштів банків на їх прибуток.

Надійність кореляційного відношення за критерієм Стьюдента (t - критерію)

(11)

де - середня похибка кореляційного відношення

(12)

Якщо критерій Стьюдента tn 3, показник кореляційного відношення вважають вірогідним (тобто зв'язок між досліджуваними явищами є доведеним). Якщо ж критерій tn < 3, то висновки про вірогідність зв'язку між досліджуваними явищами сумнівні.

Комбінаційні аналітичні групування і дисперсійний аналіз використовують для вивчення зв'язку результативної ознаки з двома і більше факторними ознаками. Вони дають можливість аналізувати залежність результативної ознаки від кожного з факторів при фіксованих значеннях інших. Методи вимірювання такого зв'язку і перевірку його істотності називають багатофакторними дисперсійними комплексами. Вони пов'язані з громіздкими розрахунками і потребують використання ЕОМ.

Для вимірювання щільності прямолінійних зв'язків використовується лінійний коефіцієнт кореляції. Найбільш зручною формулою для розрахунку коефіцієнта кореляції за не згрупованими даними є:

(22)

Коефіцієнт кореляції можна обчислювати і за іншими формулами. Зокрема:

(23), або (24)

Якщо визначена форма кореляційного зв'язку і обчислений коефіцієнт регресії а, то коефіцієнт кореляції можна обчислити за формулою:

(25)

Лінійний коефіцієнт кореляції може набувати любих значень в межах від -1 до +1. Якщо r близьке до 1, то зв'язок між ознаками тісний, якщо г наближається до 0, то зв'язок незначний. Знак лінійного коефіцієнта кореляції вказує напрямок зв'язку - знак плюс свідчить про прямий зв'язок, знак мінус - обернений зв'язок.

Параметри рівняння множинної регресії обчислюють способом найменших квадратів розв'язанням системи рівнянь:

Коефіцієнти регресії показують, наскільки зміниться урожайність при зміні відповідного фактора на одиницю при умові, що другий фактор, включений у рівняння, знаходиться на середньому рівні. Так, ах = 0,45 показує, що при середній дозі внесених мінеральних добрив поліпшення якості грунтів на один бал сприяє зростанню врожайності зернових культур на 0,45 ц/га. Збільшення дози внесе­них мінеральних добрив на 1 ц при середній якості грунтів забезпе­чує приріст урожайності на 2,14 ц/га.

Показниками тісноти зв'язку при множинній кореляції є парні, часткові і множинні (сукупні) коефіцієнти кореляції і множинний коефіцієнт детермінації.

Парні коефіцієнти кореляції використовують для вимірювання тісноти зв'язку між двома досліджуваними ознаками без урахуванняЇХ взаємодії з іншими ознаками, включеними в кореляційну модель. Методика розрахунку цих коефіцієнтів та їх інтерпретація така сама, як і методика розрахунку лінійного коефіцієнта парної кореляції при однофакторному зв'язку.

Кореляційний зв'язок між факторами в рівнянні множинної регресії називають колінеарністю, або мультиколінеарністю. Мультико-лінеарність ускладнює вивчення впливу окремих факторів на результативну ознаку, оскільки взаємодія колінеарних факторів у моделі подвоюватиметься і спотворюватиме результати. Чим вища колінеарність, тим менш надійними будуть показники впливу окремих факторів.

Статистикою ще не знайдені надійні способи вимірювання мульти-колінеарності. Для практичних цілей допустимою колінеарністю, що не спотворює результати дослідження, вважають таку, при якій парні коефіцієнти кореляції між факторними і результативними ознаками більші за коефіцієнт кореляції між супутніми факторами:

Часткові коефіцієнти кореляції характеризують тісноту зв'язку результативної ознаки з однією факторною ознакою при умові, що інші факторні ознаки перебувають на постійному рівні. Парний коефіцієнт кореляції між результативною і факторною ознаками, як правило, не дорівнює відповідному частковому коефіцієнту.

Частковий коефіцієнт кореляції між ознаками у і хх без ураху­вання впливу ознаки х2 визначають за формулою

__ ГУх, ~~ Гухг ' Гх,хг

гУХі(х2) г >

де г — парні коефіцієнти кореляції між відповідними ознаками.

Додатні знаки перед частковими коефіцієнтами кореляції свідчать про пряму залежність між досліджуваними ознаками. Визначення часткових коефіцієнтів дає змогу глибше вивчити зв'язок між явищами і, зокрема, виявити вплив факторної ознаки на зміну результативної ознаки.

Коефіцієнт множинної (сукупної) детермінації показує, яка частка варіації досліджуваного результативного показника зумовлена впливом факторів, включених у рівняння множинної регресії. Він може мати значення від 0 до +1. Чим ближчий коефіцієнт множинної детермінації до одиниці, тим більше варіація результативного показника характеризується впливом відібраних факторів. Коефіцієнт множинної детермінації визначають за такою формулою:

2

П2 __ °°бч ^ ----- 9 >

де 0обч — дисперсія результативного показника, обчислена за рів­нянням множинної регресії; а\ — загальна дисперсія результативного показника.

Основним показником тісноти зв'язку при множинній кореляції є коефіцієнт множинної (сукупної) кореляції, який може мати зна­чення від 0 до +1. Формула для його обчислення має такий вигляд:

К = у -^2. = /0^4І = 0,736.

При лінійному двофакторному зв'язку коефіцієнт множинної кореляції можна визначити за такою формулою: ухгі'ух, " ух, ' ухг ' ' Хіхг -------ї^г;-------'

де/ — лінійні парні коефіцієнти кореляції. В нашому прикладі

г, _ -і/" 0,7522 + 0.5492 — 2 ■ 0,752 • 0,549 ■ 0,466 _ д 785 К ~ У і _ о,4662

Деяка розбіжність між коефіцієнтами множинної кореляції, обчисленими різними способами, свідчить про те, що у нашому прикладі зв'язок між корелюючими величинами не є абсолютно прямолінійним, а має елементи криволінійності. Правильним буде коефіцієнт, обчислений як корінь квадратний із коефіцієнта множинної детермінації.

r < 0,3 - зв'язку немає

r = 0,3 - 0,5 - зв'язок слабкий

r = 0,5-0,7 - зв'язок середній

r > 0,7 - зв'язок тісний

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]