Методичні рекомендації
.pdf2. оцінка впливу окремих факторів.
На першому етапі здійснюється відбір факторів, що суттєво впливають на результативну змінну. Для отримання надійних оцінок у модель не слід включати надто багато факторів. їхня кількість не повинна бути більшою однієї третини обсягу даних, що аналізуються. При використанні персональних комп'ютерів відбір факторів здійснюється безпосередньо в процесі створення моделі методом послідовної регресії. Суть цього методу полягає у послідовному включенні додаткових факторів у модель та оцінці впливу доданого фактора. Використовується також підхід, за якого на фактори, що включаються у попередній склад моделі, не накладається особливих обмежень і лише на наступних стадіях проводиться їхнє оцінювання та відбір.
Відбір факторів, тобто встановлення тісноти зв'язку, яка існує між показниками, наприклад, попитом і грошовими доходами, здійснюють на основі обчислення прямолінійного коефіцієнта кореляції:
де у — середньодушовий попит на товари народного споживання; х — величина фактора, впливаючого на величину попиту (наприклад,
середньодушовий дохід, ціна товару і т.д.);
x, y — середні значення корелюючих величин по вивчаючій сукупності; xi , yi— значення факторів х,у в i-ому спостереженні (і = 1, 2,…, п).
Розрахований прямолінійний коефіцієнт кореляції, здобутий за вибірковими даними, є випадковою величиною, яка залежить від вибірки. Тому доцільно зробити перевірку гіпотези про відсутність кореляційного зв'язку між випадковими величинами х та у.
Перевіряється нульова гіпотеза Н0 : r[х, у] = 0 і альтернативна гіпотеза Н1 : r[х, у] ≠ 0. Якщо випадкові величини х і у розподілені за нормальним
законом, то обчислюється t-статистика за формулою
171
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Ця формула має розподіл Стьюдента з к=п-2 ступенями свободи. Для заданої ймовірності р і ступенів свободи к знаходиться табличне значення t рк
— статистики. Якщо t≥ tрк, то із заданою надійністю р приймається гіпотеза Н1 про наявність кореляційного зв'язку між випадковими величинами х та у (між попитом і грошовими доходами).
Якщо t < t p к , то приймається гіпотеза Н0. В цьому випадку можна говорити, що з надійністю р кореляційний зв'язок між випадковими величинами х, у відсутній.
Парний коефіцієнт кореляції характеризує зв'язок між залежною змінною і одним із факторів (наприклад, між попитом і доходами, без урахування цін і товарообороту з 1 м2 складської площі). В цьому випадку необхідно визначити частинний коефіцієнт кореляції.
Частинний коефіцієнт кореляції характеризує кореляційний зв'язок між залежною змінною і одним із факторів при виключенні впливу інших факторів. Для лінійної двофакторної регре-сійної моделі коефіцієнт x2 ryx1
характеризує вплив на у фактора х1 при виключенні впливу х2 і розраховується за формулою:
Сукупність впливу всіх вибраних факторів на попит визначають за допомогою коефіцієнта множинної кореляції, який завжди додатній і менший від 1. Коефіцієнт множинної кореляції у випадку двох чинників визначають через коефіцієнти парної кореляції за формулою:
172
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Істотність коефіцієнта множинної кореляції перевіряють за F-
критерієм Фішера:
Розрахункове значення F' порівнюють з теоретичним, яке визначають з таблиці при заданому рівні надійності р і числа ступенів свободи V1 = m і V 2 = n - m - 1 . Якщо розрахункове значення Fp перевищує табличне, то гіпотезу про неістотність коефіцієнта множинної кореляції відхиляють.
Для оцінки зв'язку при нелінійній формі залежності застосовується
множинне кореляційне відношення, яке визначається за формулою:
де y1, y емпіричне і теоретичне значення попиту в i-му спостереженні.
Значимість множинного кореляційного відношення перевіряють за t- критерієм, який характеризується розподілом Стьюдента із V = п - т - 1 ступенями свободи
де ση середньоквадратична помилка множинного кореляційного відношення, яку визначають за формулою:
Другий етап починається з розробки моделі, яка відображає загальний зміст взаємозв'язків, що вивчаються. Регресійна модель — це рівняння або система рівнянь, що показує, які фактори мають бути залучені до
взаємозв'язків, що підлягають аналізу. Регресійне рівняння дає уявлення про
173
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
форму зв'язку, в основу виявлення якої покладено використання наступних математичних функцій:
-лінійна
-квадратична
-екпоненціальна
-степенева Гіперболічна: 1 типу
2типу
3типу
логарифмічна
S-подібна
обернено-логарифмічна
де y — розрахункове значення середньодушового попиту на товари народного споживання; х — величина фактора, який впливає на величину попиту (наприклад,
середньодушовий дохід, ціна товару і т.д.); а,b,с — параметри рівняння.
Параметри рівняння найчастіше обчислюються методом найменших квадратів. Критерієм оцінки форми рівняння служить близькість теоретичних і фактичних значень попиту. Ця умова подається наступним чином:
де yi — фактичне значення попиту на взуття;
yi — його розрахункове значення.
174
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Для рівняння виду у=а+bх випадку незгрупованих даних параметри визначаються таким чином:
Інтервальні оцінки параметрів парної лінійної регресії здійснюється за допомогою середнього квадратичного відхилення. Так, середнє квадратичне відхилення σ [а] параметра а обчислюється за формулою:
Якщо відхилення розподілені за нормальним законом, то довірчий інтервал для параметра а визначають як
a = tαk де tak — значення t-критерію, який визначається за даним значенням рівня значущості і числом ступенів свободи
Середнє квадратичне відхилення параметра b обчислюється за формулою:
Довірчий інтервал для параметра b визначається як [b-∆b, b+∆b], де ∆b = ta k σ [b].
175
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Прогнозне значення попиту на взуття буде знаходитись в певних межах, величини яких визначаються за допомогою середнього квадратичного відхилення:
Надійний |
інтервал |
для |
|
, визначається |
за формулою |
yi |
|||||
|
|
При |
визначенні дисперсії |
показника yp |
необхідно врахувати розсіяння навколо лінії регресії, яка визначається за формулою:
Замінюючи σ його точковою оцінкою S, запишемо межі довір- |
чих |
||
інтервалів індивідуальних прогнозних значень: |
é |
|
ù |
êy p - D y p ; y p - D y p ;ú |
|||
|
ë |
|
û |
Розрахунок лінійного коефіцієнту кореляції та оцінки параметрів парної лінійної регресії можна здійснювати двома методами, застосувавши програмні засоби MS Excel.
Перший метод полягає у можливості MS Excel тиражувати формули з абсолютними, відносними і змішаними адресами.
Для розрахунку коефіцієнта кореляції побудуйте таблицю наступного виду (табл. 35):
176
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Таблиця 35
РОЗРАХУНОК КОЕФІЦІЄНТА КОРЕЛЯЦІЇ
|
А |
В |
С |
D |
Е |
F |
G |
Н |
|||||||||||||||
1 |
№ |
Товарообіг |
Товароо |
|
|
|
|
|
|
Результати розрахунків |
|||||||||||||
|
підпри- |
РСС на |
біг |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
ємства |
душу |
взуття, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
населення, |
грн |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
грн |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
y |
x - |
x |
|
у - |
y |
|
( x - |
x |
) * |
( x - |
x |
) 2 |
( у - |
y |
) 2 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
( у - |
|
) |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
||||
2 |
1 |
660 500 |
35 400 |
-592 693 |
-17 819 |
1.056Е + |
3.513Е+ |
3.175Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
11 |
|
08 |
|
|||||
3 |
2 |
730 600 |
40 400 |
-522 593 |
-12 819 |
6.699Е + |
2,731 Ё* |
1.643Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
09 |
|
11 |
|
08 |
|
|||||
4 |
3 |
784 900 |
41 000 |
-468 293 |
-12 219 |
5.722Е + |
2.193Е + |
1.493Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
09 |
|
11 |
|
08 |
|
|||||
5 |
4 |
839 100 |
41 800 |
-414 093 |
-11 419 |
4.729Е + |
1.715Е+ |
1.304Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
09 |
|
11 |
|
08 |
|
|||||
6 |
5 |
947 500 |
42 000 |
-305 693 |
-11 219 |
3.430Е + |
9.345Е + |
1.259Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
09 |
|
10 |
|
08 |
|
|||||
7 |
6 |
967 100 |
42 150 |
-286 093 |
-11 069 |
3.167Е + |
8.185Е + |
1.225Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
09 |
|
10 |
|
08 |
|
|||||
8 |
7 |
1 075 300 |
43 620 |
-177 893 |
-9 599 |
1.708Е + |
3.165Е+ |
9.214Е + |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
09 |
|
10 |
|
07 |
|
|||||
9 |
8 |
1 200 410 |
43 710 |
-52 783 |
-9 509 |
5.019Е+08 |
2.786Е+09 |
9.042Е+07 |
|||||||||||||||
10 |
9 |
1 210 300 |
45 600 |
-42 893 |
-7 619 |
3.268Е+08 |
1.840Е+09 |
5.805Е+07 |
|||||||||||||||
11 |
10 |
1 290 700 |
46 180 |
37 507 |
-7 039 |
- |
|
|
|
1.407Е+09 |
4.955Е+07 |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
2.640Е+08 |
|
|
|
|
|
|
||||
12 |
11 |
1 313 500 |
51 230 |
60 307 |
-1 989 |
- |
|
|
|
3.637Е+09 |
3.956Е+06 |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1.199Е+08 |
|
|
|
|
|
|
||||
13 |
12 |
1 436 800 |
53 330 |
183 607 |
111 |
|
2.039Е+07 |
3,371 |
1.233Е+04 |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е+10 |
|
|
|
||
14 |
13 |
1590710 |
58460 |
337517 |
5241 |
1.769E+09 |
1.139+E11 |
2.747+E07 |
|||||||||||||||
15 |
14 |
1421300 |
61290 |
168107 |
8071 |
1.357E+09 |
2.826+E10 |
6.514+E07 |
|||||||||||||||
16 |
15 |
1500310 |
63310 |
247117 |
10091 |
2.494E+09 |
6.107+E10 |
1.018+E08 |
|||||||||||||||
17 |
16 |
1510689 |
64180 |
257496 |
10961 |
2.822E+09 |
6.630+E10 |
1.201+E08 |
|||||||||||||||
18 |
17 |
1610790 |
71800 |
357597 |
18581 |
6.645E+09 |
1.279+E11 |
3.453+E08 |
|||||||||||||||
19 |
18 |
1820000 |
80100 |
566807 |
26881 |
1.524E+10 |
3.213+E11 |
7.226+E08 |
|||||||||||||||
20 |
19 |
1900150 |
85600 |
646957 |
32381 |
2095E+10 |
4.186+E11 |
1.049+E09 |
|||||||||||||||
21 |
|
|
|
|
23810659 |
1011160 |
0 |
|
|
0 |
|
|
8.775E+10 |
2.403+E12 |
3.735+E09 |
||||||||
22 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
|
|
|
|
1253193 |
N= |
19 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
24 |
|
|
|
|
53219 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
25 |
Kkop |
0.926 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
26 |
Kkop |
0.926 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
27 |
T= |
10.137 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
28 |
tαk |
2.110 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
177
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Побудувавши таблицю, виконайте наступне:
1.Внесіть заголовки таблиці, стовпчиків, введіть дані і відформатуйте таблицю.
2.В клітинки В23, В24 занесіть формули для визначення середніх значень фактора (доходів на душу населення) і показника (реалізованого попиту, тобто товарообігу взуття), застосувавши статистичну функцію
AVERAGE (СРЗНАЧ):
∙Для цього в клітинки В23 і В24 введіть, відповідно, формули
AVERAGE (В2:В20), =AVERAGE (С2:С20).
∙В клітинку D2 введіть формулу =В2 — В$23, в клітинку Е2 — формулу =С2 — В$24,в клітинку F2 - формулу =D2 * Е2, в клітинку G2 — формулу =D2 * D2, в клітинку Н — формулу = Е2
*Е2.
∙Скопіюйте ці формули у решту клітинок відповідних стовпчиків, рядків 3 — 20.
∙Застосуйте інструмент автосумування і розрахуйте в клітинці F21 суму добутку центрованих величин показника і фактора. Суми квадратів центрованих величин розрахуйте в клітинках G21 та Н21. Розрахуйте суми фактора і показника і їх відхилення від середніх в клітинках В21, С21, D21, Е21.
∙В клітинці В25 розрахуйте лінійний коефіцієнт кореляції, використавши математичну функцію SQRT (КОРЕНЬ). Для цього внесіть в клітинку В25 формулу =F21 / SQRT(G21*H21).
Інший метод розрахунку лінійного коефіцієнта кореляції полягає у використанні статистичної функції CORREL (КОРРЕЛ).
Надбудова Analysis ToolPak входить в стандартну інсталяцію MS Office . Якщо при інсталяції пакета вона була включена в робочий комплект, то при виборі з меню операції Tools —» Add-Ins на екрані з'являється вікно монітора надбудов. В ньому перечислен! всі заінстальовані на комп'ютері
надбудови пакету MS Excel. Серед них бачимо Analysis ToolPak та Solver. 178
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Кожна з таких надбудов може бути активною (під'єднаною) або неактивною (від'єднаною). У вікні монітора надбудов активні надбудови відмічені галочками (піднятими прапорцями, chekbox on). Будь-яку з перелічених в ньому надбудов можна активізувати, відмітивши її галочкою.
3. Поставте табличний курсор на клітинку В26. Операцією Insert —» Function або інструментом fx відкрийте вікно конструктора функцій і виберіть функцію CORREL (КОРРЕЛ) з групи Statistical (Статистические):
∙В перше поле введіть блок даних фактора х (В2:В20), у друге поле занесіть дані попиту (С2:С20).
∙Натисніть на клавішу ОК (Готово) і в активній клітинці (В26) отримаєте значення коефіцієнта кореляції.
4.Для перевірки значимості коефіцієнта кореляції в клітинку В27 занесіть формулу обчислення розрахункового значення t-статистики. Для знаходження критичного tak-розподілу використайте статистичну функцію TINV (СТЬЮДРАСП):
∙Поставте табличний курсор на клітинку В28, де буде знаходитись критичне значення tak -розподілу.
∙Викличіть конструктор функцій і виберіть функцію TINV з групи
Statistical (Статистические).
∙Введіть у перше поле рівень значимості α = і-р ( р — це довірча ймовірність 0,95), в друге поле — число ступенів свободи ( п - 2), тобто 17, і натисніть на клавішу ОК (Готово).
∙В активній клітинці (В28) одержите критичне значення tak - розподілу. Порівняйте його з t-розрахунковим (клітинка В28) і
зробіть відповідні висновки.
Для оцінки параметрів парної лінійної регресії побудуйте наступну таблицю:
179
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com
Перший метод оцінки параметрів регресії базується на здатності MS Excel тиражуваті формули з абсолютними, відносними і змішаними адресами. Для оцінки параметрів виконайте такі дії:
1. В клітинки D2 і Е2 введіть формули =В2 * С2 і =В2 * В2 та розмножте їх на блоки D3:D20, ЕЗ:Е20.
180
PDF создан версией pdfFactory Pro для ознакомления www.pdffactory.com