Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Navch._posibnuk_Ivaschyk

.pdf
Скачиваний:
106
Добавлен:
12.02.2016
Размер:
4.89 Mб
Скачать

6

 

 

 

 

 

 

 

4

 

 

 

3

 

 

 

2

 

 

 

2

 

 

 

0

 

 

 

1

 

 

 

-2

 

 

 

0

 

 

 

 

 

 

 

 

 

 

0

1

2

3

0

1

2

3

Рис. 15.8.2. Параболи 2-го та 3-го степеня:

Y=a+b·x+c·x2 [+d·x3]

32

28

24

20

10

 

 

 

 

 

 

0

1

2

3

4

5

6

Рис. 15.8.4. Степенева 1/2 модель:

Y = a +b x

16

12

8

4

0

-1

0

1

2

Рис.15.8.3. Моделі оптимуму:

Y=r/(a+b·x+c·x2), r=1, r=x та експонента Y=exp(a+b·x+c·x2)

2

1

0

0

1

2

3

4

5

6

Рис. 15.8.5. Логарифмічна модель: Y=a+b·ln(x)

20

18

12

8

4

1

2

3

4

5

6

Рис. 15.8.6. Експонента:

Рис. 15.8.7. Експонента:

Y=exp(a+b·x)

Y=exp(a+b/x)

 

451

12

10

8

4

2

1

2

3

4

5

6

7

 

Рис. 15.8.8. Експонента:

 

 

Y = exp(a +b

x )

7

6

5

4

3

2

1

0

1

2

3

Рис. 15.8.10. Гіпербола:

Y=1/(a+b/x)

16

12

8

4

0

1

2

3

8

6

4

2

0

0

1

2

3

Рис. 15.8.9. Гіпербола: Y=a+b/x

7

6

5

4

3

2

1

0

1

2

3

Рис. 15.8.11. Гіпербола:

Y =1 /( a + b x )

4

3

2

1

0

1

2

3

Рис. 15.8.12. Логістична модель

Рис. 5.8.13. Модель із синусом

452

Розрізняють два класи нелінійних регресій. До першого відносять регресії, нелінійні відносно аналізованих пояснювальних змінних, але лінійних відносно невідомих, що підлягають оцінці параметрів регресії. Тому ці нелінійні регресії також називають квазілінійними регресіями. Їхня перевага в тому, що для них можливе безпосереднє застосування МНК і, як наслідок, залишаються в силі всі початкові передумови лінійного регресійного аналізу та властивості цього методу, зокрема оцінок параметрів регресії (незміщеність, обґрунтованість, гомоскедастичність і т.д.). Використовуються ті самі критерії значущості, аналогічно будуються довірчі інтервали. Одностороння залежність між явищами може бути описаною, наприклад, параболічною залежністю вигляду:

 

 

 

 

ˆy = a

 

+ a x + a x2

 

 

 

(15.63)

 

ˆ

 

 

 

0

 

1

 

2

 

 

 

 

 

або поліноміальною

=

a0

+

a1x

+

a2 x

2 +

+

am x

m

.

(15.64)

y

 

 

 

 

 

 

 

Функції регресій (15.63) і (15.64) лінійні відносно параметрів і нелінійні відносно пояснювальних змінних. Отже, маємо справу з функціями квазілінійної регресії. У загальному випадку квазілінійна регресія має такий вид запису:

ˆ

=

a0

+

a1F1 (x)

+

+

am Fm (x),

(15.65)

y

 

 

 

 

де F1(x), …, Fm(x) – нелінійні функції відносно пояснювальних змінних.

До квазілінійних регресій безпосередньо можна застосувати МНК, якщо представити їх у вигляді лінійних множинних регресій. Наприклад, (15.64) зводиться до множинної регресії з допомогою заміни:

a

= a ,

a

= a , ...,

x = x ,x2

= x

,...,xm = x .

0

0

1

1

1

2

m

У результаті такої заміни отримуємо:

ˆ

=

+

 

+

+

 

,

(15.66)

y

 

a0

a1 x1

 

 

am xm

що повністю відповідає лінійному виду. Побудову та оцінку багатофакторної моделі розглянемо в наступному розділі.

Другий клас регресії характеризується нелінійністю відносно оцінюваних параметрів. Нелінійні регресії першого та другого класів також називають відповідно суттєво лінійними і суттєво нелінійними регресіями. Другий клас регресій часто трапляється при дослідженні економічних процесів. Проте йому властивий значний недолік – неможливість прямо застосувати МНК.

Як приклад регресій другого класу, а саме регресій нелінійних відносно оцінюваних параметрів, можна навести такі функції:

453

степенева –

ˆ

=

a

 

x

b

; показникова –

ˆ

=

ab

x

; логістична –

ˆ

=

 

a

 

 

1+becx

y

 

 

 

 

y

 

 

y

 

або

ˆ

=

 

a

 

 

 

та ін.

 

 

 

 

 

 

 

 

 

1+ ebcx

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

Для оцінки параметрів у зазначеному випадку використовують ітераційні методи або застосовують апроксимацію. Широко використовується лінійне перетворення функції регресії, що дає можливість застосувати до перетворюваних параметрів статистичні критерії лінійної регресії.

Наприклад, зробимо такі перетворення для степеневої функції.

Прологарифмуємо праву та ліву частини функції

ˆ

=

ax

b

, отримаємо

y

 

 

 

 

ˆ =

ln a

+

 

ˆ

 

=

 

ˆ

=

ln a,x

=

ln x

, отримаємо

ln y

 

ln x . Ввівши заміну: z

 

ln y,a

 

 

 

z = a +bx .

Аналогічні

перетворення

виконаємо

і

 

для

 

логістичної

функції:

a

 

 

a

 

 

ln

 

1

= ln b cx

або ln

 

1

= b cx

yˆ

ˆ

 

 

 

 

 

 

 

 

 

 

y

 

Для опису необмежених і монотонно зростаючих або монотонно спадних експериментальних залежностей можна використати такі моделі:

лінійна модель 1 використовується для залежностей, у яких перша похідна (швидкість зміни Y або приріст Y) постійні;

параболічна модель 2 характеризується тим, що перша похідна змінюється за лінійним законом;

логарифмічна залежність 5 використовується для моделювання поволі змінюваних залежностей, оскільки її перша похідна спадає обернено пропорційно Х;

експоненти 8-С використовуються для залежностей, в яких логарифми змінюються за лінійним законом.

Швидкість зростання степеневої функції 6 при великих Х більша від логарифмічної і менша від експоненціальної, а також може бути меншою чи більшою, залежно від своїх параметрів, швидкості росту лінійної функції.

Для опису обмежених монотонно зростаючих та монотонноспадних експериментальних залежностей (залежностей, значення яких прямує до деякої границі) можуть бути використані такі моделі:

454

при граничному значенні 0: степенева модель 6, експонента 8 та В, гіпербола D;

при довільному граничному значенні модифіковані степенева функція 7, експонента С та гіпербола І;

у випадку двох границь: логістична модель L, у якій значення параметра а визначає нижню границю, а значення b – віддаль між нижньою та верхньою границями.

Для моделювання залежностей з одним максимумом

(мінімумом) можна використати параболу 2 функції оптимуму J, K (залежність із різким екстремумом і наступним похилим наближенням до границі Y=0) та експоненціально-параболічна модель В.

Для представлення залежностей з декількома екстремумами можна використати поліномні моделі, ступінь яких за мінусом одиниці визначає число екстремумів. Ці моделі добрі для екстраполяції, але непридатні для прогнозування, оскільки їх хвости різко йдуть вверх або вниз за границями експериментальної залежності.

Для опису періодичних залежностей можна використати модель М із синусоїдою, у якій параметр b визначає довготривалий приріст, параметр с – амплітуду коливань, а параметр е – довжину періоду коливань.

Часом виникає необхідність розрахувати декілька моделей і серед них, адекватних експериментальним даним, вибрати ту, для якої буде мінімальна стандартна помилка або максимальний коефіцієнт кореляції. Проте все залежить від конкретної задачі: щоб добре локалізувати область максимуму, можна скористатися і неадекватною моделлю для сильно зашумлених даних. Необхідно враховувати, що ряд нелінійних моделей у процесі обчислень зводяться до лінійної моделі з попереднім перетворенням значень змінних. Ця процедура приводить до ліквідації не самих відхилень експериментальних точок від регресійної кривої, а зважених цим перетворенням відхилень.

Опишемо основні формули регресійних моделей системи

STADIA:

455

1)

лінійна

Y = a +b x ,

 

 

2)

парабола

Y = a +b x + c x2 ,

 

 

 

 

 

n

 

 

 

3)

поліноміальна

Y = ai xi

,

 

 

4)

степені 1/2

i=1

 

 

 

Y = a + b x ,

 

 

5)

логарифмічна

Y = a +b ln(x),

 

 

6)

степенева

Y = a xb або Y = exp(a +bln(x)),

7)

степенева

Y = a + bxc ,

 

 

 

8)

експонента

Y = exp(a +b x),

 

 

9)

експонента

Y = exp(a +b / x),

 

 

10)

експонента

Y = exp(a +b

x ),

 

 

11)

експонента

Y = exp(a +b x + c x2 ),

 

 

12)

експонента

Y = a +b exp[c x],

 

 

13)

гіпербола

Y = a + b / x ,

 

 

14)

гіпербола

Y =1/ (a +b x),

 

 

15)

гіпербола

Y =1/ (a +b / x),

 

 

16)

гіпербола

Y =1/ (a +b

x ),

 

 

17)

гіпербола

Y =1/ (a +b ln(x)),

 

 

18)

гіпербола

Y = a +1/ (b + c x),

 

 

19)

оптимуму

Y =1/ (a +b x + c x2 ),

 

 

20)

оптимуму

Y = x / (a +b x + c x2 ),

)

 

 

 

 

(

+ d x)

 

21)

логістична

Y = a +b / 1+ exp(c

 

,

22)

лінійна з синусом

Y = a +b x + c sin(d + e x).

Більшість моделей приводиться до лінійної моделі U = a + b V або параболи U = a + b V + c V 2 шляхом попередньо автоматично

виконаного перетворення значень змінних (крім моделей 7, 12, 18, 21, 22, які обчислюються ітераційним способом):

4.v

i

=

x

 

 

 

ui

= yi

 

13.

v

 

=1/ (x )

ui = yi

 

= ln(x

)

 

 

 

 

 

 

i

i

 

 

 

5.v

 

 

 

ui

= yi

 

14.

vi

= xi

 

ui

=1 / yi

i

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

6.v

 

= ln(x

)

 

 

ui

= yi

 

15.

v

 

=1/ (x

)

ui

=1 / yi

i

 

 

i

 

 

 

= ln(y

)

 

i

i

 

 

 

8.vi

= xi

 

 

 

u

16.

v

i

= x

 

ui

=1 / yi

 

 

=1/ (x

)

i

 

i

)

 

 

= ln(x

)

 

 

9. v

u

= ln(y

17.

v

 

ui

=1 / yi

 

i

 

 

 

i

 

i

 

i

)

 

i

i

 

 

 

10 vi

=

x

 

 

ui

= ln(yi

19.

vi

= xi

 

ui

=1 / yi

11. vi

= xi

 

 

ui

= ln(yi )

20.

vi

= xi

 

ui

= xi / yi

 

 

 

 

 

 

 

 

 

 

 

456

 

 

 

 

 

 

Для порівняння альтернативних моделей і вибору виду функції використовуємо тест Бокса-Кокса. Цей тест припускає таке перетворення масштабу спостережень у, при якому забезпечувалась би можливість безпосереднього порівняння суми квадратів відхилень (СКВ) в лінійній та логарифмічній моделях. Процедура містить такі етапи:

1.Вираховується середнє геометричне значення у для

вибірки. Оскільки воно співпадає з експонентою середнього арифметичного ln(y), тому якщо нами оцінено логарифмічну регресію і отримано середнє значення залежної змінної, то необхідно вирахувати тільки експоненту від цього значення.

2.Перераховуються спостереження у шляхом їх ділення на

значення середнього геометричного, тобто

y =

yi

, де yi

 

 

i

yгеом.

 

 

 

 

значення і-го спостереження; yi – перераховане значення для і-го спостереження; yгеом. – середнє геометричне значення у.

3. Оцінюється регресія для лінійної моделі з використанням yi замість у в якості залежної змінної і для логарифмічної моделі з

використанням ln(y ) замість ln(y); у всіх інших відношеннях

параметри моделі залишаються незмінними. Тоді значення СКВ для двох регресій можна порівняти і, як наслідок, модель з меншою сумою квадратів відхилень забезпечує кращу відповідність.

4. Для того, щоби перевірити, чи не забезпечує одна із моделей значення кращої відповідності, можна обчислити величину

N2 ln Z , де N – число спостережень; Z – відхилення значень СКВ у

перерахованих регресіях. Окреслена статистика має розподіл χ2 з

однією степенню вільності. Якщо вона перевищує рівень значущості, то робиться висновок про наявність значної різниці оцінювання.

15.9.Алгоритм побудови економетричної моделі та оцінка її достовірності

Розглянемо алгоритм побудови економетричної моделі на прикладі впливу вартості основних виробничих фондів підприємств регіону на обсяг отриманого прибутку (умова прикладу 15.1) з допомогою таких кроків.

1. Специфікація моделі. Проведемо специфікацію моделі з допомогою діаграми розсіювання (рис. 15.3.3). Як бачимо, можна зробити припущення про існування між вибраними змінними лінійної форми зв’язку: ˆy = a +bx .

457

2. Знаходження оціночних параметрів. Розрахувати оцінки а та b можна з допомогою методів:

МНК (за системою нормальних рівнянь);

МНК (через відхилення від середніх);

стандартними пакетами прикладних програм (STADIA, STATAN,EXCEL та ін.)

З допомогою першого методу (див. 15.3) знайдено значення оціночних параметрів:

а= –1,8989,

b=1,2114.

Отже, оціночне рівняння має

вигляд yˆ = −1,8989 +1, 2114x.

Такий самий результат можна отримати з допомогою другого методу та відповідних програмних продуктів, наприклад, процедури «Простая регрессия» cистеми STADIA.

3. Геометрична інтерпретація оціночного рівняння. Побудуємо на площині рівняння зазначеної прямої (рис. 15.3.3) і

розглянемо його інтерпретацію.

Коефіцієнт при х (коефіцієнт нахилу) показує, що якщо вартість основних виробничих фондів збільшити на 1 млн. грн., то прибуток відповідно збільшиться на 1,2114 млн. грн. Тобто можна зробити висновок, що збільшення факторного показника на одну одиницю (в одиницях виміру змінної х) призведе до збільшення (b>0) значення результативного показника на b одиниць (в одиницях виміру змінної у).

Постійна величина а дає прогнозне значення у, при х=0. Залежно від конкретної ситуації це твердження може мати або не мати чіткого економічного змісту.

При проведенні інтерпретації рівняння регресії дуже важливо пам’ятати про три особливості. По-перше, а є лише оцінкою α, а b – оцінкою β. Тому вся розглянута інтерпретація дійсно представляє собою лише оцінку. По-друге, рівняння регресії відображає тільки загальну тенденцію для вибірки. Тому на кожне окреме спостереження впливає випадковість. По-третє, правильність інтерпретації великою мірою залежить від правильності специфікації рівняння.

4. Обчислення загальної, пояснювальної та непояснювальної дисперсій.

Для знаходження окреслених дисперсій використаємо наступні формули:

 

n

 

y )

 

 

n

 

 

y )

 

 

 

n

yi )

 

 

 

(yi

2

 

(yi

2

 

 

(yi

2

 

 

 

 

 

ˆ

 

 

 

 

 

ˆ

 

σ2заг =

i=1

 

 

 

; σпоясн2 =

i=1

 

 

 

 

; σнепоясн2

=

i=1

 

 

.

n

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Для проведення необхідних обчислень побудуємо таблицю 15.2.

458

459

Перейдемо до знаходження числових значень дисперсій і відповідних їм середньоквадратичних відхилень.

Отже, маємо:

 

 

 

 

y =

30,8

= 3,08, x =

41,1

= 4,1,

 

 

 

10

 

 

 

18 7632

 

 

10

 

 

σзаг2 =

 

=1,84737 ,

σзаг. =

1,84743 =1,3698,

 

 

 

 

 

10

 

 

 

 

 

 

 

 

σпоясн2

. =

 

18,4743

=1,84743,

σпоясн. =

1,84743 =1,3592,

 

 

 

 

10

 

 

 

 

 

 

 

 

σнепоясн2 . = 0,25766310 = 0,257663, σнепоясн. = 0,1605.

5.Знаходимо інтервали довіри оціночного рівняння.

Інтервали довіри знайдемо за формулою: yx = t p σнепоясн. , де tp – імовірний коефіцієнт, який при заданих рівнях імовірності Р знаходиться за таблицями нормального розподілу. Для його

знаходження необхідно розв’язати рівняння:2Ф(tp )= P , де Ф(tp )

інтегральна

функція Лапласа. Так,

наприклад, для Р=0,9 маємо:

tр=1,65. Тоді

yx =1,65 0,1605 = 0,2648 .

 

 

Довірчий інтервал знаходимо з нерівності:

 

ˆ

0,2648

yi

ˆ

+

0,2648,

 

yi

 

 

yi

 

1,8989 +1,2114xi 0,2648 yi ≤ −1,8989 +1,2114xi + 0,2648,

 

2,1637 +1,2114xi

yi

≤ −1,6341+1,2114xi .

Доповнимо рис. 15.3.3 геометричною інтерпретацією отриманих довірчих інтервалів. Нам необхідно побудувати дві додаткові граничні прямі, які відображають на площині верхню та нижню частини отриманої нерівності. Між цими прямими знаходиться наше оціночне рівняння. На графіку воно подано більш ширшою лінією.

6. Знаходження значень коефіцієнтів детермінації та кореляції. Для обчислення коефіцієнта детермінації використовуємо

формулу:

R2 =1

σнепоясн2

.

=1

0,2577

= 0,8626 ,

σзаг2 .

 

1,8763

 

 

 

 

а коефіцієнт кореляції знайдемо за формулою:

r = R = ± 1

σ2

= 0,8626 = 0,9288.

непоясн.

σ2

 

 

 

заг.

 

460

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]