Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Navch._posibnuk_Ivaschyk

.pdf
Скачиваний:
106
Добавлен:
12.02.2016
Размер:
4.89 Mб
Скачать

для входу в екранний довідник з наступним рухом по електронних посиланнях.

Допомога експертної системи. Якщо виникає сумнів у виборі методу аналізу даних, то можна скористатися порадами експертної системи. Для цього потрібно натиснути клавішу F1 для входу в довідник і перейти в його заголовок. Одразу ввійти в експертну систему можна із підпункту «Выбор метода» пункту «Помощь» верхнього командного рядка.

На екрані буде запропоновано декілька типів даних з поясненнями. Уточнюючи в послідовних екранах наявний тип даних, можна отримати повну інформацію про використання для цих даних методів аналізу і розв’язування з їхньою допомогою відповідних задач.

Вхідні дані для статистичного аналізу, як правило, отримують у результаті експерименту, опитування чи спостереження, в ході якого фіксуються значення однієї або декількох змінних. У термінах статистики кажуть, що проводиться обмежена вибірка з деякої, часом необмеженої, генеральної сукупності об’єктів або явищ.

Коли для кожного об’єкта у вибірці знайдене значення однієї змінної, то така вибірка називається одномірною. Якщо для кожного об’єкту регіструються значення двох або декількох змінних, то такі дані називаються багатомірними.

Однією з основних задач статистичного аналізу є отримання на основі наявної вибірки достовірних відомостей про характеристики генеральної сукупності, що інтересують дослідника. Тому важливою вимогою до вибірки є її репрезентативність, тобто правильне представлення в ній пропорцій генеральної сукупності.

Переважно в статистиці розрізняють три типи значень змінних: кількісні, номінальні та рангові. Значення кількісних змінних є числовими, вони можуть бути впорядкованими, для них можна виконувати різні обчислення. На обробку кількісних змінних орієнтована переважна більшість статистичних методів. Значення номінальних змінних є нечисловими, вони означають приналежність їх до деякого класу і не можуть бути впорядкованими або безпосередньо використаними в обчисленнях. До номінальних змінних можна використовувати лише вибрані розділи математичної

411

статистики, наприклад, категорійний аналіз. Проте в ряді випадків для цієї мети можуть бути використані й деякі рангові та кількісні методи, якщо номінальні значення попередньо замінити на числа, що означають їх умовні коди. Рангові або порядкові змінні займають проміжне місце: їх значення впорядковані, але не можуть бути з впевненістю виміряними та порівняними кількісно.

Рангові та номінальні значення при введенні даних необхідно позначати цілими числами. Якщо змінні введені у вигляді символьних позначень, перетворення їх до числового виду може бути проведене з допомогою операцій кодування.

Зрозуміло, що методи, які можна використати до номінальних змінних, можна застосувати і до рангових даних, а так само і до кількісних даних, якщо провести їх перетворення: розбити діапазон зміни кількісної змінної на задане число інтервалів, а попадання значень в діапазон інтерпретувати як належність до відповідного класу. Таке перетворення легко здійснюється операцією кодування. З метою класифікації використання математичних методів будемо розрізняти такі типи вхідних даних:

hодна вибірка: невпорядкована, структурована;

hдекілька вибірок: незалежні, зв’язані дані факторного експерименту;

hодин часовий ряд; hзв’язані часові ряди;

hекспериментальна залежність: однопараметрична, багатопараметрична;

hбагатомірні дані.

Одною вибіркою називається сукупність вимірів деякої кількісної, номінальної або рангової змінної, проведених в ході експерименту, опитування, спостереження. Завдання виявлення відмінностей двох вибірок вирішують різні параметричні та непараметричні критерії.

Вибірка, елементи якої різняться тільки за величиною і їх порядок несуттєвий, називається невпорядкованою. У структурованій (впорядкованій) вибірці кожний її елемент, крім своєї величини, має

412

спеціально індивідуальну характеристику (значення певного зовнішнього параметра).

Для декількох вибірок будемо розрізняти два випадки:

а) незалежні вибірки, коли їх отримують в експерименті незалежно один від одного;

б) зв’язані вибірки, коли вони отримані в результаті вимірювання значень ряду змінних із деякої множини об’єктів.

В якості часткового випадку зв’язаних вибірок можна розглянути парні вибірки, в яких є значення двох змінних, виміряних з деякої множини об’єктів.

Часовий ряд або процес представляє значення кількісної змінної -відгуку, виміряної через рівні інтервали значень іншої кількісної змінної-параметра (наприклад, час виміру). Вхідними даними, як правило, вважають значення змінної-відгуку.

Зв’язані часові ряди є синхронними за часовим параметром вимірювання однієї змінної в різних точках чи об’єктах або вимірювання декількох змінних в одній точці чи об’єкті. При цьому припускається наявність деякого фізичного зв’язку між змінними, точками або об’єктами.

Експериментальна залежність переважно пояснюється як послідовність вимірювань залежності кількісної змінної або відгуку, виконаних при заданих значеннях однієї або декількох незалежних кількісних змінних.

Вхідні дані представлено у виді прямокутної матриці, яка містить відповідні значення залежної і незалежної змінних. Експериментальна залежність від декількох змінних може розглядатися також як частковий випадок багатомірних даних. Частковим випадком експериментальної залежності від одного часового подібного параметра є часовий ряд.

Багатомірні дані для статистичного аналізу є прямокутною матрицею. Це можуть бути виміри значень змінних в декількох об’єктах або в декількох точках простору, або це можуть бути виміри значень змінних в одного об’єкта у різні моменти часу або у різних станах.

413

14.6. Питання для самоконтролю

1.Дайте визначення економетрії.

2.У чому полягає головне призначення економетрії?

3.Що є математико-статистичним інструментарієм економетрії?

4.Охарактеризуйте класи задач, які розв’язують математичним апаратом економетрії.

5.Опишіть схему взаємозв’язку економетрії з іншими дисциплінами.

6.Охарактеризуйте логічну структуру економетричних досліджень.

7.Запишіть найпростіший вид економетричної моделі.

8.З яких елементів складається економетрична модель?

9.Наведіть кілька прикладів економетричних моделей.

10.Дайте тлумачення випадкової складової економетричної моделі.

11.Покажіть схему взаємозв’язків основних етапів економетричних досліджень.

12.Охарактеризуйте основні етапи економетричного моделювання.

13.Перелічіть і охарактеризуйте основні проблеми економетричного моделювання.

14.Опишіть основні типи причинних зв’язків між явищами.

15.Що є діаграмою причинних відношень економетричної моделі?

16.Дайте класифікацію змінних величин в економетричних моделях.

17.Сформулюйте основні принципи побудови економетричних рівнянь.

18.Дайте тлумачення ендогенних та екзогенних змінних.

19.Що таке наперед визначені та спільно залежні змінні?

20.Покажіть загальну схему взаємодії змінних процесу економетричного моделювання.

414

Розділ 15. Моделі парної регресії та їх економетричний аналіз

Функціональні та технічні можливості сучасних засобів обчислювальної техніки перетворили багатовимірний статистичний аналіз із теоретичного розділу математичної статистики на могутній інструмент прикладних досліджень соціально-економічних явищ і процесів, яким властива багатовимірність параметрів, що їх описують. Основу багатовимірного статистичного аналізу складають методи регресійного аналізу.

Під регресією розуміють односторонню стохастичну залежність однієї випадкової змінної від другої чи декількох інших випадкових змінних. Таким чином, регресія встановлює відповідність між випадковими змінними. Наприклад, при визначенні залежності обсягу податкових надходжень (y) від ставки податку (х) мова йде про визначення одностороннього зв’язку, тобто про регресію. Обидві змінні є випадковими. Кожному значенню х відповідає множина значень у і навпаки, кожному значенню у відповідає множина значень х. Отже, маємо справу із статистичним розподілом значень х і у. Тому ми повинні знайти стохастичну залежність між у і х. Одностороння стохастична залежність виражається за допомогою функції, яка на відміну від строгої математичної залежності називається функцією регресії чи просто регресією.

Суттєвою різницею між строгою функціональною залежністю та функцією регресії є те, що у першому випадку аргумент (незалежна змінна) повністю визначає значення функції і для неї існує обернена

(наприклад, функція у=х2, тоді x = y ). Функція регресії цією

властивістю не володіє. Тільки в граничному випадку, коли стохастична залежність переходить у функціональну, перехід одного рівняння регресії в друге стає можливим, тобто починає проявлятися властивість зворотності. Отже, якщо між явищами відсутній функціональний зв’язок, а є тільки стохастичний, то функція регресії буде незворотною. Це зумовлено, по-перше, самою структурою явища, яке визначає напрямок зв’язку; по-друге, формулюванням задачі дослідження, при якому досягається визначена мета: як за значенням однієї змінної, що вибрана аргументом, передбачити відповідне значення другої (функції); по-третє, способом вимірювання відхилень емпіричних точок. Виходячи з вищенаведеного, встановлюється регресія у на х чи х на у, залежно від

415

того, яка стохастична залежність досліджується: у на х чи х на у, відповідно.

Часто між двома чи більше змінними виникають зв’язки, для яких логічне тлумачення можливе тільки в одному напрямку і, як наслідок, доцільно знаходити тільки одну функцію регресії.

Функція регресії формально встановлює відповідність між змінними, хоч вони можуть і не бути у причинно-наслідкових відношеннях. У цьому випадку можуть виникати хибні регресії, які не мають жодної практичної цінності і взагалі змісту. Тому, при побудові рівнянь регресії, слід завжди виходити з реальних завдань, які мають прикладний характер.

Перейдемо до класифікації регресій відповідно числа змінних в моделі та форм залежності. За числом змінних, введених у регресійне рівняння, розрізняють просту (парну) та множинну (багатофакторну) регресії. Відносно форми залежності моделі діляться на лінійну та нелінійну регресії.

15.1. Модель парної лінійної регресії

Проста (парна) лінійна регресія встановлює лінійну залежність між двома змінними. При цьому одна із змінних (у) вважається залежною змінною (екзогенна, регресант, результативна змінна, відгук) і розглядається як функція від другої (х) незалежної змінної (ендогенна, пояснювальна, регресор).

Для загального випадку проста лінійна модель записується так:

y = α +βx +u .

(15.1)

Величина у={у12…, уn} складається з двох

складових: 1)

невипадкової складової α+βх, де х={х12,..., хn}, α і β – параметри рівняння; 2) випадкова складова (збурення, помилки) u={u1,u2,..,un}.

Розглянемо геометричну інтерпретацію комбінації цих двох складових (рис.15.1.1). Показники х12,.., хn – це гіпотетичні значення пояснювальної змінної. Якщо би співвідношення між у та х були однаковими, то відповідні значення у були би представлені точками В12,..,Вn на одній прямій. Наявність випадкового члена збурення приводить до того, що насправді значення у отримують іншим. Відзначимо на графіку реальні значення у при відповідних значення х з допомогою точок А1, А2, ..., Аn.

416

y

 

 

Ai

 

 

 

yi

 

 

Bn

 

 

 

 

 

A1

Bi

y1

 

B2

ui

 

un

 

 

yn

 

u1

 

B1

 

An

 

u2

y2

A2

 

 

 

 

0

x1

x2 xi

xn

x

Рис. 15.1.1. Фактична залежність між у і х

Фактичні значення параметрів α і β, випадкової складової u та положення точок В12, ..., Вn невідомі. Задача регресійного аналізу полягає в знаходженні оцінок α і β і, як наслідок, у визначенні прямої за точками А12, ..., Аn.

Якщо випадкова змінна u (збурення) була би відсутньою, то точки Аі співпадали би з точками Ві і точно показували б положення прямої. В такому випадку достатньо було би просто побудувати цю пряму і визначити значення α і β.

Розглянемо основні причини існування збурення.

1. Невключення в модель пояснювальних змінних. Встановлення зв’язку тільки між двома факторами у та х є дуже великим спрощенням. Наспрaвді існують інші фактори, що суттєво впливають на результативний показник і які не враховані або не можуть бути врахованими у формулі (15.1). Вплив цих факторів приводить до того, що істинні точки лежать поза прямою. Об’єднавши всі такі можливі складові впливу на результативний показник, ми отримаємо величину u. Наприклад, при вивченні залежності національного доходу від капітальних вкладень, збурена змінна u містила б у собі вплив на національний дохід таких чинників: число робітників зайнятих у сфері виробництва, продуктивність праці, використання основних фондів та інших випадкових факторів. Якщо би ми точно знали, які змінні необхідно вводити в модель, і мали можливість точно їх виміряти, то можна на їх основі будувати рівняння і тим самим виключати відповідний елемент збурення.

417

2.Агрегування змінних. У багатьох випадках запропонована модель – це спроба об’єднати разом деяке число економічних показників. Оскільки окремі економічні показники мають різні характеристичні параметри, тому спроба визначити співвідношення між ними носить апроксимізаційний характер. Існуюча розбіжність при цьому приписується наявному збуренню.

3.Неправильний опис структури моделі. Структура моделі може бути описаною неправильно або не повністю правильно.

4.Неправильна функціональна специфікація. Функціональне співвідношення між у та х математично може бути визначене неправильно. Наприклад, фактична залежність не є лінійною, а може бути більш складною. Проте використання навіть найбільш підходящої формули є деяким наближенням, і тому існуюча розбіжність вносить свої корективи у залишковий член.

5.Помилки вимірювання. Якщо у вимірюваннях однієї або більше взаємозв’язаних змінних є помилки, то знайдені значення не будуть відповідати точному співвідношенню, і існуюча розбіжність буде вносити свій вклад у структуру збуреної змінної.

Отже, збурення є сумарним проявом перелічених вище факторів.

15.2. Діаграма розсіювання регресійної функції

Для аналізу залежності між двома змінними використовують діаграму розсіювання, яка є графічною формою представлення інформації у прямокутній системі координат. На осі абсцис відзначають значення незалежної змінної (х), на осі ординат – значення залежної змінної (у). Результат кожного спостереження (хі, уі) деякого економічного процесу відображається точкою на площині. Сукупність цих точок утворює хмарку, яка відображає зв’язок між двома змінними. Діаграма розсіювання є геометричною формою систематизації інформаційної бази процесу дослідження.

За шириною розкиду точок можна зробити висновок про тісноту зв’язку сукупності. Якщо точки розміщені близько одна до одної (у вигляді вузької смужки), то можна стверджувати про наявність відносно тісного зв’язку. Якщо точки на діаграмі розкидані широко, то має місце слабкий зв’язок між змінними (рис. 15.2.1).

418

Часткового вирішення основної задачі регресійного аналізу для випадку парної залежності можна домогтися побудувавши діаграму розсіювання. На рис. 15.2.2 представлені основні форми залежностей.

 

y

 

 

 

 

 

 

 

 

 

 

*

*

*

 

 

 

 

 

*

 

*

 

*

 

 

 

 

* * *

* *

* *

 

 

 

 

*

* *

*

* *

 

 

 

 

*

*

 

*

*

 

 

 

 

 

 

*

*

 

 

 

 

0

 

 

 

 

 

х

 

 

Рис. 15.2.1. Діаграма розсіювання у випадку відсутності зв’язку

 

 

 

Додатна регресія

 

 

y

 

y

 

 

 

 

y

 

 

 

 

 

 

 

 

***

 

**

 

 

 

 

 

 

 

 

 

 

 

***

 

****

 

***

 

 

 

 

***

***

 

 

***

 

 

 

 

***

****

 

 

***

 

 

 

 

***

***

 

 

***

 

 

 

 

***

***

 

 

***

 

 

 

 

***

***

 

 

**

 

 

***

***

 

***

 

 

 

 

 

 

 

 

 

0

х

0

 

 

 

x

0

x

а)

 

б)

Від’ємна регресія

в)

 

 

 

 

 

 

 

y

 

y

 

 

 

y

 

 

*

 

***

***

**

 

 

* **

 

 

 

***

 

 

** *

 

 

 

 

***

***

 

 

* **

 

 

 

 

***

 

 

 

 

 

 

***

 

 

** *

 

 

 

 

***

 

 

* * *

 

 

 

 

****

***

 

 

* * **

 

 

 

 

***

***

***

 

 

 

 

 

 

 

0

x

0

 

 

x

0

x

г)

 

д)

 

 

 

 

е)

 

Рис. 15.2.2. Основні форми регресій

419

Отже, розрізняють додатну лінійну та нелінійну і від’ємну лінійну та нелінійну регресії. Наприклад, така ситуація буде мати місце при вивченні залежності обсягу випуску продукції від вартості основних виробничих фондів. Додатна рівноприскорена зростаюча регресія (рис. 15.2.2 б) існує, наприклад, між прибутковим податком і заробітною платою. Додатна рівносповільнена зростаюча регресія (рис.15.2.2 в) може мати місце при встановленні залежності рівня продуктивності праці від стажу роботи.

Від’ємна лінійна регресія (рис.15.2.2 г) показує рівномірний спад функції, наприклад, залежність кількості підприємств регіону, що будуть випускати окреслений вид продукції від ставки податку. На рис. 15.2.2 г та 15.2.2 е схематично подано відповідні ситуації взаємозв’язку від’ємної рівноприскореної та рівносповільненої спадної регресії. Дуже часто наведені різновиди регресій трапляються не в чистому вигляді, а в поєднанні одна з одною, як це видно на рис.15.2.3. Регресії такого типу називаються комбінованими формами.

y

 

 

y

******

 

 

****

*****

 

 

****

****

 

 

****

****

 

 

****

****

 

 

****

* ****

 

 

****

*******

 

 

******

0

x

0

x

Рис. 15.2.3. Комбіновані форми регресій

Наведені діаграми показують, що кожному значенню пояснювальної змінної відповідає розподіл значень залежної змінної і навпаки. Зв’язок шукають, виходячи з цих розподілів. Важливо не тільки вказати загальну тенденцію зміни залежної змінної, але й вияснити, якою буде дія головних факторів-аргументів на залежну змінну, якщо б інші (другорядні, побічні) не змінювались і знаходились на одному й тому середньому рівні. Для цього визначають функцію регресії у вигляді математичного рівняння того чи іншого вигляду. Процес знаходження функції регресії називають вирівнюванням окремих значень залежної змінної. Побудова регресії

420

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]