- •Економетрика конспект лекцій
- •Зауваження................................................................................................118
- •1. Регресійний аналіз. Регресійний аналіз для двох змінних: основні ідеї
- •1.1. Гіпотетичний приклад
- •1.2. Концепція регресійної функції популяції (prf роpulation regression function)
- •1.3. Значення терміна “лінійність”
- •1.4. Стохастичні властивості prf
- •1.5. Важливість урахування складової стохастичного збурення
- •1.6. Вибіркова регресійна функція (srf)
- •2. Двовимірна регресійна модель. Задача оцінки
- •2.1. Метод найменших квадратів
- •Експериментальне визначення srf
- •2.2. Властивості оцінок за мнк
- •Дійсна й оцінена ціна будинку і його житлова площа у кв. Футах
- •Припущення 4 гомоскедастичність або рівність дисперсій
- •Це припущення не таке нешкідливе, як здається. Розглянемо рівняння
- •2.3. Точність або стандартна похибка оцінювачів за мнк
- •2.4. Властивості оцінювачів за мнк: теорія Гаусса-Маркова
- •2.5. Коефіцієнт детермінації : міра «якості підгонки»
- •2.6. Числовий приклад
- •2.7. Ілюстративні приклади
- •3. Інтервальні оцінки і перевірка гіпотез
- •3.1. Інтервальні оцінки: основні ідеї
- •3.2 Довірчі інтервали для регресійних коефіцієнтів і
- •Отже, наприклад, змінна
- •3.3. Довірчий інтервал для
- •3.4. Перевірка гіпотез: загальні зауваження
- •3.5. Перевірка гіпотез: підхід на основі довірчого інтервалу
- •3.6. Перевірка гіпотез: підхід, оснований на перевірці значимості
- •3.7. Перевірка значимості : хі-квадрат тест
- •3.8. Регресійний аналіз і аналіз дисперсії
- •Розглянемо таку змінну:
- •3.9. Застосування регресійного аналізу: проблема прогнозу
- •3.10. Форма звіту за результатами регресійного аналізу
- •3.11. Обчислення результатів регресійного аналізу
- •Залишки для проведення -тесту
- •4. Розвиток двовимірної лінійної моделі регресії
- •4.1. Регресія, що проходить через початок координат
- •4.2. Масштабування й одиниці вимірювання
- •Валові внутрішні приватні інвестиції (gpdi) і валовий національний продукт (gnp) у цінах 1972 р. У доларах сша, 1974–1983 рр.
- •4.3. Функціональний вид регресійної моделі
- •4.4. Вимірювання еластичності. Лінійно-логарифмічна модель
- •4.5. Напівлогарифмічні моделі. Визначення темпів зростання.
- •4.6. Обернені моделі
- •4.7. Зауваження щодо стохастичної складової
- •5. Множинний регресійний аналіз. Задача оцінювання
- •5.1. Модель із трьома змінними. Позначення і гіпотези
- •5.2. Інтерпретація рівняння множинної регресії
- •5.3. Значення частинних коефіцієнтів регресії
- •5.4. Оцінка частинних коефіцієнтів регресії за мнк
- •5.6. Проста регресія в контексті множинної регресії
- •5.7. R2 і скорегований r2
- •5.8. Частинні коефіцієнти кореляції
- •5.9. Виробнича функція Коба – Дугласа
- •5.10. Поліноміальная модель регресії
- •6. Припущення нормальності розподілу залишків
- •Витрати на споживання і особистий дохід у сша за 1956–1970 рр.
- •7. Перевірка гіпотез множинної регресії. Загальні зауваження
- •7.1. Перевірка гіпотези про частинний коефіцієнт регресії
- •7.2. Перевірка вибіркової регресії на загальну значущість
- •7.3. Перевірка на рівність двох коефіцієнтів регресії
- •7.4. Перевірка лінійних обмежень
- •Обчислимо
- •7.5. Перевірка структурної стабільності моделей регресії
- •Можна показати, що при виконанні згаданих припущень
- •7.6. Перевірка функціонального виду регресії. Вибір між лінійною моделлю регресії і лінійно-логарифмічною моделлю
- •8. Прогнозування в разі множинної регресії
- •9. Множинна регресія. Матричний метод
- •9.1. Лінійна модель регресії з k змінними
- •9.2. Припущення класичної лінійної моделі регресії в матричній формі
- •Припущення класичної лінійної моделі регресії
- •9.3. Оцінювання за мнк
- •9.4. Коефіцієнт детермінації r2 у матричному позначенні
- •9.5. Кореляційна матриця
- •9.6. Перевірка гіпотез про індивідуальні коефіцієнти регресії в матричному позначенні
- •9.7. Загальна перевірка регресії на значущість. Аналіз дисперсії в матричному позначенні
- •Матричне формулювання anova-таблиці
- •9.8. Перевірка лінійних обмежень. Загальний f-тест у матричних позначеннях
- •9.9. Прогнозування в множинній регресії. Матричне формулювання
- •9.10. Ілюстративний приклад у матричних позначеннях
- •Витрати на споживання на душу населення (ppce) і дохід на душу населення (ppdi) в сша за 1956–1970 рр.
- •Anova-таблиця для даних з таблиці 9.4.
9.10. Ілюстративний приклад у матричних позначеннях
Підводячи підсумки використання матричного апарату, розглянемо числовий приклад для моделі з трьома змінними. Пригадаємо приклад для регресії сукупних особистих витрат на споживання за сукупним особистим доходом і часом на період 1956–1970 рр. Наголошувалося, що змінна тренда t може зображувати серед іншого сукупне населення: сукупні витрати на споживання повинні збільшуватися зі зростанням населення. Одним зі шляхів для ізолювання впливу зростання населення є перехід до сукупних витрат і сукупного доходу на душу населення. Регресія сукупних витрат на душу населення залежно від сукупного доходу на душу населення дасть співвідношення між витратами і доходом незалежно від зміни населення. Змінна тренда може залишатися в моделі для обліку впливу на витрати інших чинників (наприклад, технології). Отже, модель регресії може бути зображена у вигляді
, |
(9.10.1) |
де Y – витрати на душу населення; X2 – дохід на душу населення; X3 – час. У табл. 9.4 подані необхідні для цієї моделі дані.
Таблиця 9.4
Витрати на споживання на душу населення (ppce) і дохід на душу населення (ppdi) в сша за 1956–1970 рр.
PPCE, Y |
PPDI, X2 |
Час, X3 |
1673 |
1839 |
1 (1956) |
1688 |
1844 |
2 |
1666 |
1831 |
3 |
1735 |
1881 |
4 |
1749 |
1883 |
5 |
1756 |
1910 |
6 |
1815 |
1969 |
7 |
1867 |
2016 |
8 |
1948 |
2126 |
9 |
2048 |
2239 |
10 |
2128 |
2336 |
11 |
2165 |
2404 |
12 |
2257 |
2487 |
13 |
2316 |
2535 |
14 |
2324 |
2595 |
15 (1970) |
У матричних позначеннях наша задача може бути зображена в такому вигляді:
|
(9.10.2) |
За наведеними даними можна отримати значення величин:
, , , ; , ; |
|
|
; |
|
|
, . |
(9.10.3) |
Сума квадратів залишків може бути підрахована за формулою
. |
(9.10.4 |
Звідси можна отримати
. |
(9.10.5) |
Матрицю варіацій можна обчислити за такою формулою
. |
(9.10.6) |
Діагональні елементи цієї матриці дають значення дисперсій коефіцієнтів , і , а корінь квадратний із них дає значення стандартної похибки.
За наведеними даними можна легко перевірити, що
ESS=828144,47786; |
(9.10.7) |
TSS=830121,333. |
(9.10.8) |
Отже,
R2=0,99761. |
(9.10.9) |
Застосовуючи формулу (7.8.4) можна визначити наведений коефіцієнт детермінації
. |
(9.10.10) |
Підсумовуючи отримані результати, одержуємо
, (78,31763) (0,04753) (2,98354) t = (3,83421) (15,61077) (2,69598) R2=0,99761, , DF=12. |
(9.10.11) |
Інтерпретація результатів (9.10.14). Якщо обидві величини Х2 і Х3 набувають фіксованих нульових значень, то середня величина витрат на душу населення складає приблизно 300 дол. повинна братися з великою обережністю. Частинний коефіцієнт регресії означає, що не змінюючи інші змінні, зростання доходів приводить до збільшення витрат на споживання на душу населення на 0,74 дол. Коротше кажучи, оцінка граничної схильності до споживання складає приблизно 74%. Аналогічно, не змінюючи інших змінних, середні витрати на споживання зростають за рік приблизно на 8 дол. за досліджуваний період. Величина R2=0,99761 показує, що взяті дві пояснювальні змінні дозволяють врахувати більше 99% дисперсії витрат на споживання на душу населення в США за даний період. Хоча трохи менше, ніж R2, проте цей коефіцієнт залишається дуже високим.
Переходячи до аналізу статистичної значущості коефіцієнтів регресії, ми відзначаємо з (9.10.14), що кожний окремий коефіцієнт регресії статистично значимий, скажімо, при 5%-му рівні значущості (з таблиць ми бачимо, що критичне значення t для DF=12 є 2.179). Кожна з підрахованих t-величин більша, ніж це значення. Отже, ми можемо відхиляти нульові гіпотези про нульові значення величин істинних коефіцієнтів регресії.
Як уже було відзначено раніше, ми не можемо застосувати результати t-тесту для перевірки гіпотези про те, що , оскільки процедура t-тесту припускає, що при проведенні тесту кожного разу проводиться незалежна вибірка. Якщо ж одна й та сама вибірка використовується для перевірки гіпотез одночасно для і , то ймовірно, що оцінки і від’ємно корельовані (коваріація між ними складає –0,13705). Тому ми не можемо застосовувати t-тест для перевірки гіпотези про те, що .
Для перевірки цієї гіпотези може бути застосований і F-тест, розглянутий нами в розд. 8. Для використовування F-тесту нам необхідні дані ANOVA-таблиці.
Таблиця 9.5