- •Економетрика конспект лекцій
- •Зауваження................................................................................................118
- •1. Регресійний аналіз. Регресійний аналіз для двох змінних: основні ідеї
- •1.1. Гіпотетичний приклад
- •1.2. Концепція регресійної функції популяції (prf роpulation regression function)
- •1.3. Значення терміна “лінійність”
- •1.4. Стохастичні властивості prf
- •1.5. Важливість урахування складової стохастичного збурення
- •1.6. Вибіркова регресійна функція (srf)
- •2. Двовимірна регресійна модель. Задача оцінки
- •2.1. Метод найменших квадратів
- •Експериментальне визначення srf
- •2.2. Властивості оцінок за мнк
- •Дійсна й оцінена ціна будинку і його житлова площа у кв. Футах
- •Припущення 4 гомоскедастичність або рівність дисперсій
- •Це припущення не таке нешкідливе, як здається. Розглянемо рівняння
- •2.3. Точність або стандартна похибка оцінювачів за мнк
- •2.4. Властивості оцінювачів за мнк: теорія Гаусса-Маркова
- •2.5. Коефіцієнт детермінації : міра «якості підгонки»
- •2.6. Числовий приклад
- •2.7. Ілюстративні приклади
- •3. Інтервальні оцінки і перевірка гіпотез
- •3.1. Інтервальні оцінки: основні ідеї
- •3.2 Довірчі інтервали для регресійних коефіцієнтів і
- •Отже, наприклад, змінна
- •3.3. Довірчий інтервал для
- •3.4. Перевірка гіпотез: загальні зауваження
- •3.5. Перевірка гіпотез: підхід на основі довірчого інтервалу
- •3.6. Перевірка гіпотез: підхід, оснований на перевірці значимості
- •3.7. Перевірка значимості : хі-квадрат тест
- •3.8. Регресійний аналіз і аналіз дисперсії
- •Розглянемо таку змінну:
- •3.9. Застосування регресійного аналізу: проблема прогнозу
- •3.10. Форма звіту за результатами регресійного аналізу
- •3.11. Обчислення результатів регресійного аналізу
- •Залишки для проведення -тесту
- •4. Розвиток двовимірної лінійної моделі регресії
- •4.1. Регресія, що проходить через початок координат
- •4.2. Масштабування й одиниці вимірювання
- •Валові внутрішні приватні інвестиції (gpdi) і валовий національний продукт (gnp) у цінах 1972 р. У доларах сша, 1974–1983 рр.
- •4.3. Функціональний вид регресійної моделі
- •4.4. Вимірювання еластичності. Лінійно-логарифмічна модель
- •4.5. Напівлогарифмічні моделі. Визначення темпів зростання.
- •4.6. Обернені моделі
- •4.7. Зауваження щодо стохастичної складової
- •5. Множинний регресійний аналіз. Задача оцінювання
- •5.1. Модель із трьома змінними. Позначення і гіпотези
- •5.2. Інтерпретація рівняння множинної регресії
- •5.3. Значення частинних коефіцієнтів регресії
- •5.4. Оцінка частинних коефіцієнтів регресії за мнк
- •5.6. Проста регресія в контексті множинної регресії
- •5.7. R2 і скорегований r2
- •5.8. Частинні коефіцієнти кореляції
- •5.9. Виробнича функція Коба – Дугласа
- •5.10. Поліноміальная модель регресії
- •6. Припущення нормальності розподілу залишків
- •Витрати на споживання і особистий дохід у сша за 1956–1970 рр.
- •7. Перевірка гіпотез множинної регресії. Загальні зауваження
- •7.1. Перевірка гіпотези про частинний коефіцієнт регресії
- •7.2. Перевірка вибіркової регресії на загальну значущість
- •7.3. Перевірка на рівність двох коефіцієнтів регресії
- •7.4. Перевірка лінійних обмежень
- •Обчислимо
- •7.5. Перевірка структурної стабільності моделей регресії
- •Можна показати, що при виконанні згаданих припущень
- •7.6. Перевірка функціонального виду регресії. Вибір між лінійною моделлю регресії і лінійно-логарифмічною моделлю
- •8. Прогнозування в разі множинної регресії
- •9. Множинна регресія. Матричний метод
- •9.1. Лінійна модель регресії з k змінними
- •9.2. Припущення класичної лінійної моделі регресії в матричній формі
- •Припущення класичної лінійної моделі регресії
- •9.3. Оцінювання за мнк
- •9.4. Коефіцієнт детермінації r2 у матричному позначенні
- •9.5. Кореляційна матриця
- •9.6. Перевірка гіпотез про індивідуальні коефіцієнти регресії в матричному позначенні
- •9.7. Загальна перевірка регресії на значущість. Аналіз дисперсії в матричному позначенні
- •Матричне формулювання anova-таблиці
- •9.8. Перевірка лінійних обмежень. Загальний f-тест у матричних позначеннях
- •9.9. Прогнозування в множинній регресії. Матричне формулювання
- •9.10. Ілюстративний приклад у матричних позначеннях
- •Витрати на споживання на душу населення (ppce) і дохід на душу населення (ppdi) в сша за 1956–1970 рр.
- •Anova-таблиця для даних з таблиці 9.4.
6. Припущення нормальності розподілу залишків
Якби нашою єдиною метою було отримання точних оцінок параметрів моделі регресії за МНК, який не вимагає ніяких припущень про закон розподілу залишків, то отриманих результатів було б достатньо. Проте якщо метою дослідження є й отримання статистичних висновків, то нам необхідно зробити припущення про закон розподілу .
З причин, детально розглянутих раніше, ми знову припускаємо, що підпадають під нормальний закон розподілу з нульовим середнім і постійною дисперсією і . При цьому припущенні виявляється, що знайдені за МНК частинні коефіцієнти регресії є найкращими лінійними незміщеними оцінками. Крім того, оцінки , , самі підкоряються нормальному закону розподілу із середніми значеннями , , і дисперсіями, визначуваними за формулами (5.4.9), (5.4.11) і (5.4.14). Величина підкоряється закону розподілу з (n–3) степенями вільності, а три оцінки коефіцієнтів регресії розподілено незалежно від . На підставі вищезазначеного можна показати, що замінюючи на її незміщену оцінку у формулах для стандартних похибок, кожна з величин
; |
(6.1) |
; |
(6.2) |
|
(6.3) |
розподілена за законом t-розподілу з (n–3) степенями вільності.
Відзначимо, що кількість степенів вільності тепер складає (n–3), оскільки для обчислення і, отже, нам спочатку необхідно визначити три частинні коефіцієнти регресії. Унаслідок цього на суму квадратів залишків (RSS) накладаються три обмеження (за логікою в моделі з чотирма змінними кількість степенів вільності дорівнює n–4 і т.д.).
Таким чином, t-розподіл може бути застосований для побудови довірчих інтервалів, а також для перевірки статистичних гіпотез про значення істинних коефіцієнтів регресії. Аналогічно, розподіл може бути використаний для перевірки гіпотез про істинне значення . Для демонстрації описаного механізму звернемося до ілюстрованого прикладу.
Зв’язок між особистими витратами й особистими доходами в США в 1956 –1970 рр.
Припустимо, що ми хочемо досліджувати зміну особистих витрат в США за декілька минулих років. Скористаємося такою простою моделлю:
, |
(6.4) |
де Y – особисті витрати;
Х2 – особистий дохід (після сплати податків);
Х3 – час, що виміряється в роках.
Рівняння (6.4) постулювало лінійний зв’язок між особистими доходами, доходами і часом або змінною тренда. У більшості випадків множинного регресійного аналізу, що включає дані тимчасових рядів, у модель вводять на додаток до інших пояснювальних змінних змінну тренда, що пояснюється такими причинами.
1. Нас може цікавити, як залежна змінна поводиться зі зміною часу. Наприклад, на графіках часто демонструється, скажімо, поведінка ВНП, зайнятості, безробіття, вартості акцій тощо за деякі послідовні інтервали часу. Вид цих графіків дозволяє визначити тенденцію зміни величини за часом, її зростання, спадання або відсутність певної тенденції. У подібному аналізі нас можуть не цікавити причини, що стоять за тенденцією зростання або спадання досліджуваної величини, а метою може бути просто опис даних, змінюваних у часі.
2. У багатьох випадках змінна тренда є заміною для основної змінної, що впливає на Y. Але ця основна змінна не дозволяє отримати дані, що описують її, або їх отримання пов’язане зі значними труднощами. Наприклад, у моделі виробництва подібною змінною є технологія. Ми чудово розуміємо її вплив, проте незрозуміло, як його виміряти. Отже, можна припустити, що технологія є деяка функція часу, що вимірюється хронологічно. У деяких ситуаціях можна вважати, що впливаюча на Y основна змінна настільки тісно пов’язана з часом, що зручніше ввести в модель сам час, а не цю змінну. Наприклад, у моделі (6.4) час Х3 може представляти населення. Витрати на споживання зростають зі зростанням населення, а саме населення може бути достатньо добре описане лінійною функцією часу.
4. Ще однією підставою для введення змінної тренда є бажання уникнути псевдокореляції. Дані, що стосуються економічних тимчасових рядів, таких як PCE і PDI, часто змінюються в одному напрямі, відображаючи тенденцію зростання або спадання. Отже, якщо побудувати модель регресії PCE по відношенню до PDI, то можна отримати велике значення R2, що може не відображати істинного зв’язку між РСЕ і PDI, а просто бути наслідком загального тренда. Щоб виключити псевдоасоційованість між економічними тимчасовими рядами, можна застосувати кілька прийомів. В одному випадку, припускаючи, що тимчасові ряди демонструють лінійну тенденцію, можна ввести в модель час або саму тенденцію, як це зроблено в рівнянні (6.4). Унаслідок чого в рівнянні (6.4) відображає істинний зв’язок між РСЕ і PDI. В іншому випадку можна здійснити процедуру детренда Y (PCE) і X2 (PDI), а потім провести регресію за отриманими після детренда змінними Y і X2, припускаючи наявність лінійного етапу, як це було виконано в розд. 5. Спочатку проводимо регресію Y за X3 (час) і одержуємо залишки від цієї регресії, скажімо . Потім проводимо регресію X2 за X3 і одержуємо залишки з цієї регресії, наприклад . Нарешті, проводимо регресію за , які не піддаються впливу (лінійному) часу. Кутовий коефіцієнт у цій регресії відображатиме істинний зв’язок між Y і X2 і повинен, отже, дорівнювати коефіцієнту . Зрозуміло, що перший метод більш придатний, оскільки він менш трудомісткий.
Для перевірки моделі (6.4) скористаємося даними, наведеними в табл. 6.1
Таблиця 6.1