- •Економетрика конспект лекцій
- •Зауваження................................................................................................118
- •1. Регресійний аналіз. Регресійний аналіз для двох змінних: основні ідеї
- •1.1. Гіпотетичний приклад
- •1.2. Концепція регресійної функції популяції (prf роpulation regression function)
- •1.3. Значення терміна “лінійність”
- •1.4. Стохастичні властивості prf
- •1.5. Важливість урахування складової стохастичного збурення
- •1.6. Вибіркова регресійна функція (srf)
- •2. Двовимірна регресійна модель. Задача оцінки
- •2.1. Метод найменших квадратів
- •Експериментальне визначення srf
- •2.2. Властивості оцінок за мнк
- •Дійсна й оцінена ціна будинку і його житлова площа у кв. Футах
- •Припущення 4 гомоскедастичність або рівність дисперсій
- •Це припущення не таке нешкідливе, як здається. Розглянемо рівняння
- •2.3. Точність або стандартна похибка оцінювачів за мнк
- •2.4. Властивості оцінювачів за мнк: теорія Гаусса-Маркова
- •2.5. Коефіцієнт детермінації : міра «якості підгонки»
- •2.6. Числовий приклад
- •2.7. Ілюстративні приклади
- •3. Інтервальні оцінки і перевірка гіпотез
- •3.1. Інтервальні оцінки: основні ідеї
- •3.2 Довірчі інтервали для регресійних коефіцієнтів і
- •Отже, наприклад, змінна
- •3.3. Довірчий інтервал для
- •3.4. Перевірка гіпотез: загальні зауваження
- •3.5. Перевірка гіпотез: підхід на основі довірчого інтервалу
- •3.6. Перевірка гіпотез: підхід, оснований на перевірці значимості
- •3.7. Перевірка значимості : хі-квадрат тест
- •3.8. Регресійний аналіз і аналіз дисперсії
- •Розглянемо таку змінну:
- •3.9. Застосування регресійного аналізу: проблема прогнозу
- •3.10. Форма звіту за результатами регресійного аналізу
- •3.11. Обчислення результатів регресійного аналізу
- •Залишки для проведення -тесту
- •4. Розвиток двовимірної лінійної моделі регресії
- •4.1. Регресія, що проходить через початок координат
- •4.2. Масштабування й одиниці вимірювання
- •Валові внутрішні приватні інвестиції (gpdi) і валовий національний продукт (gnp) у цінах 1972 р. У доларах сша, 1974–1983 рр.
- •4.3. Функціональний вид регресійної моделі
- •4.4. Вимірювання еластичності. Лінійно-логарифмічна модель
- •4.5. Напівлогарифмічні моделі. Визначення темпів зростання.
- •4.6. Обернені моделі
- •4.7. Зауваження щодо стохастичної складової
- •5. Множинний регресійний аналіз. Задача оцінювання
- •5.1. Модель із трьома змінними. Позначення і гіпотези
- •5.2. Інтерпретація рівняння множинної регресії
- •5.3. Значення частинних коефіцієнтів регресії
- •5.4. Оцінка частинних коефіцієнтів регресії за мнк
- •5.6. Проста регресія в контексті множинної регресії
- •5.7. R2 і скорегований r2
- •5.8. Частинні коефіцієнти кореляції
- •5.9. Виробнича функція Коба – Дугласа
- •5.10. Поліноміальная модель регресії
- •6. Припущення нормальності розподілу залишків
- •Витрати на споживання і особистий дохід у сша за 1956–1970 рр.
- •7. Перевірка гіпотез множинної регресії. Загальні зауваження
- •7.1. Перевірка гіпотези про частинний коефіцієнт регресії
- •7.2. Перевірка вибіркової регресії на загальну значущість
- •7.3. Перевірка на рівність двох коефіцієнтів регресії
- •7.4. Перевірка лінійних обмежень
- •Обчислимо
- •7.5. Перевірка структурної стабільності моделей регресії
- •Можна показати, що при виконанні згаданих припущень
- •7.6. Перевірка функціонального виду регресії. Вибір між лінійною моделлю регресії і лінійно-логарифмічною моделлю
- •8. Прогнозування в разі множинної регресії
- •9. Множинна регресія. Матричний метод
- •9.1. Лінійна модель регресії з k змінними
- •9.2. Припущення класичної лінійної моделі регресії в матричній формі
- •Припущення класичної лінійної моделі регресії
- •9.3. Оцінювання за мнк
- •9.4. Коефіцієнт детермінації r2 у матричному позначенні
- •9.5. Кореляційна матриця
- •9.6. Перевірка гіпотез про індивідуальні коефіцієнти регресії в матричному позначенні
- •9.7. Загальна перевірка регресії на значущість. Аналіз дисперсії в матричному позначенні
- •Матричне формулювання anova-таблиці
- •9.8. Перевірка лінійних обмежень. Загальний f-тест у матричних позначеннях
- •9.9. Прогнозування в множинній регресії. Матричне формулювання
- •9.10. Ілюстративний приклад у матричних позначеннях
- •Витрати на споживання на душу населення (ppce) і дохід на душу населення (ppdi) в сша за 1956–1970 рр.
- •Anova-таблиця для даних з таблиці 9.4.
3.9. Застосування регресійного аналізу: проблема прогнозу
На основі вибіркових даних табл. 3.2 нами було отримане таке рівняння вибіркової регресії:
, |
(3.9.1) |
де – оцінювач істинного , відповідного даному Х. Яка користь може бути отримана з цієї історичної регресії (historical regression)? Рівняння можна застосовувати для прогнозу або передбачення майбутніх споживацьких витрат Y, відповідних деякому даному рівню доходу Х. Можливі такі два види прогнозу:
Прогноз умовної середньої величини Y, відповідний вибраному Х, скажімо Х0, тобто точки на самій лінії регресії популяції.
Прогноз індивідуальної величини Y, відповідної Х0.
Ми називатимемо ці два прогнози середнім прогнозом й індивідуальним прогнозом.
Середній прогноз
Для більшої чіткості припустимо, що Х0=100 і ми хочемо спрогнозувати E(Y/X0=100). Зрозуміло, що рівняння історичної регресії (2.6.2) дає оцінку середнього прогнозу таким чином:
, |
(3.9.2) |
де – оцінка E(Y/X0). Можна показати, що цей точковий прогноз краща лінійна незміщена оцінка (best linear unbiased estimator, BLUE).
Оскільки є оцінкою, напевно числове її значення відрізняється від істинного. Різниця між двома цими величинами дасть деяке уявлення про помилку прогнозу. Для отримання цієї помилки нам необхідно знайти розподіл вибірки . , з формули (3.6.1), нормально розподілена величина із середнім (1+2Х0) і її дисперсія задається такою формулою:
. |
(3.9.3) |
Позначимо невідому її незміщеною оцінкою . Тоді змінна
|
(3.9.4) |
розподілена за законом розподілу Ст’юдента з N–2 степенями вільності. Отже, цей закон розподілу можна застосовувати для побудови довірчих інтервалів істинного E(Y0|X0) і перевірки гіпотез звичайним способом:
, |
(3.9.5) |
де отримано з (3.6.2):
. |
|
Для наших даних одержуємо
і . |
|
Отже, 95%-й довірчий інтервал для істинного E(Y0|X0)=1+2Х0 задається формулою
.
|
(3.9.6) |
Таким чином, для Х0=100 у вибірках, що повторюються, 95 зі 100 інтервалів, подібних (3.6.5), міститимуть істинну середню величину; найкращим точковим оцінювачем буде 75,3645.
Якщо ми отримаємо 95%-ві довірчі інтервали, подібні (3.9.7), для кожного значення Х, наведених у табл. 1.3, ми отримаємо довірчу область (confidence band) для функції регресії популяції, показаної на рис. 3.6.
Рис. 3.6. Довірчі інтервали (області) для середньої Y й індивідуальної величини Y
Індивідуальний прогноз
Якщо нас цікавить індивідуальний прогноз величини Y для Y0, відповідної заданій величині Х0, то краща лінійна незміщена оцінка Y0 також подається формулою (3.6.1), але її дисперсія має вигляд
. |
(3.9.7) |
Можна показати, що Y0 також підкоряється нормальному закону розподілу з математичним сподіванням і дисперсією, заданими формулами (3.6.1) і (3.6.6) відповідно. Підставляючи замість невідомої можна показати, що
,
також підкоряється розподілу Ст’юдента. Отже, цей закон розподілу може бути застосований для висновку про істинне значення Y0. Продовжуючи дослідження моделі “споживання дохід”, ми знаходимо, що прогнозована точка Y0=75,3645 така ж, як і , і її дисперсія є
,
.
Отже, 95%-й довірчий інтервал для Y0, відповідного Х0=100, визначається таким чином:
. |
(3.9.8) |
Порівнюючи цей інтервал з (3.6.5), ми бачимо, що довірчий інтервал для індивідуального Y0 ширший, ніж за тих же умов довірчий інтервал для середнього значення E(Y|X0). Обчисливши подібні довірчі інтервали для різних значень Х з табл. 1.3, ми отримаємо 95%-ву довірчу область для індивідуальних значень Y при даних значеннях Х. Ця довірча область зображена на рис.3.6, як і довірча область для .
Звернемо увагу на важливу властивість довірчих областей, зображених на рис.3.6. Ширина цих областей найменша при (див. вирази для дисперсій і доданок у них ). Ширина областей довіри збільшується в міру віддалення Х0 від . Така поведінка свідчить про те, що здатність прогнозу зменшується в міру віддалення Х0 від .
Отже, потрібно дуже обережно екстраполювати лінії історичної регресії для прогнозу E(Y|X0) або Y0 для заданого Х0, що знаходиться на значній відстані від – середнього значення за вибіркою.