- •2.1. Опис моделі
- •4.1. Вступ
- •5.1. Вступ
- •1.1.Опис Моделі
- •1.2. Знаходження оцінок параметрів регресії методом найменших квадратів
- •1.3.Властивості залишків методу найменших квадратів
- •1.4.Розклад дисперсії залежної змінної. Коефіціент детермінації
- •1.5.Статистичні власт ок методу найменших
- •1.6.Статистичні висновки в моделі простої лінійної регресії
- •1.6.1. Перевірка гіпотез про коефіцієнт нахилу регресії
- •1.6.2. Інтервальне оцінювання
- •1.6.3. Перевірка значущості регресії
- •1.7. Прогнозування за допомогою простої лінійної регресії
- •1.8.Приклад
- •2.1. Опис моделі
- •2.2. Знаходження параметрів регресії методом найменших квадратів
- •2.3.Властивості залишків методу найменших квадратів
- •2.4.Розклад дисперсії залежної змінної. Коефіцієнт детермінації
- •2.5. Статистичні властивості оцінок методу найменших квадратів
- •2.6. Статистичні висновки в моделі множинної лінійної регресії
- •2.6.1. Перевірка гіпотез про коефіціенти регресії.
- •2.6.2. Надійні інтервали для коефіціентів регресії
- •2.6.3. Перевірка значущості регресії
- •2.7. Інтерпретація регресійних коефіцієнтів. Порівняння факторів за ступeнем їх впливу
- •2.8.Моделі, які зводяться до моделі лінійної регресії
- •2.9. Фіктивні змінні.
- •2.10.Перевірка гіпотез про лінійні обмеження на параметри
- •2.11 Перевірка гіпотез про стійкість моделі
- •2.11.1. Критерій дисперсійного аналізу
- •2.11.2. Критерій Чоу
- •3.1. Вступ
- •3.3.Наслiдки гетероскедастичності збурень на оцiнки методу найменших квадратiв
- •3.4. Зважений метод найменших квадратiв у випадку відомої коваріаційної матриці збурень
- •3.5. Виявлення гетероскедастичності
- •3.5.1. Загальні критерії виявлення гетероскедастичності
- •3.5.2. Регресійні критерії виявлення гетероскедастичності
- •4.2. Опис моделi
- •4.3.Наслiдки автокорельованостi збурень на оцiнки методу найменших квадратiв
- •4.4. Узагальнений метод найменших квадратiв у випадку відомої кореляційної матриці
- •4.5. Процес авторегресiї першого порядку
- •4.6. Узагальнений метод найменших квадратiв у випадку ar(1)-збурень
- •4.7. Виявлення автокореляції. Статистика Дурбіна-Уотсона
- •4.8. Оцінювання у випадку невідомої кореляційної матриці збурень
- •5.1.Вступ
- •5.2. Класифікація рівнянь і змінних
- •5.3. Структурний і зведений вигляд систем симультативних рівнянь
- •5.4. Проблема ідентифікації
- •5.4.1. Ідентифікація через зведений вигляд
- •5.4.2. Порядкова та рангова умова ідентифікованості
- •5.5. Методи оцінювання систем симультативних рівнянь
- •5.5.1. Непрямий метод найменших квадратів
- •5.5.2 Двоетапний метод найменших квадратів
1.6.3. Перевірка значущості регресії
Значущість регресії означає, що незалежні змінні впливають на залежну змінну. Для простої лінійної регресіі це еквівалентно тому, що коефіцієнт нахилу не дорівнює нулю (тобто коли гіпотеза про рівність β нулю
16
відхиляється) . Якщо b = 0, то = 0. Тому логічно будувати критерій, який грунтується на значенні коефіцієнта детермінації. Дійсно, можна показати, що R2FRRnFn=−−−2212112~, (1.23)
коли β = 0, де через F1,n–2 позначено розподіл Фішера з 1, n–2 ступенями свободи. За вибраним рівнем значущості α в таблиці розподілу Фішера з 1, n-2 ступенями свободи знаходимо критичне значення F кр. Якщо |F|<Fкр, то гіпотеза приймається. Якщо |F|≥Fкр, то гіпотеза відхиляється. У випадку простої регресії застосування F-критерія (1.23) не дає нової інформації порівняно з t-критерієм (1.20), оскільки tF22=і . Але це не так у випадку множинної регресії, що ми побачимо пізніше. tFкр2кр2=
1.7. Прогнозування за допомогою простої лінійної регресії
Припустимо, ми хочемо одержати інформацію про можливі значення залежної змінної y0 за умови, що незалежна змінна x приймає деяке значення x0. Внаслідок (1.1) yx00=++0αβε. Точковий прогноз знаходиться за формулою
$yabx0 0 =+ (1.24).
Оскільки Ea = α і Eb = β, тоEEE$()yabxx000 y0 =+=+=αβ. Отже, прогноз (1.24) є незміщеним. Дисперсія прогнозу (1.24) дорівнює D$y0 D$()ynxxSxx020211=++−⎡⎣⎢⎤⎦⎥σ (1.25).
Для того, щоб (1.25) можна було б використовувати для інтервального оцінювання залишилось замінити дисперсію збурень на її оцінку. Позначимо SE($)$()ynxxSxx020211=++−⎡⎣⎢⎤⎦⎥σ– (1.26)
стандартна похибка прогнозу. Інтервальний прогноз з рівнем довіри
1-α знаходиться за наступною формулою:
($..($);$..($))yytyyt0000−⋅+⋅seseкркр,
17
де – точковий прогноз (1.24), а значення t$y0кр знаходиться за вибраним α в таблиці розподілу Стьюдента з n-2 ступенями свободи.
1.8.Приклад
В Таблиці 1.1. наведено обсяги сукупного доходу у розпорядженні та сукупного споживання для США у постійних доларах 1972 р. Дані з Таблиці 1.1. зображено графічно на на Рис.1.3. З графіка видно, що точки, які відповідають спостереженням, розташовані навколо деякої прямої, отже доцільно розглянути лінійну функцію споживання. Оцінимо її за допомогою моделі простої лінійної регресії:
yi = α + βxi + εi ,i=110,, (1.27)
де через xi та yi позначено відповідно рівень доходу і споживання в році 1969 + i (наприклад i = 5 відповідає 1974 року). Спочатку обчислимо
Таблиця 1.1.
Рік
Доход у розпорядженні
Особисте споживання
1970
751,6
672,1
1971
779,2
696,8
1972
810,3
737,1
1973
864,7
767,9
1974
857,5
762,8
1975
874,9
779,4
1976
906,8
823,1
1977
942,9
864,3
1978
988,8
903,2
1979
1015,7
927,6
18
8008509009501000Доход700750800850900Споживання
Рис. 1.3. x=(751,6+779,2+810,3+864,7+857,5+874,9+906,8+942,9+988,8+1015,7)/10 =
= 879,24; y=(672,1+696,8+737,1+767,9+762,8+779,4+823,1+864,3+903,2+927,6)/10 =
= 793,43;
Sxx = ((751,6 – 879,24)2 + (779,2 – 879,24)2 + (810,3 – 879,24)2 +
+ (864,7 – 879,24)2 + (857,5 – 879,24)2 + (874,9 – 879,24)2 +
+ (906,8 – 879,24)2 + (942,9 – 879,24)2 + (988,8 – 879,24)2 +
+ (1015,7879,24)2 )/9 = 67192,4;
Syy = ((672,1 – 793,43)2 + (696,8 – 793,43)2 + (737,1 – 793,43)2 +
+ (767,9 – 793,43)2 + (762,8 – 793,43)2 + (779,4 – 793,43)2 +
+ (823,1 – 793,43)2 + (864,3 – 793,43)2 + (903,2 – 793,43)2 +
+ (927,6 – 793,43)2 )/9 = 64972,1;
Sxy = ((751,6 – 879,24) (672,1 – 793,43) + (779,2 – 879,24) (696,8 – 793,43) +
+ (810,3 – 879,24) (737,1 – 793,43) + (864,7 – 879,24) (767,9 – 793,43) +
+ (857,5 – 879,24) (762,8 – 793,43) + (874,9 – 879,24) (779,4 – 793,43) +
+ (906,8 – 879,24) (823,1 – 793,43) + (942,9 – 879,24) (864,3 – 793,43) +
+(988,8 – 879,24) (903,2 – 793,43) + (1015,7879,24) (927,6 – 793,43) )/9 =
= 65799,3.
За формулами (1.7) знаходими оцінки методу найменших квадратів коефіцієнгів моделі (1.27):
19
bSSaybx,xyxx====−=−×65799,367192,40,979;0,979879,24=-67,58.79343
Отже, рівняння вибіркової регресійної прямої (рівняння фунцції споживання) має вигляд:
$y= – 67,58 + 0.979x. (1.28) 8008509009501000Доход700750800850900Споживання
Рис 1.4
Графік цієї прямої зображено на Рис. 1.4. разом з фактичними даними.
Щоб мати уявлення про тісноту зв’язку між доходом і споживанням, обчислимо коефі-цієнт детемінації.
За формулою (1.17а) маємо:
R 2 = bSxy/Syy =
= 0.979×65799,3/64972,1 = 0.990702.
Як ми бачимо, зв’язок між споживанням і доходом є вельми тісним. Перед тим, як використовувати рівняння (1.28) для економічного аналізу або побудови прогнозів, модель (1.27) потрібно перевірити на адекватність. Перевіримо гіпотезу про значущість регресії двома способами. Спочатку використаємо F-статистику (1.23): FRRn=−−=−=221121180.9907020.990702959,917.
Нехай, рівень значущості α дорівнює 0,05. В Таблиці 3. Додатку знаходимо, що критичне значення F кр = 5,32. Ми бачимо, що |F|≥Fкр, отже гіпотеза про рівність β нулю відхиляється, тим самим модель (1.27) є значущою.
Обчислимо стандартні похибки оцінок. Спочатку знайдемо суму квадратів залишків RSS. За формулою (1.15)
RSS = Syy – b2Sxx = 64972,1 – 0.9792×67192,4 = 537,0.
Далі знаходимо оцінку дисперсії збурень
20
$σ22=−==RSSn537,0867,13.
Стандартна похибка b дорювнює:
SE(b) = $
σ2Sxx==67,13/67192,40.0316071.
Перевіримо гіпотезу про те, що коефіцієнт нахилу регресійної прямої β дорівнює нулю за допомогою t-статистики (1.20): tbb===SE() 0.9790.031607130.9825.
Нехай, рівень значущості α дорівнює 0,05. В Таблиці 1. Додатку знаходимо, що критичне значення tкр = 2,306. Ми бачимо, що |t|≥tкр, отже гіпотеза відхиляється.
Отже, ми можемо вважати модель адекватною (читач не повинен забувати, що повна перевірка моделі на адекватність включає аналіз залишків, з елементами якого ми ознайомимось в розділах 3 та 4).
З теорії споживання відомо, що коефіцієнт нахилу лінійної функції споживання є маргінальною або граничною схильністю до споживоння. Таким чином, ми встановили, що в середньому 0.979×100 = 97,9% прирісту доходу витрачається на споживання1). Обчислене значення граничної схильності до споживання знаходиться в інтервалі (0; 1), що узгоджується з економічною теорією.
1) Слід зазначити, що лінійні функції споживання у вигляді (1.27) не розглядаються в серйозних дослідженнях починаючи з 50-х років, тому наведені результати мають лише учбове значення.
21
РОЗДІЛ 2. МНОЖИННА ЛІНІЙНА РЕГРЕСІЯ