- •1. Основні теоретичні положення регресійного аналізу
- •1.1. Кореляційна залежність
- •1.2. Основні математичні поняття,
- •1.3. Передумови використання
- •2. Парний регресійний аналіз
- •2.1. Лінійна парна регресія
- •2.2. Властивості оцінок
- •2.3. Лінійний коефіцієнт кореляції
- •2.4. Коефіцієнт детермінації
- •2.5. Оцінка значущості рівняння регресії
- •2.6. Прогноз залежної змінної.
- •2.7. Приклад 1.
- •2.8. Нелінійна парна регресія
- •2.9. Дослідження нелінійних рівнянь
- •2.10. Приклад 2.
- •2.11. Побудова функції парної регресії
- •2.12. Побудова графіку функції
- •2.13. Питання для самоперевірки
- •3. Багатофакторний регресійний аналіз
- •3.1. Класична нормальна лінійна модель
- •3.2. Коефіцієнти детермінації і кореляції.
- •3.3. Перевірка значущості параметрів
- •3.4. Прогноз залежної змінної
- •3.5. Приклад 3. Знаходження двофакторної моделі
- •3.6. Використання пакету анализ данных
- •3.7. Використання Excel для розрахунку
- •Введення і підготовка даних
- •4. Мультиколінеарність
- •4.1. Поняття і наслідки мультиколінеарності
- •4.2. Алгоритм Фаррара – Глобера
- •4.3. Приклад 4.
- •4.5. Питання для самоперевірки
- •5. Гетероскедастичність
- •5.1. Поняття гетероскедастичності
- •5.2. Виявлення гетероскедастичності.
- •5.3. Приклад 5. Дослідження даних
- •5.4. Виявлення гетероскедастичності.
- •5.5. Приклад 6. Дослідження даних
- •5.6. Непараметричний тест Гольдфельда-Квандта
- •5.7. Питання для самоперевірки
- •6. Автокореляція
- •6.1. Поняття автокореляції.
- •6.2. Критерій Дарбіна-Уотсона
- •6.3. Приклад 7. Дослідження моделі на наявність
- •6.4. Питання для самоперевірки
- •7. Індивідуальні комплексні завдання
- •Завдання 2
- •Завдання 3
- •Завдання 4
- •Завдання 5
- •Предметний покажчик
- •Література
- •Коефіцієнтів автокореляції залишків
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Значення критерія Пірсона
- •Квантилі розподілу Стьюдента
- •83050, М. Донецьк, вул. Щорса, 31.
- •83023, М. Донецьк, вул. Харитонова, 10
5. Гетероскедастичність
5.1. Поняття гетероскедастичності
і гомоскедастичності. Наслідки
гетероскедастичності
Однією із умов застосування методу найменших квадратів є така: дисперсія залишків в кожному спостереженні повинна бути сталою , , деяка стала (див. § 1.3, умова 3). Іншими словами, в цій умові Гаусса-Маркова стверджується, що ймовірність конкретного значення випадкового члена не залежить від конкретних значень змінної , а отже і дисперсія не залежить від значень цих змінних, тобто
, , (5.1.1)
якщо розглядається багатофакторна регресія, або
(5.1.2)
для парної регресії.
Визначення. |
Якщо дисперсія залишків постійна для кожного спостереження, то ця її властивість називається гомоскедастичністю. |
Гомоскедастичність означає “однакове розсіяння”.
В практичних дослідженнях явище гомоскедастичності часто порушується. В багатьох випадках більш реалістичним є припущення, що розподіл випадкового члена в різних спостереженнях буде різним.
Наприклад, якщо вивчається залежність розміру заробітної плати співробітника від стажу роботи то цілком природно сподіватися, що значення відхилення фактичних заробітних плат від середнього значення для певного стажу буде тим більше, чим більшою є заробітна плата. Дуже часто так і трапляється. Це означає, що ймовірності різних можливих значень будуть залежними від конкретних значень змінних , . При малих значеннях малими будуть і , при великих , великими будуть і , і таким чином
. (5.1.3)
Визначення. |
Якщо дисперсія залишків не однакова для всіх спостережень, то це явище називається гетероскедастичністю. |
Гетероскедастичність означає “неоднакове розсіяння”.
Розрізняють чисту і мішану (нечисту) гетероскедастичність. Чиста гетероскедастичність виникає, коли умова про постійність дисперсії залишків порушується при правильній специфікації моделі, внаслідок об’єктивних причин. Такими об’єктивними причинами можуть бути неточності вимірюваних факторів, вплив на пояснювальну змінну другорядних факторів, які не включені в модель. Мішана (нечиста) гетероскедастичність виникає при неправильній специфікації моделі, внаслідок не включення в рівняння регресії важливих пояснювальних змінних. Отже, величина залишку акумулює в собі неточності вимірювань факторів, вплив на пояснювальну змінну другорядних факторів, які не включені в модель, неточності в специфікації моделі і т. д.
Наслідки гетероскедастичності. За наявності гетероскедастичності оцінки параметрів моделі методом 1МНК залишаються незміщеними, обґрунтованими, але неефективними. Незміщенність і обґрунтованість оцінок означає, що модель побудована методом 1МНК може бути використана і для знаходження прогнозних значень залежної змінної . Однак інтервальні оцінки для параметрів моделі і для пояснювальної змінної будуть непридатними для аналізу так як інтервали будуть занадто широкими.
Збільшення дисперсії залишків приводить до того, що і -критерії дають неточні результати. Ці критерії обчислюються в припущенні, що розподіл випадкового члена гомоскедастичний. Якщо знехтувати (не враховувати) гетероскедастичність, то ми отримаємо завищені, ніж вони будуть насправді, значення цих критеріїв і тоді можна зробити висновок про значущість моделі і її параметрів, коли насправді вони будуть незначущими.
Отже, якщо ж знехтувати гетероскедастичностю і прийняти модель параметри якої оцінені 1МНК, то це приводить до таких трьох основних наслідків:
Оцінки параметрів моделі можуть бути незміщеними, але неефективними, тобто, вибіркові дисперсії оцінок можуть бути невиправдано великими.
Для виявлення статистичної значущості моделі вже не можуть бути використані статистичні критерії - і -статистик, так як обчисленні значення статистик будуть завищеними.
Неефективність оцінок параметрів моделі приводить до неефективності прогнозу, а отже і в цілому модель є непридатною для аналізу явища.