Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
печать2.doc
Скачиваний:
2
Добавлен:
16.09.2019
Размер:
566.27 Кб
Скачать

Моделі ancova

Моделі, у яких пояснюючі змінні носять як кількісний, так і якісний характер, називаються ANCOVA - моделями (моделями коваріаційного аналізу).

2.1. Ancova - Модель при наявності у фіктивної змінної двох альтернатив

Спочатку розглянемо найпростішу ANCOVA-модель із однією кількісною й однією якісною змінною, що має два альтернативні стани: Y = βо + γ D + β1X + ε . (2)

Нехай, наприклад, Y - заробітна плата співробітника фірми, X -стаж співробітника, D - стать співробітника, тобто

0, якщо співробітник - жінка,

D = 1, якщо співробітник - чоловік.

Тоді очікуване значення заробітної плати співробітників для х років виробничого стажу буде:

M(Y | х, D = 0) = βо + β1 х для жінки, (3)

M(Y | х, D = 1) = βо + β1 х + γ = (βо + γ) + β1 х для чоловіка. (4)

Заробітна плата в цьому випадку є лінійною функцією від стажу роботи

Причому, як для чоловіків, так і для жінок заробітна плата змінюється з тим самим коефіцієнтом пропорційності β1. А от вільні члени в моделях (3), (4) відрізняються на величину γ. Перевіривши за допомогою t-статистики статистичні значимості коефіцієнтів βо й о + γ), можна визначити, чи має місце у фірмі дискримінація за гендерною ознакою. Якщо ці коефіцієнти виявляться статистично значущими, то, можливо, дискримінація існує. Більше того, при γ > 0 вона буде на користь чоловіків, при γ < 0 - на користь жінок.

Значення якісної змінної, для якої приймається D = 0, називається базовим або порівняльним. Вибір базового значення звичайно диктується цілями дослідження, але може бути й довільним.

Коефіцієнт γ у моделі (2) іноді називається диференціальним коефіцієнтом вільного члена, бо він показує, на яку величину відрізняється вільний член моделі при значенні фіктивної змінної, яке = 1 , від вільного члена моделі при базовому значенні фіктивної змінної.

Існує загальне правило: якщо якісна змінна має k альтернативних значень, то при моделюванні використовуються тільки (k - 1) фіктивні змінні. Якщо не дотримуватися даного правила, то при моделюванні можна потрапити до ситуації мультиколінеарності або так звану пастку фіктивної змінної.

2.2. Моделі ancova за наявності у якісних змінних більш двох альтернатив

Нехай розглядається модель із двома пояснюючими змінними, одна з яких є кількісною, а інша - якісною. Причому якісна змінна має три альтернативи. Наприклад, видатки на утримання дитини можуть бути пов'язані із доходами домогосподарств і віком дитини: дошкільний, молодший шкільний і старший шкільний. Тому що якісна змінна пов'язується із трьома альтернативами, то за загальним правилом моделювання необхідно використовувати дві фіктивні змінні. Таким чином, модель може бути представлена у вигляді: Y = βо + β1X + γ1 D1 + γ2 D2 + ε, (6)

де Y - видатки, X - доходи домогосподарств.

0, якщо дитина - дошкільник,

D1 = 1, якщо у протилежному випадку.

0, якщо дошкільник або молодший школяр,

D2 = 1, у протилежному випадку.

Утворяться наступні залежності:

  • Середній видаток на дошкільника: M( Y| D1 = 0, D2 = 0) = βо+ β1X . (7)

  • Середній видаток на молодшого школяра: M ( Y | Dl = 1, D2 = 0) = (βо + γ1) + β1 Х (8)

  • Середній видаток на старшого школяра: M( Y | D1 = 1, D2 = 1) = (βо + γ1 + γ2 ) + β1 Х . (9)

Тут γ1, γ2 - диференціальні вільні члени. Базовим значенням якісної змінної є значення «дошкільник».

Після обчислення коефіцієнтів рівнянь регресії (7) - (9) визначається статистична значущість коефіцієнтів γ1, γ2 на основі звичайної t-статистики. Якщо коефіцієнти γ1, γ2 виявляються статистично незначущими, то можна зробити висновок, що вік дитини не робить істотного впливу на видатки із його втримування.

Приклад 1. Людина, яка працює на кількох роботах, відома як заробітчанин. Шіско і Росткер зацікавилися факторами, які визначають зарплати заробітчан. Базу­ючись на виборці щодо 318 заробітчан, вони отримали таку регресію:

+ 2.26 x1+ 90.06 D1 + 75.51 D2 + 47.33 D3 + 113.64 D4 (*)

Т: (0.94) (24.47) (21.60) (23.42) (27.62) ;

R2 = 0.34 df =311,

де wm — зарплата заробітчанина (центів на годину);

w0 — початкова зарплата (центів на годину);

x1 — вік людини.

Dl (раса) = 0, якщо білий, = 1, якщо не білий;

D2 (місто) = 0, якщо не міський, = 1, якщо міський;

D4 (область) = 0, якщо не західний район, = 1, якщо західний район;

D3 (освіта) = 0, якщо без освіти, = 1 має освіту;

У моделі є дві кількісні пояснюючі змінні, w0 та х1, а також чотири якісні змінні. Коефіцієнти всіх цих змінних статистично значущі із рівнем похибки 5%. Цікаво, що всі якісні змінні суттєво впливають на зарплату заробітчан. Наприклад, за інших рівних умов рівень погодинної оплати праці на 47% вищий у осіб із освітою, ніж у тих, хто не має освіти.

З регресії (*) можна виділити декілька індивідуальних регресій, наприклад, такі:

  • середня зарплата білих, неміських, не із західних регіонів заро­бітчан, які не мають вищої освіти (коли всі фіктивні змінні дорівнюють нулю): wm = 37.07 + 0.403 w0 + 2.26 x1;

  • середня зарплата чорношкірого, міського, з західного регіону заробітчани­на з вищою освітою (коли всі фіктивні змінні дорівнюють одиниці): wm = 183.49 + 0.403 w0 + 2.26 x1.