Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрия_конспект.doc
Скачиваний:
9
Добавлен:
18.09.2019
Размер:
10.84 Mб
Скачать

1.2. Концепція регресійної функції популяції (prf роpulation regression function)

З попередніх міркувань (особливо з рис. 1.1 і 1.2) зрозуміло, що кожне умовне середнє E(Y ) є функція від . Символічно це можна зобразити у вигляді

,

(1.2.1)

де позначає деяку функцію від пояснювальної змінної . У нашому гіпотетичному прикладі E(Y ) є лінійна функція від . Рівняння (1.2.1) відоме як двовимірна регресійна функція (роpulation regression function) популяції (PRF), яка стверджує, що середнє значення від розподілу Y для даного функціонально пов’язане з . Іншими словами, воно показує, як середнє Y змінюється зі зміною X.

Який вигляд має функція ? Це питання важливе, оскільки в реальній практичній ситуації ми не маємо у своєму розпорядженні повної сукупності даних для дослідження. Вигляд функції PRF є питання емпіричне, хоча в конкретному випадку теорія може дещо підказати. Наприклад, економіст може констатувати, що споживацькі витрати лінійно пов’язані з доходом сім’ї. Отже, як перше наближення або гіпотезу ми можемо припустити, що PRF E(Y ) є лінійна функція від , скажімо вигляду

,

(1.2.2)

де 1 і 2  невідомі, але фіксовані параметри під назвою регресійні коефіцієнти. Рівняння (1.2.2) відоме як лінійна функція популяції регресії (linear роpulation regression function) або просто лінійна регресія популяції. Є й інші терміни, що використовуються в літературі,  лінійна регресійна модель популяції або лінійне рівняння регресії популяції. Надалі ми використовуватимемо як синоніми терміни “регресія”, “рівняння регресії” і “регресійна модель”.

У регресійному аналізі нас цікавитиме обчислення PRF у вигляді (1.2.2), тобто обчислення значень невідомих 1 і 2 на основі наявних даних спостережень Y і X.

1.3. Значення терміна “лінійність”

Оскільки ми надалі застосовуватимемо лінійну модель вигляду (1.2.2), важливо визначити точний зміст терміна «лінійний», оскільки можливі дві різні його інтерпретації.

Лінійність за змінною

Перше і можливо найприродніше значення лінійності стосується того, що умовне сподівання Y є лінійна функція від , наприклад вигляду (1.2.2). Геометрично регресійна крива в цьому випадку являє собою пряму лінію. У такій інтерпретації регресійна функція вигляду не є лінійна функція, оскільки змінна X входить у вираз PRF у другому степені.

Лінійність за параметрами

Друга інтерпретація лінійності стосується того, що умовне сподівання Y, E(Y ), є лінійна функція за параметрами 1 і 2, вона може бути лінійною за змінною або не бути такою. У цій інтерпретації є лінійна регресійна модель, а не є такою. Остання є нелінійна регресійна моделль (за параметрами). Ми не будемо торкатися подібних випадків.

Надалі вважатимемо, що термін «лінійність» обов’язковий щодо параметрів; він може стосуватися змінних, а може й не стосуватися.

1.4. Стохастичні властивості prf

З рис. 1.1 бачимо, що зі зростанням доходу сім’ї зростають у середньому і її витрати на споживацькі товари. Проте що можна сказати про витрати на споживання конкретної сім’ї з фіксованим рівнем доходу? З табл. 1.1 і рис. 1.1 бачимо, що зі зростанням доходу конкретної сім’ї рівень її витрат на споживання не обов'язково зростає. Наприклад, з табл. 1.1 бачимо, що в групі сімей із рівнем доходу 100 дол. є одна сім’я, чиї витрати на споживання складають 65 дол., що менше, ніж споживацькі витрати у двох сім’ях з групи з доходом 80 дол. Однак зауважимо, що середній рівень споживацьких витрат сімей із тижневим доходом 100 дол. вищий, ніж середній рівень споживацьких витрат у групі сімей із тижневим доходом 80 дол. (77 дол. проти 65 дол.).

Що тоді можна сказати про співвідношення між споживацькими витратами конкретної сім’ї і рівнем її доходу? З рис. 1.1 ми бачимо, що для даного рівня доходу споживацькі витрати сімей розташовуються біля середнього рівня споживацьких витрат групи сімей із тижневим доходом , тобто біля їх умовного сподівання. Отже, ми можемо виразити відхилення індивідуального від величини його сподівання таким чином:

або

,

(1.4.1)

де відхилення  випадкова величина, що набуває як позитивних, так і негативних значень. Величину називають стохастичним збуренням або складовою стохастичної помилки.

Яку інтерпретацію можна дати (1.4.1)? Можна сказати, що витрати індивідуальної сім’ї з фіксованим рівнем доходу можна подати у вигляді суми двох складових: , що позначає середній рівень витрат сімей з даним рівнем доходу. Цей доданок відомий як термін систематичної або детермінованої складової. Другий доданок  , є випадкова величина, так звана несистематична компонента. Згодом ми дослідимо природу , а зараз просто відзначимо, що вона містить усі опущені або знехтувані змінні, які можуть впливати на Y, але не включені в регресійну модель.

Якщо передбачається лінійною функцією за , як це робилося в (1.2.2), то рівняння (1.4.1) можна переписати у вигляді

.

(1.4.2)

Із рівняння (1.4.2) бачимо, що споживацькі витрати сім’ї лінійно пов’язані з її доходами плюс випадкова складова. Таким чином, індивідуальні витрати на споживацькі товари при X=80 дол. (див. табл. 1.1) можуть бути виражені

,

,

,

,

.

(1.4.3)

Ураховуючи відомі властивості математичного сподівання:

1. Математичне сподівання сталої величини дорівнює самій сталій. Отже, якщо b є константа, то

E(b)=b.

2. Якщо а і b сталі, а X  випадкова величина, то

E(aX+b)=aE(X)+b.

Це правило може бути узагальнене. Якщо X1, X2 ...XN  випадкові величини, а a1, a2 ...aN і b константи, то

E(a1X1+a2X2+...+aNXN+b)=a1E(X1)+a2E(X2)+...+aNE(XN)+b.

Обчислимо математичне сподівання від обох частин рівності (1.4.1):

(1.4.4)

При цьому враховувалося, що математичне сподівання випадкової величини є величина стала. Оскільки в ліву і праву частини рівності (1.4.4) входять однакові величини E( ) і E(Y ), то легко одержуємо

.

(1.4.5)

Таким чином, припущення про те, що лінія регресії проходить через умовні середні Y, має на увазі, що математичне сподівання стохастичної складової дорівнює нулю.

Після цього стає зрозуміло, що рівності (1.2.2) і (1.4.2) еквівалентні, якщо для стохастичної складової виконується рівність (1.4.5). Проте стохастичне уточнення (1.4.2) має перевагу, оскільки показує, що окрім доходу сім’ї є й інші змінні, які впливають на споживацькі витрати конкретної сім’ї, і що витрати сім’ї не можуть бути повністю поясненими тільки змінною (змінними), включеними в модель.