Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрия_конспект.doc
Скачиваний:
9
Добавлен:
18.09.2019
Размер:
10.84 Mб
Скачать

5.8. Частинні коефіцієнти кореляції

Раніше ми розглядали коефіцієнт кореляції R, що дає міру степеня лінійної асоційованості між двома змінними. Для моделі регресії з трьома змінними можемо підрахувати вже три коефіцієнти кореляції: R12 (кореляція між Y і X2), R13 (між Y і X3) і R23 (між X2 і X3). Відзначимо, що індекс 1 ми відносимо до Y, а 2 і 3 до X2 і X3 відповідно. Ці кореляційні коефіцієнти називаються простими кореляційними коефіцієнтами, або коефіцієнтами нульового порядку. Їх можна підрахувати за відомою формулою

.

Розглянемо тепер, чи дійсно, скажімо, R12 дає “істинний” степінь лінійної асоційованості між Y і X2, коли третя змінна X3 асоційована з ними. Припустимо, що істинна модель регресії задається рівністю

.

Ми не включатимемо в модель змінну X3i і побудуємо регресію Y тільки за X2 з кутовим коефіцієнтом b12. Чи буде цей коефіцієнт дорівнювати “істинному” коефіцієнту . У загальному випадку R12 не відображає істинний степінь асоційованості між Y і X2 у присутності X3. Як ми пізніше покажемо, він дає спотворене уявлення про природу асоціативності між Y і X2. Отже, нам потрібен такий коефіцієнт кореляції, який не залежав би від впливу X3 ні на X2, ні на Y. Такий кореляційний коефіцієнт можна отримати, і він називається частинним коефіцієнтом кореляції. Концептуально він аналогічний частинному коефіцієнту регресії. Частинні коефіцієнти кореляції вводяться таким чином:

  • – частинний коефіцієнт кореляції між Y і X2 при постійному значенні X3;

  • – частинний коефіцієнт кореляції між Y і X3 при постійному значенні X2;

  • – частинний коефіцієнт кореляції між X2 і X3 при постійному значенні Y.

Один із шляхів визначення частинних коефіцієнтів кореляції полягає в такому. Регресуємо Y за X3 таким чином:

.

Проводимо регресію Х2 за Х3:

.

Звернемо увагу на те, що залишки є величиною після «звільнення» її від впливу змінної Х3. Аналогічно – величина після «звільнення» її від впливу змінної Х3. Тепер ми можемо регресувати за і тим самим знайти простий коефіцієнт кореляції , оскільки значення Х3 залишається постійним. Одержуємо

.

(5.8.1)

При цьому ми врахували, що .

Із вищезазначеного зрозуміло, що частинний коефіцієнт кореляції між Y і Х2 при постійному Х3 є простий (нульового порядку) коефіцієнт кореляції між залишками від регресії Y за Х3 і Х2 за Х3 відповідно. Аналогічним чином інтерпретуються коефіцієнти кореляції і .

На практиці, проте, немає необхідності проводити цю процедуру, що складається з трьох етапів. Для обчислення частинних коефіцієнтів кореляції можна застосувати формули, що виражають їх через прості коефіцієнти кореляції:

;

(5.8.2)

;

(5.8.3)

.

(5.8.4)

Визначені таким чином величини називаються коефіцієнтами кореляції першого порядку. Під порядком ми маємо на увазі кількість індексів, що стоять після крапки. Так – другого порядку, а – третього. Як наголошувалося раніше, і – прості або нульового порядку. Інтерпретація, скажімо, така, що існує коефіцієнт кореляції між Y і X2 при постійних значеннях X3 і X4.

Інтерпретація простого і частинного коефіцієнтів кореляції

У разі моделі з двома змінними R мав чітке визначення, він визначав степінь лінійної зв’язаності між залежною змінною Y і єдиною пояснювальною змінною Х. Якщо ж ми виходимо за рамки моделі з двома змінними, нам потрібно приділити увагу простому коефіцієнту кореляції. З рівності (5.8.2), наприклад, бачимо, що:

  1. Якщо навіть , то не буде нульовим за умови, що не дорівнюють нулю і (або обидва вони дорівнюють нулю).

  2. Якщо , а і ненульові і мають однакові знаки, то буде негативним, якщо ж вони мають протилежні знаки, він буде позитивним. Приклад допоможе краще зрозуміти це. Нехай Y позначає урожай сільгоспкультури, X2  опади, а X3 – температуру. Припустимо, що , тобто немає зв’язку між урожаєм і опадами. Припустимо далі, що і . Тоді, як бачимо з (5.8.2), . Тобто при незмінній температурі існує позитивний зв’язок між урожаєм і опадами. Цей, здавалося б, парадоксальний результат, відповідає дійсності, оскільки температура X3 впливає і на урожай Y і на опади X2. Для знаходження істинного співвідношення між урожаєм і опадами необхідно виключити вплив температури. На цьому прикладі показано, як можна помилятися, використовуючи простий коефіцієнт кореляції.

  3. Значення і не обов’язково повинні мати однакові знаки. Це зауваження стосується й інших коефіцієнтів кореляції.

  4. Для двовимірної регресії, як нам відомо, величина R2 лежить між 0 і 1. Ця властивість залишається справедливою і для квадратів частинних коефіцієнтів кореляції. Спираючись на цей факт, можна перевірити справедливість властивості

    .

    (5.8.5)

  5. Припустимо, що . Чи означає це, що й ? Відповідь очевидна з (5.8.5). Некорельованість Y і X3, а також X2 і X3, не спричиняє корельованості Y і X2.

Побіжно відзначимо, що вираз можна назвати коефіцієнтом частинної детермінації й інтерпретувати його як частину варіації Y, пояснену не за рахунок змінної X3, а через включену в модель змінну X2. Таке трактування стає зрозумілим, якщо застосувати формулу

.

Відзначимо також співвідношення між , простими коефіцієнтами кореляції та частинними кореляційними коефіцієнтами:

;

(5.8.6)

;

(5.8.7)

.

(5.8.8)

Відзначимо на закінчення таке. Раніше мова йшла про те, що не спадає при включенні в модель додаткових пояснювальних змінних. Це зрозуміло з рівності (5.8.7), яка також показує, що частина варіації Y, поясненої спільно змінними X2 і X3, має 2 складники: частина, пояснена тільки X2 (це ), і частина, непояснена X2 (це ), помножена на пояснену змінною X3 частину при постійному значенні X2. Оскільки , то . У крайньому випадку при маємо .