Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
конспект новый статистика.doc
Скачиваний:
31
Добавлен:
19.11.2019
Размер:
1.88 Mб
Скачать

6. Власне - кореляційні параметричні методи вивчення зв'язку. Оцінка істотності кореляції

Лінійний коефіцієнт кореляції можна обчислити по формулі

або

Коефіцієнт кореляції може бути виражений через дисперсії додоваємих:

Між лінійним коефіцієнтом кореляції і коефіцієнтом регресії існує визначена залежність, що виражається формулою

,

де аі - коефіцієнт регресії в рівнянні зв'язку;

- середнє квадратичне відхилення “відповідної статистичної істотної” факторної ознаки.

Лінійний коефіцієнт кореляції змінюється в межах від -1 до 1: -1£ r £1.

Знаки коефіцієнтів регресії і кореляції збігаються. При цьому інтерпретацію вихідних значень коефіцієнта кореляції можна представити в табл.9.3.

Таблиця 9.3

Оцінка лінійного коефіцієнта кореляції

Значення лінійного коефіцієнта зв'язку

Характер зв'язку

Інтерпретація зв'язку

r= 0

Відсутня

0 < r < 1

Пряма

З збільшенням X збільшується У

- 1 < r < 0

Обернена

З збільшенням X зменшується У, і навпаки

r = 1

Функціональна

Кожному значенню факторної ознаки строго відповідає одне значення результативної ознаки

Значимість лінійного коефіцієнта кореляції перевіряється на основі t - критерію Стьюдента. При цьому висувається і перевіряється гіпотеза (Н0) про рівність коефіцієнта кореляції нулю [Н0 : r=0] . При перевірці цієї гіпотези використовується t - статистика:

.

Якщо розрахункове значення tр > tкр (табличне), те гіпотеза Н0 відхиляється про значимість лінійного коефіцієнта кореляції, а отже, і про статистичну істотність залежності між X і Y.

При більшому числі спостережень (n > 100) використовується така формула t- статистики:

.

Для статистично значимого лінійного коефіцієнта кореляції можна побудувати інтервальні оцінки за допомогою Z - розподіли Фішера:

.

Спочатку визначається інтервальна оцінка для Z по вираженню

,

де tg - табуліровані значення для нормального розподілу, залежні від g = 1 - a (a - рівень можливості);

Z ¢ - табличні значення, Z = f(r) - розподіли. Функція Z¢ - нечетна, тобто Z¢= f(-r)= = -f(r).

Приклад. На основі вибіркових даних про ділову активність однотипних комерційних структур оцінити тісноту зв'язку між прибутком (млн. грн.) (У) і витратами на 1 грн. виробництва продукції (X) (табл.9.4).

Таблиця 9.4

Розрахункова таблиця для визначення коефіцієнта кореляції

№ n/n

у

рx

у x

у2

х2

1

2

3

4

5

6

221

1 070

1 001

606

779

789

96

77

77

89

82

81

21 216

82 390

77 077

53 934

63 878

63 909

48 841

1 144 900

1 002 000

367 236

606 841

622 520

9 216

5 929

5 929

7 921

6 734

6 561

Сума

4 466

502

362 404

3 792 338

42 280

Середня

744,33

83,67

60 400,67

632 056,33

7 046,67

По формулі значення коефіцієнта кореляції склало:

.

Таким чином, результат по усім формулах однаковий і свідчить про сильну обернену залежність між досліджуваними ознаками.

Перевірка значимості коефіцієнта кореляції:

.

Гіпотеза Н0 відхиляється при рівні значимості s = 0,05 і числі ступенів свободи до = 6-2 = 4, тому що |tр| > tкр = 2,776, що свідчить про значимість даного коефіцієнта кореляції.

Довірчі інтервали лінійного коефіцієнта кореляції між прибутком і витратами на 1 грн. що випускається продукції утворилися : a=0,05; g = 1 - a= = 1-0,05 = 0,95. Тоді tg = 1,96 - для нормального закону розподілу(додаток 1) |r| = |-0,98| =0,98; Z¢ = 2,2976:

1,1659 £ Z £ 3,4292.

По таблиці Z - розподіли Фішера визначаємо r(0,83 £ r£ 0,988).

При цьому середня квадратична помилка лінійного коефіцієнта кореляції склала:

.

У випадку наявності лінійної і нелінійної залежності між двома ознаками для виміру тісноти зв'язку застосовуються так називане кореляційне відношення. Розрізняють емпіричне і теоретичне кореляційне відношення.

Емпіричне кореляційне відношення розраховується за даними групування, коли d2 характеризує відхилення групових середніх результативного показника від загальної середньої:

,

де h - кореляційне відношення;

s2 - загальна дисперсія;

2 - середня з приватних (групових) дисперсій;

- міжгрупова дисперсія(дисперсія групових середніх).

Всі ці дисперсії є дисперсіями результативної ознаки. Теоретичне кореляційне відношення визначається по формулі

,

де d2 - дисперсія вирівняних значень результативної ознаки, тобто розрахованих по рівнянню регресії;

s2 - дисперсія емпіричних (фактичних) значень результативної ознаки.

;

.

Тоді

пояснюється впливом факторноі ознаки.

У основі розрахунку кореляційного відношення лежить правило додавання дисперсій (тема 7), тобто

,

де sі2 - при вивченні ступеня корелірованості чинників відбиває варіацію результативної ознаки (У) під впливом усіх не облічених при аналізі чинників тобто носить залишковий характер:

.

Звідси формула кореляційного відношення приймає вид:

.

Кореляційне відношення змінюється в межах від 0 до 1 (0 £ h £ 1), і аналіз ступеня тісноти зв'язку цілком відповідає лінійному коефіцієнту кореляції (табл.9.3).

Теоретичне кореляційне відношення також може обчислюватися по формулі

.

Значимість розраховується при виконанні нерівності

.

Кореляційне відношення є універсальним показником тісноти зв'язку в порівнянні з лінійним коефіцієнтом кореляції.