Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика (6-8 теми).doc
Скачиваний:
30
Добавлен:
01.05.2015
Размер:
2.25 Mб
Скачать

2. Непараметричні методи зв'язку показників економічної діяльності

Взаємозв'язок окремих ознак вимірюють також за допомогою непараметричних методів. Часто доцільно досліджувати явища з використанням різних умовних оцінок, зокрема рангів — порядкових номерів. Ці коефіцієнти обчислюють тоді, коли досліджувані ознаки розподілено за різними законами. Наприклад, тій області, де рівень злочинності найнижчий, присвоюють ранг 1, а потім ранжують досліджувані області в міру збільшення цього показника. Принцип нумерації значень досліджуваних ознак— основа непараметричних методів вивчення взаємозв'язків соціальних і економічних явищ і процесів.

У статистиці в межах застосування методів оцінки щільності зв'язку найчастіше використовують рангові коефіцієнти Спірмена і Кемпела. Їx застосовують для визначення щільності зв'язку між якісними та кількісними ознаками, коли їх ранжовано за збільшенням або зменшенням ознаки.

Ранговий коефіцієнт кореляції Спірмена можна обчислити за формулою

Frame3

де— кількість рангів,— різниця рангів (факторної ознакиі результативної).

Значення коефіцієнта Спірмена лежить у межах від мінус 1 до 1 (тобто водночас оцінює щільність зв'язку та показує його напрямок). Значущість цього показника перевіряють за допомогою-критерію Стьюдента. При цьому використовують залежність

Коефіцієнт кореляції вважають істотним, якщо

У разі стохастичної залежності кожному значенню факторної ознаки відповідає множина значень результативної. Одиниці сукупності з певним рівнем факторної ознаки мають неоднакові значення результативної ознаки й утворюють розподіл за нею. Розподіл одиниць сукупності за однією ознакою в разі фіксованого значення другої називається умовним. У табл. 1 наведено комбінаційний розподіл робітників згідно з системою оплати праці та виробництвом деталей за зміну.

Таблиця 1

Розподіл робітників за системами оплати праці та кількістю вироблених за зміну деталей

Система оплати праці

Чисельність робітників відповідно до кількості вироблених деталей

Разом

Погодинна

3

5

1

1

10

Відрядна

1

1

4

16

8

30

Усього

4

6

5

17

8

40

Зв'язок між цими ознаками стохастичний, і кожному значенню факторної ознаки (системи оплати праці) відповідає ряд значень результативної ознаки. Кожен рядок таблиці являє собою ряд розподілу робітників за кількістю вироблених деталей у разі фіксованої системі оплати праці, тобто характеризує умовний розподіл.

У табл. 2 наведено частості умовних розподілів.

Таблиця 2

Частості розподілу робітників за системами оплати праці та кількістю вироблених за зміну деталей

Система оплати праці

Чисельність робітників відповідно до кількості вироблених деталей. % до загальної кількості

Разом

Погодинна

30,0

50,0

10,0

10,0

100,0

Відрядна

3,3

3.3

13,3

53.4

26,7

100,0

Усього

10,0

15,0

12,5

42,5

20,0

100,0

Частості першого та другого рядків різні. У разі відрядної системи оплати більша частка робітників із високим виробітком, тобто для різних систем оплати умовні розподіли не збігаються, й ознаки залежні. Чим більша відмінність між умовними розподілами, тим більше ознаки пов'язані між собою. Якщо ознаки незалежні, частості умовних розподілів збігаються й дорівнюють частотам розподілу всієї сукупності.

Для оцінки щільності зв'язку між ознаками використовують коефіцієнт взаємної спряженості (залежності)

де —частоти, —кількість одиниць сукупності; і — кількість груп, відповідно за першою та другою ознаками. обчислюють за формулою

де — частоти; — номер стовпця; — частості умовного розподілу в іншому рядку; — частості розподілу в підсумковому рядку.

Очевидно, що в разі незалежності ознак та , а в разі функціональної залежності коефіцієнт взаємної спряженості досягає свого максимального значення:

За даними табл. 2 (відсотки замінені коефіцієнтами)

Группа 6715

Отже, зв'язок між системою оплати праці та виробітком деталей помітний.

Якщо результативна ознака кількісна, то з'являється можливість порівняти не тільки частості умовних розподілів, але й окремі їх характеристики, насамперед середні величини. Зв'язок між ознаками, який проявляється в зміні середніх величин умовних розподілів результативної ознаки в разі зміни значень факторної, називається кореляційним. Кореляційна залежність — це різновид стохастичного зв'язку. Якщо між ознаками є кореляційний зв'язок, то с й стохастичний (якщо середні величини умовних розподілів різні, то й самі розподіли різні). Якщо кореляційної залежності немає, то з цього не випливає, що ознаки незалежні (у разі однакових середніх умовні розподіли можуть різнитися, наприклад, рівнем варіації, ексцесом, асиметрією тощо).

Один із найпоширеніших методів виявлення кореляційних зв'язків — метод аналітичних групувань. Для побудови аналітичного групування, що характеризує залежність між двома ознаками, потрібно поділити досліджувану сукупність на групи за однією ознакою (зазвичай факторною), а потім у кожній групі визначити середні значення другої ознаки, тобто середні умовних розподілів. Так, для побудови аналітичного групування за даними табл. 3 потрібно в кожній з груп за ознакою системи праці обчислити середній рівень виробітку деталей.

Групування показує, що середній виробіток деталей у разі відрядної оплати праці на дві деталі більший, ніж у разі погодинної, тобто між ознаками є кореляційний зв'язок.

Таблиця 3

Залежність виробітку деталей за зміну від системи оплати праці

Система оплати праці

Кількість робітників

Виробіток деталей на одного працівника

Погодинна

10

14

Відрядна

30

16

Усього

40

Зазвичай в аналітичних групуваннях попередньо не будують комбінаційні розподіли й обчислюють групові середні як прості середні арифметичні з індивідуальних варіант у групах.

У процесі дослідження залежності результативної ознаки від двох і більше факторних будують комбінаційні аналітичні групування, які дають змогу вивчити залежність результативної ознаки від кожного з факторів для фіксованих значень інших факторних ознак.

Якщо є залежність між ознаками, у простому аналітичному групуванні від групи до групи змінюється не тільки рівень факторної ознаки, що лежить в основі групування, але й рівень інших пов'язаних із нею факторних ознак. У цьому разі зміну групових середніх не можна вважати результатом впливу тільки групової ознаки: вона відображає спільний вплив взаємопов'язаних факторів.

Це групування також дає можливість виявити взаємодію між факторами, яка проявляється й у неоднаковій силі впливу одного фактора на результативну ознаку для різних рівнів іншої факторної ознаки.

Виявивши за допомогою аналітичного групування зв'язок між ознаками, потрібно виявити, яку роль відіграє досліджуваний фактор у зміні результативної ознаки, чи належить він до головних чи другорядних. Це можна зробити за допомогою вимірювання щільного зв'язку, в основі якого лежить складання дисперсії:

Загальна дисперсія являє собою середній квадрат відхилень індивідуальних значень ознаки від загальної середньої. Ці відхилення зумовлені дією різних факторів, які впливають на досліджувану результативну ознаку х.

Середня з групових (залишкова) дисперсія— це середній квадрат відхилень індивідуальних значень ознаки х від групових середніх. ознаки для всіх одиниць усередині кожної групи значення факторної ознаки постійні, ці відхилення можуть бути пов'язані з впливом усіх факторів, окрім того, який покладено в основу групування.

Міжгрупова (факторна) дисперсія — це середній квадрат відхилень групових середніх від загальної середньої. Оскільки кореляційний зв'язок проявляється в зміні середніх значень результативної ознаки (групових середніх), то міжгрупова (факторна) дисперсія характеризує коливання результативної ознаки, пов'язаної зі зміною факторної ознаки.

Отже, правило складання дисперсії вможливлює виокремлення із загальної дисперсії результативної ознаки, пов'язаної з дією всіх факторів, двох складових:

  • факторної дисперсії, пов'язаної з досліджуваною ознакою;

  • залишкової, пов'язаної з іншими факторами.

Для характеристики щільності зв'язку в аналітичних групуваннях використовують кореляційне відношення

Це показник частки варіації результативної ознаки, пов'язаної з факторною ознакою.

Значення кореляційного відношення коливається від 0 до 1. Якщо та чисельник (факторна дисперсія) дорівнюють нулю, то групові середні однакові, і зі зміною факторної ознаки середнє значення результативної ознаки залишається незмінним. Отже, кореляційного зв'язку між ознаками немає.

У разі факторна дисперсія дорівнює загальній, а залишкова — нулю. Це можливо за умови, якщо в кожній групі всі індивідуальні значення результативної ознаки збігаються, і кожному значенню факторної ознаки відповідає одне значення результативної. Отже, зв'язок між ознаками функціональний.

Відмінності кореляційного відношення від нуля недостатньо, щоб довести існування кореляційного зв'язку між ознаками. Відмінне від нуля кореляційне відношення може бути в разі випадкового поділу сукупності на групи. Наприклад, якщо механічно виділити за алфавітним списком дві групи робітників (із парними та непарними номерами), то середній виробіток деталей у цих групах не збігатиметься, і, отже, одержимо якесь відмінне від нуля кореляційне відношення. Але з цього не випливає зв'язок між виробітком деталей і номером робітника в алфавітному списку. Групи відібрано випадково, і вони являють собою випадкові вибірки. Тому групові середні містять похибки репрезентативності, і кореляційне відношення в цьому разі — міра таких похибок, а не характеристика щільності зв'язку.

Щоб перевірити, чи не має визначене в аналітичному групуванні кореляційне відношення такої природи, тобто чи воно не випливає з випадковості вибірки, потрібно порівняти фактичне значення з тим максимально можливим значенням, що може виникнути у випадкових вибірках із генеральної сукупності, у якій ознаки не пов'язані, тому . Це максимально можливе значення (його називають критичним) слід розуміти як імовірнісне. Його доцільно вибирати так, щоб імовірність одержати у вибірці значення , що перевищує критичне (якщо в генеральній сукупності ), була малою. Ця ймовірність називається рівнем значущості. Зазвичай у статистиці використовують рівні значущості 0,05 і 0,01. Критичні значення для них наведено в спеціальних таблицях. Розподіл у випадкових вибірках залежить від кількості степенів вільності факторної та залишкової дисперсій. Для факторної дисперсії кількість степенів вільності (де — кількість груп), для залишкової — (де — кількість варіант; — число груп). Наприклад, для аналітичного групування з табл. 10.3 =2-1 = 1; = 40 - 2 = 38.

Критичне значення слід шукати в таблиці на перетині стовпця, що відповідає, і рядка, що відповідає. Наприклад, у разі , для рівня значущості критичне значення

.

Отже, якщо в генеральній сукупності ознаки не пов'язані одна з другою (), то в 95 вибірках зі 100 може виникнути кореляційне відношення, яке не перевищує 0,097, і лише в п'яти вибірках — більше. Рівень значущості — це настільки мала ймовірність, що процеси та явища економічної та соціальної діяльності, яким вона властива, практично не можуть бути реалізовані в одиничному випробуванні (іспиті). Інакше кажучи, якщо в генеральній сукупності , то практично неможливо одержати значення , яке перевищує 0,097.

Якщо фактичне значення перевищує критичне, то це суперечить твердженню про незалежність ознак, і зв'язок між ними визнають суттєвим.

Якщо фактичне значення менше критичного, то це не суперечить твердженню про незалежність ознак, хоча й не доводить його правильність. Фактичне значення можна одержати лише в ході вибірки з генеральної сукупності, у якій ознаки не пов'язані, але не обов'язково з такої сукупності. Висновок залишається невизначеним, а наявність зв'язку не доведено. У цьому разі говорять, що зв'язок між ознаками несуттєвий.

Для перевірки суттєвості зв'язку часто застосовують не , а -критерій (критерій Фішера), пов'язаний з таким співвідношенням:

Обчислити-критерій можна також, виразивши його через дисперсії і:

Критичні значення наведено в дод. 4 для і

Правила користування цими таблицями та процедура перевірки залежності ознак за допомогою-критерію аналогічні описаним для.

Для великих значень степенів вільності, па відміну від , майже не змінюється, тому побудову таблиць можна закінчити для ; , а для потрібно будувати аналогічні таблиці й для великих Перевіряючи суттєвість зв'язку ознак, слід ураховувати, що розподіли та у вибірках відповідають критичним значенням у разі виконання певних передумов, найважливіша з яких — нормальний розподіл сукупності за результативною ознакою.

Якщо цю умову порушено, що досить часто трапляється в статистиці, то результати перевірки суттєвості зв'язку ознак слід розглядати як приблизні.

Зі збільшенням обсягу сукупності зменшується вплив відхилення емпіричного розподілу від нормального на результати перевірки суттєвості зв'язку ознак.