Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

kurs_lekciy_statystyka_DonNUET

.pdf
Скачиваний:
31
Добавлен:
22.02.2016
Размер:
6.09 Mб
Скачать

Номер

Вартість

Випуск

 

 

 

 

 

заводу (п)

основних

продукції,

х2

ху

у2

у= а

+ а х

 

виробничих

млн.грн. (у)

 

фондів,

 

 

 

 

0

1

 

 

 

 

 

 

 

 

млн.грн. (х)

 

 

 

 

 

 

1

12

5,6

144

67,2

31,36

5,2

2

8

4,0

64

32,0

16,00

3,5

3

10

4,0

100

40,0

16,00

4,4

4

6

2,4

36

14,4

5,76

2,7

5

9

3,6

81

32,4

12,96

4,0

6

15

5,0

225

75,0

25,00

6,5

7

11

4,6

121

50,6

21,16

4,8

8

13

6,5

169

84,5

42,25

5,6

9

14

7,0

196

98,0

49,00

6,1

10

10

4,5

100

45,0

20,25

4,4

Разом:

108

47,2

1236

539,1

239,74

47,2

В серед-

10,8

4,72

132,6

53,91

23,974

4,72

ньому на 1

 

 

 

 

 

 

 

завод

 

 

 

 

 

 

 

За способом найменших квадратів визначаємо параметри:

а0

=

1236 47,2 108 596,1

=

58339,2 58222,8

=

116,4

= 0,167;

 

10 1236

108 108

 

12360 11664

 

 

 

 

 

 

696,0

 

а

=

10 539,1

108 47,2

=

5391,0 5097,6

=

293,4

= 0,421.

 

 

 

 

1

 

696,0

 

 

 

 

696,0

696,0

 

 

 

 

 

 

 

 

 

 

Лінійне рівняння регресії між вартістю основних виробничих фондів і випуском продукції має вигляд: у= 0,167 + 0,421х.

Таким чином, при збільшенні вартості основних виробничих фондів на 1 млн.грн. випуск продукції зросте на 0,421 млн.грн.

Підставляючи в дане рівняння послідовно значення факторної ознаки « х», отримаємо вирівняні значення результативної ознаки « у». Якщо параметри рівняння визначені правильно, то у = ∑ у= 47,2.

Побудуємо графік, який покаже вирівнювання емпіричних даних рівнянням прямої.

101

у

 

 

 

 

 

 

 

 

7

 

 

 

 

у= 0,167 + 0,421х

6

 

 

 

 

у

 

5

 

 

 

 

 

 

= 4,72

 

 

 

 

 

у

4

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Рис. 6.2. Емпіричні і вирівняні рівні ряду

1

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

х

5

7

9

11

13

15

17

Для економічної інтерпретації лінійних і нелінійних зв’язків між двома досліджуваними явищами часто використовують розраховані на основі рівнянь регресії коефіцієнти еластичності.

Коефіцієнт еластичності показує, на скільки відсотків змінюється в середньому результативна ознака «у» при зміні факторної ознаки «х» на 1%.

Для лінійної залежності коефіцієнт еластичності визначається за формулою:

ε = а

х

 

,

ε = а

 

х

 

,

у

 

 

 

1

 

1

 

у

 

де ε – коефіцієнт еластичності.

В нашому прикладі коефіцієнт еластичності на першому підприємстві при

(х=12) буде дорівнювати: ε1 = а1 ху= 0,421512,2 = 0,97 %.

Отже, на 1 % приросту вартості основних виробничих фондів, випуск продукції зросте на 0,97 %. На п’ятому підприємстві при (х=9)

ε5 = 0,42194 = 0,95%, на десятому – при (х=10) ε10 = 0,421 410,4 = 0,96 %.

Для всіх підприємств разом коефіцієнт еластичності становить:

ε= а1 х = 0,421 10,8 = 0,963 %.

у4,72

102

Це означає, що при збільшенні середньої вартості основних виробничих фондів на 1 % випуск продукції зросте в середньому на 0,963 %.

Якщо залежність між ознаками параболічна, то коефіцієнт еластичності визначається за формулою:

ε = (а1 + а2 х)ху.

Визначення тісноти зв’язку в кореляційно-регресійному аналізі ґрунтується на правилі додавання дисперсій, але для оцінки лінії регресії використовують теоретичні значення результативної ознаки.

Різниця між загальною і залишковою дисперсіями дає нам теоретичну (факторну) дисперсію, яка вимірює варіацію, зумовлену фактором « х». На порівнянні цієї різниці із загальною дисперсією побудований індекс кореляції,

або теоретичне кореляційне відношення, які обчислюються за формулами:

R =

σ 2

σ 2

= 1

σ 2

, або R =

δ 2

,

з

е

е

σ 2

 

σ 2

 

σ 2

 

 

 

 

з

 

з

 

з

 

де R – індекс кореляції (теоретичне кореляційне відношення);

σз2 – загальна дисперсія;

σе2 – залишкова дисперсія;

δ 2 – факторна (теоретична) дисперсія.

Факторну дисперсію з теоретичних значень обчислюють за формулою:

δ 2 = (уу)2 ,

п

або за формулою без теоретичних значень:

δ 2 = (а0 у + а1 ху)(у)2 .

п

Залишкову дисперсію визначають за формулою:

σе2 = (упу)2 ,

або за правилом додавання дисперсій: σ 2

=σ 2 δ 2 .

е

з

В нашому прикладі факторна дисперсія дорівнює:

δ 2 = (0,167 47,2 +0,421 539,1)4,722 =1,206. 10

103

Загальна дисперсія становить:

σ з2 = у2 (у)2 = 23,974 22,278 =1,696.

Залишкову дисперсію визначаємо як різницю між загальною і факторною

дисперсіями: σе2 =σ з2 δ 2 =1,699 1,206 = 0,490.

Таким чином індекс кореляції за вищенаведеними формулами буде дорівнювати:

R =

σ з2 σе2

=

1,696 0,490

= 0,843,

 

σ з2

 

1,696

 

або

R =

1

σе2

= 1

0,490

= 0,843,

 

 

 

σ 2

 

 

1,96

 

 

 

 

з

 

 

 

 

або

R =

δ 2

=

1,206

=

0,711 = 0,843.

 

 

σ з2

 

1,696

 

 

 

Індекс кореляції показує тісну залежність випуску продукції від вартості основних фондів.

Коефіцієнт детермінації (R2) характеризує ту частину варіації результативної ознаки «у», яка відповідає лінійному рівнянню регресії:

R

2

=

δ 2

=

1,206

= 0,711.

 

σ 2

 

 

 

1,696

 

 

 

 

 

 

 

 

з

 

 

 

 

Отже, в обстеженій сукупності заводів 71,1 % варіації випуску продукції пояснюється різними рівнями оснащеності заводів основними фондами.

Індекс кореляції приймає значення від «0» до «1». Коли R=0, то зв’язку між варіацією ознак « у» і « х» немає. Залишкова дисперсія дорівнює загальній

(σе2 =σз2 ), а теоретична дисперсія дорівнює нулю (δ 2 = 0 ).

При R=1 теоретична дисперсія дорівнює загальній (δ 2 =σ з2 ), а залишкова –

σе2 =0.

Для вимірювання тісноти зв’язку і визначення його напрямку при лінійній залежності використовують лінійний коефіцієнт кореляції, який визначається за формулою:

104

r = xy x y .

σ x σ y

Значення «r» коливається в межах від -1 до +1. Додатнє значення «r» означає прямий зв'язок між ознаками, а від’ємне – обернений.

Оцінка тісноти зв’язку проводиться за схемою:

 

 

 

 

 

 

Сила зв’язку

 

Величина лінійного коефіцієнта кореляції при

 

 

 

 

 

 

 

наявності:

оберненого зв’язку

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

прямого зв’язку

 

 

 

 

 

 

 

 

 

 

 

Слабка

 

 

 

 

 

 

0,1 – 0,30

(-0,1) – (-0,30)

 

 

 

 

 

 

 

 

 

 

Середня

 

 

 

 

0,3 – 0,70

(-0,3) – (-0,70)

 

 

 

 

 

 

 

 

 

 

 

 

 

Тісна

 

 

 

 

 

 

0,7 – 0,99

(-0,7) – (-0,99)

 

 

 

 

За даними нашого прикладу обчислимо лінійний коефіцієнт кореляції:

 

 

 

 

 

 

 

 

 

 

(

 

 

)2

 

123,6 10,82

 

 

 

 

 

σ х

=

 

 

х2

=

=

6,96 = 2,638;

 

 

 

х

 

 

 

 

 

 

 

 

 

 

(

 

)2

 

23,974 4,722

 

 

 

σ у

=

 

 

у2

=

=1,302;

 

 

 

у

 

 

 

 

 

 

 

 

 

=

53,9110,8 4,72

=

 

2,9340

= 0,854.

 

r =

 

 

ху

х

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3,4349

 

 

 

 

σ х σ у

2,638 1,302

 

 

Це означає, що зв'язок між вартістю основних виробничих фондів і випуском продукції сильний (тісний) і прямий.

Істотність зв’язку коефіцієнта детермінації R 2 перевіряють за допомогою

таблиці критерію F для 5 %-го рівня значущості. Так, при

k 2=n-m=10-2=8.

Фактичне значення F- критерія для нашого прикладу визначають за формулою:

 

F

=

 

R 2

 

k2

=

 

0,711

 

 

8

=19,68.

 

 

 

 

 

R 2

 

10,711

 

 

 

 

ф

1

 

k1

1

 

 

 

 

 

 

 

 

Критичне

значення

Fт

(0,95)

 

 

значно

 

 

менше

від

фактичного

Fт (0,95) < Fф (5,32 < 19,68), що підтверджує істотність кореляційного зв’язку між

досліджуваними ознаками.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для встановлення достовірності обчисленого лінійного коефіцієнта кореляції

використовують критерій Стьюдента (t- критерій):

 

 

tr =

 

r

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

µr

 

 

де µr – середня помилка коефіцієнта кореляції, яку визначають за формулою:

µr =

1

r 2

 

.

 

 

n 1

105

При достатньо великому числі спостережень ( п > 50) коефіцієнт кореляції можна вважати достовірним, якщо він перевищує свою помилку втричі і більше, а якщо менше, ніж утричі, то зв'язок між досліджуваними ознаками « у» і « х» не доведений.

В нашому прикладі середня помилка коефіцієнта кореляції дорівнює:

µr

=

10,8532

=

10,723

=

0,277

= 0,092.

9

3

3

 

 

 

 

 

Відношення коефіцієнта кореляції до його середньої помилки становить:

tr = 0,0920,853 = 9,27.

Це дає нам право вважати, що обчислений лінійний коефіцієнт кореляції достатньо точно характеризує силу зв’язку між досліджуваними ознаками.

6.4.Нелінійні залежності

Впрактиці економічного аналізу найчастіше використовують такі нелінійні функції залежності: гіперболічну, параболічну другого порядку, напівлогарифмічну та деякі інші.

Якщо результативні ознака із збільшенням факторної ознаки зростає або спадає не нескінченно, а прямує до певної межі, то для її аналізу застосовують

рівняння гіперболи: у= а0 + а1 1х.

Для знаходження параметрів цього рівняння способом найменших квадратів використовується система нормальних рівнянь:

у

= па

0

+ а

1

;

 

 

 

 

 

 

 

 

 

 

 

 

1

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

1

 

у

= а

0

+

а

 

.

 

 

 

 

 

х

 

 

х

 

1

 

х

2

 

 

 

 

 

 

 

 

 

 

 

За способом найменших квадратів параметри гіперболи визначають за формулами:

 

 

 

1

 

у − ∑

1

у

 

 

п

х

 

− ∑

1

 

у

 

 

 

 

 

 

 

 

 

 

 

 

у

х

 

 

а

0

=

х2

 

 

 

 

х

 

 

х

;

а

=

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

1

− ∑

1

1

 

 

 

1

п

 

1

 

− ∑

1

1

 

 

 

 

 

 

х2

х

х

 

 

 

 

 

х2

 

х

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

106

Графік гіперболи має вигляд:

 

 

 

 

 

 

 

 

 

 

Собівартість

Yx

 

 

 

 

 

 

 

 

 

0

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

грн.

8

7

7,22

 

 

 

 

 

 

 

 

 

2

5

4,17

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

3

3

3,09

 

 

 

 

 

 

 

 

 

4

продукції,

6

2,5

2,59

 

 

 

 

 

 

 

 

 

5

5

2

2,28

 

 

 

 

 

 

 

 

 

6

1,9

2,06

 

 

 

 

 

 

 

 

 

7

4 1,8

1,91

 

 

 

 

 

 

 

 

 

8

Собівартість

3

1,7

1,8

 

 

 

 

 

 

 

 

 

9

1,6

1,71

 

 

 

 

 

 

 

 

 

10

2

1,5

1,64

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

2

3

4

5

6

7

8

9

10

 

 

 

 

Денний виробіток на одного робітника, тис.грн.

 

 

Рис. 6.3. Графік кореляційної залежності собівартості одиниці продукції від денного виробітку на одного робітника

Для визначення тісноти зв’язку між результативною і факторною ознаками обчислюємо кореляційне відношення за формулою:

(уу)2 η ху = 1(уу)2 .

Парабола другого порядку застосовується в тих випадках, коли із зростанням факторної ознаки відбувається нерівномірне зростання або спадання результативної ознаки. Рівняння параболи другого порядку визначається за формулою:

у= а0 + а1х + а2 х2 .

Параметри цього рівняння знаходять способом найменших квадратів шляхом складання і розв’язання системи нормальних рівнянь:

у = па

0

+ а

х + а

2

х2 ;

 

 

 

 

1

 

 

 

 

= а0

х + а1 х2 + а2 хз;

ху

х2

у = а

 

х2 + а х3 + а х4 .

 

 

 

0

 

1

 

 

2

 

 

 

 

 

 

З метою оцінки тісноти зв’язку визначають кореляційне відношення:

107

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

η ху =

 

(у

у)

 

 

 

 

 

 

 

 

(уу)2 .

 

 

Графік параболи другого порядку має вигляд:

 

 

11

y

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

x

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

5

10

15

20

25

30

35

40

45

Рис. 6.4. Графік залежності між глибиною зрошення і урожайністю

насіння багаторічних трав

Вирівнювання за напівлогарифмічною кривою проводять в тих випадках, коли із зростанням факторної ознаки, середня результативна ознака спочатку до певних меж зростає досить швидко, але пізніше темпи її зростання поступово сповільнюються.

Напівлогарифмічна функція має вигляд:

у= а0 + а1lоg x.

Для знаходження параметрів напівлогарифмічної функції способом найменших квадратів, розв’язують систему двох рівнянь:

у = па

0

+а

∑lо х;g

 

 

 

 

1

 

 

 

 

 

= а

 

∑log х+

а

(log x)2 .

уlog x

0

 

 

 

 

1

 

Графік напівлогарифмічної кривої.

108

Y X = 1,51+ 3,479loqx.

9

y

8

 

7

6

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

x

0

10

20

30

40

50

60

70

80

Розмір товарообороту магазину, млн. грн.

Мал. 6.5. Графік кореляційної залежності між розміром товарообороту магазину і виробітком одного продавця

6.5.Багатофакторний кореляційно-регресійний аналіз

Вбагатьох випадках на результативну ознаку впливає не один, а декілька чинників. Між ними існують складні взаємозв’язки, тому їх вплив на результативну ознаку комплексний і його не можна розглядати як просту суму ізольованих впливів.

Багатофакторний кореляційно-регресійний аналіз дозволяє оцінити міру впливу на досліджуваний результативний показник кожного із введених в модель чинників при зафіксованому на середньому рівні інших чинників.

Форму зв’язку можна визначити шляхом перебору функцій різних типів, але це пов’язано з великою кількістю зайвих розрахунків. Однак, беручи до уваги, що функцію багатьох змінних шляхом логарифмування або заміни змінних можна звести до лінійного виду:

у= а0 + а1 x1 + а2 х2 + а3 х3 +... + ап хп.

Параметри рівняння знаходять за способом найменших квадратів.

109

Так, для розрахунку параметрів рівняння лінійної двофакторної регресії:

у= а0 + а1x1 + а2 х2 ,

де у– розраховані значення результативної ознаки-функції;

х1 , х2 – факторні ознаки; а0 , а1, а2 – параметри рівняння.

Система нормальних рівнянь:

у = па0 + а1 х1 + а2 х2 ;ух1 = а0 х1 + а1 х12 + а2 х1х2 ;

ух2 = а0 х2 + а1 х1х2 + а2 х22 .

Кожний коефіцієнт рівняння показує степінь впливу відповідного чинника на результативний показник при фіксованому положенні решти чинників, тобто, як із зміною окремого чинника на одиницю змінюється результативний показник.

На основі коефіцієнтів регресії не можна судити, яка із факторних ознак найбільше впливає на результативну ознаку, так як коефіцієнти регресії між собою не порівняльні, оскільки вони мають різні одиниці виміру.

З метою виявлення порівняльної сили впливу окремих чинників і резервів, які закладені в них, статистика вираховує частинні коефіцієнти еластичності « ε і»,а

також бета-коефіцієнти « βі » за формулами:

 

 

 

 

 

 

 

 

σх

 

 

х

і

 

 

εі = аі

 

 

 

;

βі = аі

і

,

 

 

 

 

 

 

 

у

 

 

 

 

σ у

де аі – коефіцієнт регресії при і-му факторі;

хі – середнє значення і-го факторі;

у– середнє значення результативної ознаки;

σх1 – середнє квадратичне відхилення і-го фактора;

σу – середнє квадратичне відхилення результативної ознаки.

Частинні коефіцієнти еластичності показують, на скільки відсотків в середньому зміниться результативна ознака із зміною на 1 % кожного чинника при фіксованому положенні інших чинників.

110

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]