Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Посібник-Практичні заняття-стат 2012

.pdf
Скачиваний:
175
Добавлен:
04.03.2016
Размер:
2.56 Mб
Скачать

143

хз 4,4 1,3 4,3 0,5 4,2 1,5 14,17 4,29грн. 1,3 0,5 1,5 3,3

Можна стверджувати, що середня ціна продажу одиниці даного товару на ринках міста зросла у звітному періоді порівняно із базовим на 4,29 – 4,13= 0,16 грн.

Примітки:

Якщо за умовами завдання надані не згруповані дані, які необхідно згрупувати і визначити середній розмір групувальної ознаки, то спочатку необхідно виконати групування, побудувати ряд розподілу за прикладами розв'язання завдань № 1, 2 або 3 до теми № 3, а вже потім розраховувати середню величину. Такого типу завдання може бути початком більш складної задачі, в якій необхідно визначити показники варіації, або структурні середні, або характеристики форми розподілу.

Приклад 4

Розподіл працівників підприємства за віком наведений у таблиці. Розрахувати середній вік працівника.

Вік

до 20

20 – 25

25 – 30

30 – 40

40 і

Разом

більше

 

 

 

 

 

 

Число

 

 

 

 

 

 

працівників,

4

20

46

60

50

220

осіб

 

 

 

 

 

 

Розв’язання

Вихідні дані представлені інтервальним рядом розподілу з відкритими інтервалами. Тому спочатку необхідно закрити відкриті інтервали – перший закриваємо за шириною наступного, останній – за шириною попереднього:

h2 = 25 – 20 = 5, тому нижня межа першого інтервалу дорівнює 20 – 5 = 15; h4 = 40 – 30 = 10, тому верхня межа останнього інтервалу дорівнює

40 + 10 = 50.

Для визначення значення ознаки в кожному інтервалі замінюємо інтервальний ряд розподілу дискретним, визначивши середнє значення для кожного інтервалу.

Так, для першого інтервалу х1

= (15 + 20) : 2 = 17,5;

для другого інтервалу

х2

= (20 + 25) : 2 = 22,5 і т.д.

Для розрахунку середньої арифметичної зваженої скористаємося табличним способом проведення розрахунків (див. табл. нижче).

143

144

Вік

Число робітників, fi

xi

xi fi

15 - 20

4

17,5

70

20 – 25

20

22,5

450

25 – 30

46

27,5

1265

30 – 40

60

35,0

2100

40 – 50

50

45,0

2250

Разом

180

х

6135

Розрахунок середнього віку працівника виконуємо за формулою середньої арифметичної зваженої. Із використанням результатів розрахунків із

таблиці:

 

m x f

 

 

 

 

 

 

6135

 

 

 

 

i

i

 

 

x

 

1

 

 

=

34,1

роки.

 

mfi

 

б

 

 

 

 

180

 

 

 

 

1

 

 

 

 

Таким чином, середній вік працівника на підприємстві становить 34,1

роки.

Приклад 5

Залишки заборгованості із заробітної плати на підприємстві на початок кожного місяця становили, тис. грн.: 01.01. – 2,8; 01.02. – 3,1; 01.03. – 5,9; 1.04. – 3,2. Визначити середньомісячний залишок заборгованості із заробітної плати на підприємстві.

Розв’язання

Середню в моментному ряді із рівними періодами часу між

моментами розраховують як середню хронологічну:

 

 

 

 

 

 

x1

xn

x x x

 

 

 

 

 

 

 

 

 

 

 

2

2 3

n 1

 

 

 

 

 

 

 

 

 

 

 

 

=

 

x

 

n 1

 

 

 

 

 

= (2,8 3,2):2 3,1 5,9 4,0тис.грн. 4 1

Таким чином, середньомісячний залишок заборгованості із заробітної плати на підприємстві становив 4 тис. грн.

Приклад 6

Кількість зареєстрованих розлучень за чотири роки зросла у 1,57 рази, у тому числі: за перший рік – у 1,08; за другий – у 1,1; за третій – у 1,18; за четвертий – у 1,12 рази. Розрахувати середньорічний темп зростання кількості зареєстрованих розлучень.

Розв’язання

Дані не згруповані, осереднювана ознака представлена відносними

144

145

величинами динаміки, тому середню величину розраховуємо як середню геометричну просту:

x nx1 x2 x3 ....xn 41,081,1 1,181,12 41,57 1,119,

тобто, в середньому за рік кількість зареєстрованих розлучень зростала в

1,119 рази або на 11,9 %.

Приклад 7

Дисципліна підприємців різних видів діяльності щодо сплати податків характеризується даними, наведеними в таблиці.

Види діяльності

Кількість підприємців, які

Сума податку,

сплачують податки

 

сплаченого одним

 

 

у % до всіх

 

усього,

підприємцем, млн.

 

зареєстрованих

 

тис. осіб

грн.

 

підприємців

 

 

 

Виробнича

18

60

2,5

Торговельна

28

70

2,0

Посередницька

44

55

5,0

Визначити у середньому за всіма видами діяльності частку підприємців, які сплачують податки, та середній розмір податку, сплаченого одним підприємцем.

Розв’язання

Середня частка підприємців, які сплачують податки, визначається за логічною формулою:

Кількістьпідприємців, якісплачуютьподатки х .

Кількістьусіхзареєстрованихпідприємців

Оскільки дані згруповані, а за ваги fj тут узято кількість усіх зареєстрованих підприємців, якої в таблиці вихідних даних немає, то середня частка підприємців розраховується як середня гармонічна:

m z x 1 i ,

z

m i

1 x

i

де zi - кількість підприємців, які сплачують податки;

xi - частка підприємців, які сплачують податки у % до всіх зареєстрованих підприємців.

145

146

х 18 28 44 100 90 100 60%. 018,6 028,7 044,55 150

Середній розмір податку, сплаченого одним підприємцем, подається

такою логічною формулою:

 

 

 

Сумаподатків, якісплачуютьусіпідприємці

 

х

 

 

.

 

 

 

 

 

Кількістьусіхпідприємців, якісплачуютьподатки

У даному випадку вагами є кількість підприємців, які сплачують податки. Таку інформацію вміщено в таблицю вихідних даних. Тому скористаємось

формулою середньої арифметичної зваженої:

 

 

 

 

 

 

 

x

m xi

fi

 

,

 

 

 

 

1

 

 

 

 

 

 

mfi

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

де хi - розмір податку, сплаченого одним підприємцем;

 

fi - кількість підприємців, які сплачують податки.

 

 

 

 

2,5 18 2,0 28 5,0 44 321

 

 

 

 

х

18 28 44

 

90

3,57тис. грн.

Таким чином, виходячи із даних про дисципліну підприємців різних видів діяльності щодо сплати податків, середня частка підприємців, які сплачують податки, визначена як середня гармонічна зважена, становить 60% від загальної кількості зареєстрованих підприємців; середній розмір податку, сплаченого одним підприємцем, розрахований як середня арифметична зважена, становить 3,57 тис. грн.

Бібліографічний список до практичного заняття : [ 5 - 11, 15 - 20 ]

Практичні заняття до теми 6: Методи аналізу рядів розподілу

Мета: Закріпити теоретичні знання та виробити практичні навички щодо визначення центру розподілу, рівня варіації (оцінка однорідності сукупності) та форми розподілу, визначення характеристик концентрації, диференціації та подібності розподілів.

План заняття

146

147

1.Аналіз закономірностей розподілу за допомогою характеристик центру розподілу (середньої, моди, медіани) та порядкових характеристик (квартилів, квінтилів).

2.Вимірювання варіації ознак за допомогою абсолютних і відносних мір варіації: розмаху варіації, середніх лінійного та квадратичного відхилень, коефіцієнтів варіації.

3.Характеристики форми розподілу: коефіцієнти асиметрії та ексцесу.

4.Визначення характеристик концентрації, диференціації та подібності розподілів.

МЕТОДИЧНІ РЕКОМЕНДАЦІЇ

Аналіз закономірностей розподілу за допомогою характеристик центру розподілу (середньої, моди, медіани) та порядкових

характеристик (квартилів, квінтилів)

Виявлення закономірностей зміни частот залежно від зміни варіюючої ознаки, що покладена в основу групування і є основою аналізу варіаційних рядів розподілу. При такому аналізі найчастіше використовують такі групи показників:

характеристики центру розподілу;

характеристики розміру варіації;

характеристики форми розподілу.

Центром розподілу називається значення варіюючої ознаки, навколо якого групуються інші варіанти. До характеристик центру розподілу належать

середня, мода, медіана, чверть (квартиль) і десята частина (дециль).

Види та методика визначення середньої величини детально розглянуто у методичних рекомендаціях до теми №5 "Узагальнюючі статистичні показники". Перевага середньої величини як узагальнюючого для сукупності показника є одночасно і її недоліком – у середній знищуються індивідуальні відмінності варіантів. Наприклад, середнє значення між 18 та 22 дорівнює 20, також 20 дорівнює середнє значення між 2 і 38.

Для повнішого розкриття властивостей ряду розподілу визначають моду Мо, медіану Ме, квартилі Qu1, Qu2, Qu3 та децилі – від D1 до D9.

Мода (Мо) – значення варіанти, яке найчастіше повторюється в ряду розподілу. У дискретних рядах моду легко відшукати візуально, безпосередньо за найбільшим значенням частоти або частки.

В інтервальному ряду за тим самим принципом визначається модальний інтервал, тобто інтервал, частота якого має найбільше значення. Якщо треба більш точно встановити модальний рівень, його обчислюють за формулою:

Mo x h (fMo fMo 1) , (3.11)

Mo Mo ( fMo fMo 1 ) ( fMo fMo 1 )

де Мо – мода

147

148

х Мо – нижня межа модального інтервалу h Mo – ширина модального інтервалу

f Mo – частота модального інтервалу

f Mo – 1 – частота попереднього (перед модального) інтервалу f Mo + 1 – частота наступного (після модального) інтервалу.

Слід зауважити, що ця формула використовується для інтервальних варіаційних рядів з рівними інтервалами.

Значення моди можна також визначити графічним способом за допомогою гістограми (див. рис. 3.12.).

f

50

40

В

С

 

 

 

30

 

M

 

 

 

 

//////

 

 

 

 

А

 

 

 

 

20

 

D

 

 

 

 

D

 

 

 

 

10

 

 

 

 

 

0

 

 

 

 

 

50

100

Мо 150

200

250

Х

Рисунок 3.5. Визначення моди графічним методом

Графічним методом мода визначається так: на гістограмі (рис. 3.5) беремо прямокутник з найбільшою висотою, лівий верхній кут цього прямокутника (точка B) з’єднуємо з лівим верхнім кутом прямокутника, розташованого праворуч (точка D), а верхній правий кут найбільшого прямокутника (точка С) з’єднуємо з правим верхнім кутом прямокутника, розташованого ліворуч (точка А); з перетину прямих АС і BD (точка М) на вісь абсцис опускаємо перпендикуляр, який і визначить значення моди.

Для визначення моди за інтервальним варіаційним рядом з нерівними інтервалами в аналітичному вираженні перегруповують вихідний варіаційний ряд на ряд з рівними інтервалами або замість частот використовують відносні частоти. Для визначення моди графічним способом будують гістограму відносних частот. Основу прямокутників становлять розміри інтервалів, а висоту

– відношення відповідної частоти до ширини інтервалу. Для кожного інтервалу визначається відносна частота за формулою:

w

fi

,

(3.12)

 

i

hi

 

 

 

де wi – відносна частота i–го інтервалу; fi – частота i–го інтервалу;

hi – ширина i–го інтервалу.

148

149

Принцип визначення моди лишається тим самим, що й для інтервального варіаційного ряду з рівними інтервалами.

Медіана (Ме) – варіанта, що ділить упорядкований варіаційний ряд на дві,

рівні за обсягом частини. Наприклад, якщо в ряді розподілу робітників за віком Ме = 30, це означає, що половина робітників мають вік менше 30 років, половина

– старші за цей вік.

Визначаючи медіану, використовують кумулятивні частоти Sfi або частки Sdi. У дискретному ряду медіанним буде значення ознаки, кумулятивна частота якого перевищує половину сукупності, тобто Sfi ≥ 0,5 fi (для кумулятивної частки Sdi ≥ 0,5).

Кумулятивні частоти визначаються доданням наступного значення частоти до суми значень попередніх частот. При цьому не має значення які інтервали у варіаційному ряді розподілу: рівномірні чи нерівномірні.

В інтервальному ряду за цим принципом визначають медіанний інтервал. Значення медіани, як і значення моди, обчислюють за інтерполяційною

формулою:

Me xMe hMe

(0,5 fi S f Me 1 )

,

(3.13)

 

 

f Me

 

де Ме – медіана хМе – нижня межа медіанного інтервалу

hMe – ширина медіанного інтервалу 0,5 f i – половина сукупності

S fMe - 1 – сума накопичених частот до медіанного інтервалу f Ме – частота медіанного інтервалу.

Медіану можна визначити й графічним способом, використовуючи для цього кумулятивний полігон. Медіана визначається так: на осі ординат відкладають точку, що дорівнює половині суми частот. З цієї точки проводять лінію, паралельну осі абсцис до її перетину з лінією кумулятивного полігону (точка А). З точки А на вісь абсцис опускають перпендикуляр, координата якого і буде медіаною (детальніше в прикладі 2 розв’язання завдань за даною темою).

В аналізі закономірностей розподілу крім медіани використовуються також й інші структурні (або порядкові) характеристики, які ділять всі одиниці розподілу на рівні за чисельністю групи. Вони отримали загальну назву квантилі. Частинним випадком квантилів є, насамперед, квартилі (ділять сукупність на чотири рівних частини), квінтилі (ділять сукупність на п’ять рівних частин), децилі (ділять сукупність на десять рівних частин) та перцентилі (ділять сукупність на сто рівних частин). Методика визначення квартилів і децилів наведена у курсі лекцій [5, тема 6].

Вимірювання варіації ознак за допомогою абсолютних і відносних мір варіації: розмаху варіації, середніх лінійного та квадратичного відхилень,

коефіцієнтів варіації

149

150

Варіація, тобто коливання, мінливість будь-якої ознаки є властивістю статистичної сукупності. Здатність ознаки змінювати індивідуальні значення називається варіабельністю. Вона зумовлена дією безлічі взаємопов’язаних причин, серед яких є основні та другорядні. Основні причини формують центр розподілу. Другорядні причини впливають на форму розподілу.

Для виміру та оцінки варіації використовують систему абсолютних та відносних характеристик. До абсолютних характеристик належать: розмах

варіації, середнє лінійне відхилення, середнє квадратичне відхилення та дисперсія. До відносних характеристик варіації належать різноманітні коефіцієнти, найбільш поширене використання серед яких мають коефіцієнти варіації, що побудовані на відношенні абсолютних характеристик з середньою арифметичною. Кожна з названих характеристик має певні аналітичні переваги під час вирішення тих чи інших завдань статистичного аналізу.

Методика обчислення характеристик варіації залежить від виду ознаки Х та наявних даних (первинні чи похідні, згруповані чи ні).

Розмах варіації – різниця між найбільшим і найменшим значеннями ознаки, розраховується за формулою:

R = X max – X min,

(3.14)

де X max – максимальне значення ознаки X min – мінімальне значення ознаки.

Розмах варіації характеризує межі, в яких змінюється кількісне значення ознаки. Цей показник встановлює крайні числові значення варіант, що складають досліджувану сукупність.

В інтервальному ряду розподілу розмах варіації визначають як різницю між верхньою межею останнього інтервалу та нижньою межею першого. Проте, якщо інтервал відкритий, для обчислення розмаху варіації використовується середина інтервалу. Звичайно, спочатку інтервал має бути закритим згідно з відповідними правилами.

Крім розмаху варіації, у практиці статистичного аналізу широко застосовують інші абсолютні характеристики варіації, що ґрунтуються на відхиленнях індивідуальних значень ознаки від середньої арифметичної.

Оскільки відповідно до першої властивості середньої арифметичної( Х і Х) = 0, то при розрахунку такого роду характеристик використовують або модулі, або квадрати відхилень. У результаті маємо такі характеристики варіації: середнє лінійне відхилення, середнє квадратичне відхилення та дисперсію. Розрахункові формули цих показників наведені в табл. 3.6.

Якщо статистична сукупність надана у вигляді інтервального варіаційного ряду, то для розрахунку показників варіації використовуються розрахункові формули за зваженою формою. При цьому замість індивідуального значення ознаки обирається середина відповідного інтервалу.

Середнє лінійне відхилення являє собою середню відстань між середньою арифметичною величиною та відповідними індивідуальними значеннями

150

151

окремих ознак, а це завжди додатна величина. Саме тому у формулах відхилення кожної варіанти від середньої арифметичної береться за модулем.

Дисперсія являє собою середній квадрат відхилень і пов’язана з середнім квадратичним відхиленням таким співвідношенням:

 

 

 

 

,

 

 

2

 

D

(3.15)

де – середнє квадратичне відхилення D = 2 – дисперсія.

Таблиця 3.6.

Показники варіації та формули для їх розрахунку

Назва показника

 

 

 

Розрахункова формула

 

 

 

 

 

 

Проста форма

Зважена форма

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

Середнє лінійне

 

 

x

 

 

 

 

 

x

fi

l

 

 

l

відхилення

 

 

n

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

x f

 

 

 

 

x x

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

i

Середнє

 

i

 

 

 

 

 

 

2

 

 

2

 

 

 

fi

квадратичне

 

 

n

 

 

відхилення

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 (xi

 

 

 

 

2 (xi

 

 

 

 

 

 

 

 

 

 

x)2 fi

Дисперсія

x)2

 

 

 

 

n

 

 

 

 

 

fi

хі – індивідуальні значення окремої ознаки, варіанти х– середня арифметична (середнє значення ознаки) n – обсяг сукупності, кількість ознак у сукупності

fi частота відповідної ознаки.

Чим менше середнє відхилення, тим більш типова середня, тим більш однорідна сукупність. Середнє квадратичне відхилення також пов’язане з середнім лінійним відхиленням. За правилом мажорантності середніх > l . Якщо обсяг сукупності досить великий і розподіл ознаки наближається до нормального, то між середнім квадратичним та середнім лінійним відхиленнями існує такий взаємозв’язок:

= 1,25

 

,

 

l= 0,8 .

 

l

або

(3.16)

Для нормального розподілу варіативної ознаки справедливе також

твердження, що R = 6 . Значення ознаки в межах (

 

 

) мають 68,3 %

х

обсягу сукупності, у межах ( х 2 ) – 95,4 %, а в межах ( х 3 ) – 99,7 %. Це відоме “правило трьох сигм”.

При порівнянні варіації різних ознак використовуються відносні характеристики: коефіцієнти варіації. До них належать:

лінійний коефіцієнт варіації, який обчислюється за формулою:

151

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

152

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

V

 

 

 

 

 

V

 

 

 

 

 

,

або

 

 

l

 

 

 

·100 %,

(3.17)

 

 

 

 

 

 

 

x

 

 

 

 

 

 

l

 

 

l

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де l – середнє лінійне відхилення х – середня арифметична;

квадратичний коефіцієнт варіації, який обчислюється за

формулою:

 

 

 

 

 

 

 

 

 

V

 

 

 

, або

V

x ·100 %,

(3.18)

x

де – середнє квадратичне відхилення

 

коефіцієнт осциляції, який обчислюється за формулою:

 

V

R

, або

V

R

(3.19)

 

 

 

 

 

R

 

x

R

 

x ·100 %,

де R – розмах варіації.

Чим менше середнє відхилення, тим більш типова середня, тим більш однорідна сукупність. Найчастіше квадратичний коефіцієнт варіації використовують як критерій однорідності сукупності. У симетричному, близькому до нормального, розподілі Vσ = 0,33.

Розрізняють такі значення відносних коливань:

Vσ < 10% - незначне коливання, сукупність однорідна, значення середньої є типовим рівнем ознаки в даній сукупності;

10 % ≤ Vσ ≤ 33% - середнє коливання, сукупність в межах однорідності, значення середньої можна вважати типовим рівнем ознаки в даній сукупності;

Vσ > 33% - високий рівень варіації, сукупність неоднорідна, значення середньої неможна вважати типовим рівнем ознаки в даній сукупності.

Характеристики форми розподілу: коефіцієнти асиметрії та ексцесу

Різноманітність статистичних сукупностей – передумова різних форм співвідношення частот і значень варіативної ознаки. За своєю формою роз-поділи поділяються на одновершинні та багатовершинні (коли розподіл має дві, три та більше вершин). Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній груп з різними рівнями ознаки. У такому разі необхідно більш ретельно проаналізувати наявну вихідну інформацію, перегрупувати дані, виділивши однорідні групи. Розподіли якісно однорідних сукупностей, як правило, одновершинні. Серед одновершинних розподілів є симетричні та асиметричні (скошені), гостровершинні та плосковершинні.

У симетричному розподілі рівновіддалені від центра значення ознаки мають однакові частоти, при цьому середня, мода та медіана мають однакові значення x = Мо = Ме в асиметричному – вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена вліво, то це правостороння асиметрія. У цьому

152