Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

readmsg

.pdf
Скачиваний:
46
Добавлен:
12.02.2016
Размер:
1.48 Mб
Скачать

σз = σз2 = 1,2021 =1,096 грн.

Таким чином ми визначили, що середня годинна заробітна плата групи робітників в кількості десяти чоловік склала 7,57 грн., при середньому квадратичному відхиленні 1,096 грн.

При цьому можемо стверджувати, що якщо загальна дисперсія склала 1,2021, то міжгрупова дисперсія в розмірі 1,1025 викликана різницями кваліфікації в групах робітників, а середня внутрішньогрупова дисперсія в розмірі 0,0996 показує частку впливу інших, крім покладеного в основу групування, чинників. Правило додавання дисперсій дозволяє визначити частку складових частин в загальній дисперсії.

Поділивши міжгрупову дисперсію на загальну дисперсію отримаємо показник, який називається коефіцієнтом детермінації і показує, яка частка всієї варіації ознаки, зумовлена ознакою, покладеною в основу групування. В нашому прикладі:

η

2

=

δ 2

=

1,1025

 

= 0,917 або 91,7 %,

 

σ з2

 

 

 

 

1,2021

 

 

 

 

 

де: η2 – (грецька буква «ета» в квадраті) – коефіцієнт детермінації.

Значить, фактор кваліфікації робітників на 91,7 % зумовлює варіацію їхньої середньогодинної заробітної плати.

Корінь квадратний з коефіцієнта детермінації називають емпіричним кореляційним відношенням, яке показує тісноту (силу) зв’язку між групувальною та результативною ознаками.

η =

δ 2

= 0,917 = 0,958.

σ 2

 

 

 

з

 

Це говорить про те, що зв'язок між кваліфікацією робітників і їхньою середньогодинною заробітною платою дуже сильний (тісний).

71

ЛЕКЦІЯ 5. РЯДИ РОЗПОДІЛУ

ПЛАН:

5.1.Поняття про ряди розподілу, їх види.

5.2.Форми рядів розподілу та їх характеристика.

5.3.Криві розподілу та способи перевірки гіпотез.

5.4.Графічне зображення рядів розподілу.

5.1.Поняття про ряди розподілу, їх види

Врезультаті статистичного групування отримують ряди цифрових показників, які характеризують розподіл одиниць досліджуваної сукупності за варіаційною ознакою. Такі ряди називаються рядами розподілу.

Ряд розподілу складається з двох елементів – варіантів та частот. Варіанти «Х» – це окремі значення групувальної ознаки, які розташовані в певній послідовності. Частоти «f» – це числа, які показують, скільки разів певне значення ознаки зустрічається у сукупності, або скільки одиниць сукупності припадає на кожну групу.

Ряди розподілу відіграють важливу роль при вивченні складу сукупності за досліджуваною ознакою, закономірностей розподілу, використовуються при визначенні середніх величин, показників варіації, взаємозв’язку та ін.

Взалежності від характеру групувальної ознаки ряди розподілу поділяються на атрибутивні та варіаційні (кількісні).

Ватрибутивних рядах розподілу варіанти не мають чисельного виразу. Варіаційні ряди, в яких варіанти мають числовий вираз, поділяються на

дискретні та інтервальні. В дискретних рядах варіанти являють собою дискретні числа, в інтервальних – це інтервали групування.

В тому випадку, коли виконуються групування за двома і більше ознаками отримують комбінаційний ряд розподілу.

При побудові атрибутивних рядів розподілу варіанти потрібно розташувати в логічній послідовності. При використанні дискретних та інтервальних варіаційних рядів варіанти записують в порядку зростання. Для інтервальних рядів важливим чітке розмежування варіант.

72

Розрізняють ряди розподілу з абсолютними, відносними та нагромадженими частотами. Нагромаджені частоти ще називають кумулятивними. В першому випадку чистоти являють собою абсолютні числа, в другому – питому вагу або частку кожної групи.

Ряди розподілу з абсолютними частотами характеризують склад сукупності, а з відносними – структуру сукупності.

Ряди розподілу з нагромадженими (кумулятивними) частотами показують, яка чисельність або питома вага одиниць має значення ознаки менше за дане. Кумулятивні частоти знаходять шляхом їх сумування по групах.

Щільність розподілу – це кількість одиниць сукупності, що припадає на одиницю ширини інтервалу групувальної ознаки. Розрізняють абсолютну щільність і відносну:

 

fda =

f

;

fdв =

р

,

 

i

і

 

 

 

 

 

де f – частота;

р – частка (доля);

 

 

 

і– величина (розмір) інтервалу.

Приклад 1

Маємо наступні дані про розподіл сімей за місячним доходом:

Місячний дохід на

Число сімей

Щільність розподілу

одного члена сім'ї,

одиниць

%

число сімей

%

грн.

 

 

 

 

До 200,0

34

13,2

0,17

0,066

200,0

– 400,0

52

20,2

0,26

0,101

400,0

– 600,0

72

27,9

0,36

0,140

600,0 – 1000,0

70

27,1

0,18

0,068

1000,0

– 1500,0

30

11,6

0,06

0,023

Разом:

258

100,0

х

х

Отже, найбільшу щільність розподілу має третя група сімей з доходом 400,0 – 600,0 грн. на одного члена сім'ї.

Інтерполяція в рядах розподілу визначає, скільки одиниць сукупності (або процентів) мають значення ознаки менше за завдане. Для інтерполяції використовують як абсолютні так і відносні нагромаджені частоти.

73

 

 

 

 

 

 

Приклад 2

 

 

Маємо наступні дані про розподіл сімей за місячним доходом:

 

 

 

Нагромаджені частоти

 

 

Місячний дохід на одного

 

 

члена сім'ї, грн.

число сімей

 

%

 

 

До 200,0

34

 

13,0

 

2000

– 4000

86

 

33,4

 

4000

– 6000

158

 

61,3

 

 

6000 – 10000

228

 

88,4

 

10000

– 15000

258

 

100,0

 

Визначити: а) скільки

сімей мають дохід менше

5000 грн. на одного члена

сім'ї.

 

 

 

 

 

 

 

 

 

Розрахунок:

 

 

4000

 

5000

 

6000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

86

?

158

fx <5000 =86 + 0,5(158 86) =122 сім'ї, або fx <5000 =33,4 + 0,5(61,3 33,4) = 47,4% .

б) скільки сімей мають дохід менше 7300 грн. на одного члені сім'ї.

f x < 7300 =158 + 7300 6000 (228 158) =181 сім'я. 4000

fx < 7300 = 61,3 + 0,325 (88,4 61,3) = 70,1% .

З допомогою інтерполяції визначають менше якого значення мають ознаку певна кількість (питома вага) одиниць сукупності. Наприклад, менше якого мають дохід 50 %, або 129 сімей.

Розрахунок: хf =50% = 4000 + 50,0 33,4 (6000 4000) =5200 грн. 61,3 33,4

Отже, половина сімей має дохід менше 5200 грн. на одного члена сім'ї.

5.2. Форми рядів розподілу, та їх характеристика

Різноманітність статистичних сукупностей – передумова різних форм співвідношення частот і значень варіюючої ознаки. За своєю формою розподіли поділяють на такі види: одно-, дво і багатовершинні. Наявність двох і більше

74

вершин свідчить про неоднорідність сукупності, про поєднання в ній груп з різними рівнями ознаки. Розподіли якісно однорідних сукупностей, як правило, одновершинні. Серед одновершинних розподілів є симетричні (скошені), гостро- і плосковершинні.

а)

f

A=0

0

 

= Мо = Ме

x

х

б)

f

0

М01 М02

М03 x

в)

f

А<0

0

х

Ме М0

x

- лівостороння (асиметрія)

 

75

г)

f

А > 0

0

М0 Ме

х

х

- правостороння (асиметрія)

д)

f

Е >3

E=3

0

x

- гостровершинний (ексцес)

е)

f

 

Е=3

 

E< 3

0

x

 

- плосковершинний (ексцес)

Мал. 1. Різновиди форм розподілу

76

У симетричному розподілі рівновіддалені від центру значення ознаки мають однакові частоти, в асиметричному – вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщені вліво, то це правостороння асиметрія, і навпаки. Асиметрія виникає внаслідок обмеженої варіації в одному напряму або під впливом домінуючої причини розвитку, яка веде до зміщення центру розподілу.

Найпростішою мірою асиметрії є відхилення між середньою арифметичною і медіаною чи модою. В симетричному розподілі характеристики центру мають однакові значення Х = Ме = М0 ; в асиметричному між ними існують певні розбіжності. При правосторонній асиметрії Х > Ме > М0 , при лівосторонній асиметрії, навпаки, Х < Ме < М0 .

Стандартизовані відхилення A =

X

M e

, або

A =

X

M 0

, характеризують

 

 

 

σ

 

 

σ

 

 

 

напрям і міру скошеності розподілу. В симетричному розподілі А=0, при правосторонній асиметрії А>0, при лівосторонній А<0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приклад 3

 

 

 

 

Маємо такі дані про розподіл посівної площі господарств району за

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

урожайністю гречки

 

 

 

 

 

 

Урожайність

 

 

 

Посівна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гречки, ц/га.

 

 

 

 

площа,

 

x

 

xf

 

 

х-

х

 

 

 

 

(х-

х

)2

(х-

х

)2f

 

 

 

 

 

 

 

 

 

 

 

га. (f)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10-12

 

 

 

 

 

 

17

 

11

 

187

 

 

-3,9

 

 

 

15,21

258,57

12-14

 

 

 

 

 

 

20

 

13

 

260

 

 

-1,9

 

 

 

3,61

72,20

14-16

 

 

 

 

 

 

27

 

15

 

405

 

 

0,1

 

 

 

 

0,01

0,27

16-18

 

 

 

 

 

 

23

 

17

 

391

 

 

2,1

 

 

 

 

4,41

101,43

18-20

 

 

 

 

 

 

13

 

19

 

247

 

 

4,1

 

 

 

 

16,81

218,53

Разом:

 

 

 

 

100

 

х

 

1490

 

 

 

х

 

 

 

х

651,00

 

 

 

хf =

1490

 

 

 

 

(x

 

)2 f

=

651

 

 

 

 

 

 

 

 

 

 

=

 

=14,9 ц/га;

σ 2 =

x

= 6,51;

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

100

 

f

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

σ =

 

σ 2

=

 

 

6,51 = 2,55 ц/га;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M 0 = xm0 +i

 

 

 

 

 

 

f 2

f1

 

=14 +2

 

27 20

 

=15,27

ц/га.

 

 

 

(f 2 f1 )+(f 2 f3 )

(27 20)+(27 23)

 

 

 

 

 

 

 

M

 

 

 

 

14,9 15,27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A =

x

0

 

 

=

= −0,145 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

2,55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

77

Стандартизоване відхилення свідчить про дуже незначну лівосторонню асиметрію, а тому розподіл можна вважати симетричним.

Гостровершинність розподілу відображає скупченість значень ознаки навколо середньої величини і називається ексцесом. На практиці часто в одному розподілі поєднуються всі названі особливості: одновершинний розподіл може бути симетричним і гостровершинним або скошеним і плосковершинним.

Як узагальнюючі характеристики розподілу використовують моменти. За допомогою невеликого їх числа можна описати будь-який розподіл. Момент розподілу – це середня арифметична k-го ступеня відхилень х-А.

Залежно від величини «А» моменти поділяють на первинні А=0, центральні

А= х і умовні А=const. Ступінь «k» визначає порядок моменту. На практиці використовуються:

Початкові моменти:

нульового порядку (k=0)

М0

=

 

х0 f

=1;

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

першого порядку (k=1)

М1

=

х1 f

=

 

 

 

;

 

 

x

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х2 f

 

 

=

 

 

другого порядку (k=2)

М2

=

 

 

 

 

x 2

;

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х3 f

 

 

 

третього порядку (k=3)

М3

=

 

 

 

=

x3

;

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

четвертого порядку (k=4)

М4

 

 

х4 f

 

 

 

=

 

 

 

=

x 4

.

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

Початкові моменти відносно «х0»(умовні):

нульового порядку М0′ = (хх0 )0 f =1 ;

f

першого порядку М1′ = (хх0 )1 f = x х0 ;

f

другого порядку

М2

=

(хх0 )2

f

;

f

 

 

 

 

 

 

78

третього порядку

М3

=

 

(хх0 )3

f

;

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

четвертого порядку

М4

=

 

(хх0 )4

f

 

.

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Центральні моменти:

 

 

 

 

 

 

(х

 

 

 

 

 

 

 

)0 f

 

 

 

 

 

нульового порядку

µ0

=

 

 

 

х

=1;

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

(х

 

 

 

 

) f

= 0; µ1 =

хf

 

f

 

першого порядку

µ1 =

х

x

= 0 ;

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

(х

 

 

 

 

)2 f

 

 

 

 

 

другого порядку

µ2

=

 

 

х

=σ 2 ;

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

(х

 

 

)3 f

 

 

 

 

 

 

 

третього порядку

µ3

=

х

;

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

(х

 

)4 f .

 

 

 

 

 

 

четвертого порядку

µ4

=

 

х

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

Первинний момент першого порядку – це середня арифметична « х», другого

– середній квадрат значень ознаки « х2 ». Центральний момент другого порядку характеризує варіацію µ2 =σ 2 , третього – асиметрію, четвертого – ексцес.

Для порівняння ступеня асиметрії різних розподілів, використовують стандартизований момент: А= σµ33 .

Вважають, що при А<0,25 асиметрія низька, якщо А не перевищує 0,5 – середня і при А>0,5 – висока.

Для вимірювання ексцесу використовують аналогічно побудований коефіцієнт, тобто стандартизований момент четвертого порядку: Е = σµ44 .

У симетричному розподілі Е=3, при гостровершинному – Е>3, плосковершинному Е<3.

Оцінка концентрації розподілу ґрунтується на порівнянні часток розподілу елементів сукупності «dj» та обсягу ознаки «хdj». Якщо розподіл рівномірний, dj= хdj. Значні відхилення хdj – dj свідчить про певну концентрацію елементів

79

сукупності. К =

1

 

 

хd j d j

 

. При рівномірному розподілі К=0, повній

 

 

2

 

 

 

 

 

 

концентрації К=1. «К» буде тим більший, чим більший ступінь концентрації.

5.3. Криві розподілу та способи перевірки гіпотез

Поглиблюючи аналіз, можна описати закономірність співвідношення варіантів і частот певною функцією, яку називають теоретичною кривою. Серед безлічі кривих розподілу найпоширенішою виявилась нормальна крива. Вона застосовується як стандарт, з яким порівнюють інші розподіли, а також відіграє значну роль при вирішенні завдань вибіркового, кореляційно-регресійного, факторного та інших статистичних методів.

Нормальний розподіл близький до інших одновершинних розподілів. Його часто використовують як перше наближення при моделюванні. Деякі розподіли, які не є нормальними, приводять до такого виду перетворенням змінної «х» на «lgx». Логарифмічною нормальною кривою можна описати низку асиметричних розподілів, передусім з правосторонньою асиметрією.

Частоти, які відповідають теоретичній кривій, називають теоретичними. Для нормального розподілу їх визначають за формулою: f ′ = ∑ f σi f (t),

де f (t)= 1

е

t2

 

2 .

2π

 

 

 

Інтегральна функція розподілу:

F(x) = 2

x

t2

; dt = 1

+x

t2

 

e

2

e

2 dt.

2π

0

 

 

2π

x

 

 

 

 

 

 

 

 

 

 

Функція « F(x) » табульована.

1 t2

Аналітично нормальний розподіл списується рівнянням: уt = σ 2π e 2 ,

де уt – ордината кривої нормального розподілу (частоти); t – нормоване відхилення, що дорівнює хσх;

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]