Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Посібник-Практичні заняття-стат 2012

.pdf
Скачиваний:
175
Добавлен:
04.03.2016
Размер:
2.56 Mб
Скачать

217

Номер

Тривалість

Добова

 

 

 

 

путівки

відпочинку,

вартість

ху

х2

у2

 

х

путівки, у

 

 

 

y

1

5

78

 

 

 

 

2

14

55

 

 

 

 

3

7

95

 

 

 

 

4

18

30

 

 

 

 

5

14

53

 

 

 

 

6

20

26

 

 

 

 

7

7

85

 

 

 

 

8

15

50

 

 

 

 

Разом

100

472

 

 

 

 

Задача 5

Дані про споживання картоплі в сім’ях робітників та службовців з різним рівнем середньодушового сукупного доходу наведено у таблиці:

Рівень

Кількість

Споживання картоплі в середньому на

середньодушового

сімей

 

 

члена сім ї за рік, кг

 

сукупного доходу

 

 

 

 

 

 

 

 

 

 

 

 

 

Низький

10

64

70

79

84

82

69

76

78

75

73

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

91

96

84

95

98

94

92

88

Середній

26

83

97

93

100

93

79

81

86

94

90

82

 

85

80

93

87

89

 

 

 

 

 

98

92

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Високий

14

99

106

108

 

103

104

107

102

105

98

112

109

110

100

107

 

 

 

 

 

 

 

 

 

 

 

 

 

Визначити групові дисперсії, середню з групових дисперсій, загальну та міжгрупову дисперсії, показати взаємозв’язок між дисперсіями, оцінити наявність зв’язку між факторною та результативною ознаками за емпіричним кореляційним відношенням. Зробити висновки.

Задача 6

За даними вибіркового обстеження заробітної плати працівників бюджетної сфери одержано показники, наведені у таблиці.

 

Середня заробітна

Чисельність

Дисперсія

Галузь

заробітної

плата, грн.

працівників

плати

 

 

 

 

Охорона здоров’я

1200

80

4000

 

 

 

 

Освіта

1800

120

16000

217

218

Визначити середню заробітну плату працівників по сукупності галузей; обчислити середню з групових (галузевих) дисперсій; визначити міжгрупову (міжгалузеву) дисперсію; загальну дисперсію, оцінити наявність зв’язку між факторною та результативною ознаками за емпіричним кореляційним відношенням. Зробити висновки.

Задача 7

За даними обстеження витрати часу жінок на домашню роботу такі:

Тип помешкання

Чисельність

Середні витрати

Групова

 

жінок, тис.

часу на

дисперсія

 

чол.

домашню

витрат часу

 

 

роботу, год.

 

Індивідуальна квартира

50

6,2

0,01

Приватний будинок

40

7,0

0,04

Щоб проаналізувати, чи існує взаємозв’язок між типом помешкання та витратами часу на домашню роботу, визначте міжгрупову, середню з групових дисперсії витрат часу жінок на домашню роботу. Поясніть зміст кожної дисперсії та зробіть загальний висновок про щільність зв’язку між типом помешкання та витратами часу на домашню роботу.

Приклади розв’язання типових задач

Приклад 1

На основі даних, наведених у табл. встановити наявність кореляційного зв’язку, визначити лінію регресії за лінійною моделлю. Оцінити істотність і щільність зв’язку.

Залежність між факторною (х) та результативною (у) ознаками

х

2

3,5

4,

5,2

6,3

7,1

8,4

9,5

 

 

 

 

 

 

 

 

 

у

26,4

26,9

27,3

27,7

28,1

28,4

29,1

29,4

 

 

 

 

 

 

 

 

 

Розв’язання:

Математично лінійний зв’язок у загальному вигляді записується рівнянням:

Y = a + bx,

де Y – результативна ознака,

а – параметр рівняння, який характеризує початковий рівень;

b – параметр рівняння, який характеризує середній абсолютний приріст;

х – факторна ознака.

218

y na b xxy a x b x2 .

219

Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого – мінімізація суми квадратів відхилень емпіричних значень (y) від теоретичних Y:

y Y 2 min,

де у – емпіричні значення результативної ознаки; Y – теоретичні значення результативної ознаки.

Математично доведено, що значення параметрів a та b, при яких мінімізується сума квадратів відхилень, визначаються із системи нормальних рівнянь:

Розв’язавши цю систему, знаходимо такі значення параметрів:

n xy x y

a y bx.

b n x2 x x;

Для визначення параметрів лінійного рівняння складемо допоміжну таблицю.

Допоміжна таблиця для розрахунку параметрів лінійної моделі

і

х

у

ху

х2

1

2

26,4

52,8

4

 

 

 

 

 

2

3,5

26,9

94,15

12,25

 

 

 

 

 

3

4

27,3

109,2

16

 

 

 

 

 

4

5,2

27,7

144,04

27,04

 

 

 

 

 

5

6,3

28,1

177,03

39,69

 

 

 

 

 

6

7,1

28,4

201,64

50,41

 

 

 

 

 

7

8,4

29,1

244,44

70,56

 

 

 

 

 

8

9,5

29,4

279,3

90,25

 

 

 

 

 

Разом

46

223,3

1302,6

310,2

 

 

 

 

 

Використовуючи дані наведеної таблиці, знаходимо параметри

лінійного рівняння:

b 8 1302,6 46 223, 8 310,2 46 46 = 0,408

a y bx= 223,3 / 8 – 0,408 × 46 / 8 = 25,57.

Таким чином, лінія регресії має вигляд: у = 25,57 + 0,408 х.

219

220

Тобто, при зміні факторної ознаки х на одиницю результативна ознака у зросте на 0,408.

Для оцінки істотності та щільності лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона) r:

r xy nxy, n x2 2у

де х2 х2 х2 – факторна дисперсія;у2 у2 у2 – загальна дисперсія.

х– середнє значення факторної ознаки;

у– середнє значення результативної ознаки;

n – кількість пар ознак.

Для обчислення коефіцієнта кореляції Пірсона складемо допоміжну таблицю.

Допоміжна таблиця для обчислення коефіцієнта кореляції Пірсона

і

х

у

ху

х2

у2

1

2

26,4

52,8

4

696,96

2

3,5

26,9

94,15

12,25

723,61

3

4

27,3

109,2

16

745,29

4

5,2

27,7

144,04

27,04

767,29

5

6,3

28,1

177,03

39,69

789,61

6

7,1

28,4

201,64

50,41

806,56

7

8,4

29,1

244,44

70,56

846,81

8

9,5

29,4

279,3

90,25

864,36

Разом

46

223,3

1 302,6

310,2

6 240,49

 

 

 

 

 

 

Тоді:

 

х2

 

 

 

х2= 310,2 / 8 – (46 / 8) 2 = 5,7125;

 

х2

у2

 

 

 

у2 = 6 240,49 / 8 – (223,3 / 8) 2 = 0,9536.

у2

 

xy n

 

 

 

 

1302,6

8 (46/8) (223,/8)

= 0,997.

r

xy=

 

n x2 2у

 

8 5,71250,9536

 

Для n = 8, rкр = 0,71. Оскільки розраховане значення коефіцієнта кореляції Пірсона більше за його критичне значення, то зв’язок є істотним.

Коефіцієнт кореляції Пірсона набуває значень у межах 1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про обернений.

220

221

Відповідь: лінія регресії має вигляд: у = 25,57 + 0,408∙ х; лінійний коефіцієнт кореляції Пірсона r = 0,997 свідчить про щільний прямий зв’язок.

Приклад 2

Дані про споживання м’яса та м’ясопродуктів у домогосподарствах з різним рівнем середньодушового сукупного доходу наведено у таблиці:

Рівень середньодушового

Кількість

Споживання м’яса в середньому

сукупного доходу

сімей

 

на члена сім ї за рік, кг

 

 

 

 

 

Низький

6

48, 62, 40, 52, 50, 36

 

 

 

 

 

 

 

 

 

 

 

Середній

10

91

96

84

95

98

94

92

89

98

92

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Високий

4

100

112

108

110

 

 

 

 

 

 

 

 

 

 

 

Встановити взаємозв’язок та оцінити його істотність і щільність за допомогою методу аналітичного групування.

Розв’язання:

Розрахуємо середні величини в кожній групі за формулою середньої арифметичної простої:

Х1 nхі = (48 + 62 + 40 + 52 + 50 + 36) / 6 = 48;

Х2 nхі = (91 + 96 + 84 + 95 + 98 + 94 + 92 + 89 + 98 + 92) / 10 = 84,6;

Х3 nхі = (100 + 112 + 108 + 110) / 4 = 107,5.

Загальну середню для всієї сукупності обчислимо за формулою середньої арифметичної зваженої, де в якості окремих ознак беруться середні кожної групи, а частотами є обсяги відповідних груп:

Х Хi fi = (48 × 6 + 84,6 × 10 + 107,5 × 4) / 20 = 78,2.

fi

Визначаємо групові дисперсії за формулою:

2 (хi x)2 . n

Тоді: 12= (48 – 48)2 + (62 – 48)2 + (40 – 48)2 + (52 – 48)2 + (50 – 48)2 + + (36 – 48)2 / 6 ≈ 70,67;

221

222

22= (91 – 84,6)2 + (96 – 84,6)2 + (84 – 84,6)2 + (95 – 84,6)2 + (98 – 84,6)2 +

+ (94 – 84,6)2 + (92 – 84,6)2 + (89 – 84,6)2 + (98 – 84,6)2 + (92 – 84,6)2 / 10 = 85,58;

32= (100 – 107,5)2 + (112 – 107,5)2 + (108 – 107,5)2 + (110 – 107,5)2 / 4 = = 20,75.

Середню з групових дисперсій розрахуємо за формулою:

i2 fi

i2 = (70,67 × 6 + 85,58 × 10 + 20,75 × 4) / 20 = 68,14.

fi

Міжгрупову дисперсію обчислимо за формулою:

2 (Xi X)2 fi

fi

2 (48 – 78,2)2 × 6 + (84,6 – 78,2)2 ×10 + (107,5 – 78,2)2 × 4 / 20 = 465,79.

Використовуючи

правило складання дисперсій

2 2 2

,

 

 

в

 

визначимо загальну дисперсію:

 

 

2 = 465,79 +

68,14 = 533,93.

 

 

Обчислимо кореляційне відношення:

2 2 = 465,79 / 533,93 = 0,872.

2

Критичне значення кореляційного відношення для обсягу сукупності 20 одиниць та трьох груп дорівнює 0,318.

Відповідь: Оскільки розраховане кореляційне відношення більше за його критичне значення, між рівнем середньодушового доходу та споживанням м’яса існує прямий щільний зв’язок.

Бібліографічний список до практичного заняття: [5 - 11, 15 - 20]

222

223

Практичні заняття до теми 11: Вибірковий метод спостереження

Мета: Закріпити теоретичні знання та виробити практичні навички щодо обчислення помилок вибірки і визначенню меж довірчого інтервалу для середньої величини та частки; визначення необхідної чисельності вибірки.

План заняття

4.Оцінювання точності вибіркових даних. Розрахунок стандартної похибки вибірки і побудова довірчих меж для середньої і частки

5.Визначення мінімально достатнього обсягу вибірки

МЕТОДИЧНІ РЕКОМЕНДАЦІЇ

Вибірковий метод - це система наукових принципів випадкового відбору певної частини сукупності, яка представляла б усю сукупність і характеристики якої слугували б надійною основою статистичного висновку. Сукупність, з якої відбираються елементи для обстеження, називають генеральною, а сукупність, яку безпосередньо обстежують, -

вибірковою.

Основні переваги вибіркового спостереження:

Економічність, при його проведенні забезпечується економія матеріальних, трудових, фінансових ресурсів, часу.

Можливість дослідження частини сукупності за умови неможливості спостереження за усією сукупністю.

Досягнення більш точних результатів.

Практика використання вибіркового спостереження:

Вивчення певного кола соціально-економічних явищ.

Перевірка якості продукції.

Контроль результатів суцільного спостереження.

Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності. Оскільки вибіркова сукупність не точно відтворює структуру генеральної, то вибіркові оцінки також не збігаються з характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності. За причинами виникнення похибки поділяються на

систематичні (тенденційні) та випадкові. Систематичні похибки

223

224

виникають за умови, що під час формування вибіркової сукупності порушується принцип випадковості відбору (упереджений відбір елементів, недосконала основа вибірки тощо). Випадкові похибки - це наслідок випадковості відбору елементів сукупності для обстеження.

При організації вибіркового обстеження важливо запобігти виникненню систематичних похибок. Що стосується випадкових похибок, то уникнути їх неможливо, проте на основі теорії вибіркового методу можна визначити їх розмір і по можливості регулювати.

Оцінювання точності вибіркових даних.

Розрахунок стандартної похибки вибірки і побудова довірчих меж для середньої і частки

У практиці вибіркових спостережень використовують два види вибіркових оцінок - точкові та інтервальні. Точкова оцінка - це значення

параметра за даними вибірки: вибіркова середня x або вибіркова частка р. Інтервальна оцінка - це інтервал значень параметра, розрахований за даними вибірки для певної імовірності, тобто довірчий інтервал. Чим він менший, тим точніша вибіркова оцінка. Межі його визначаються на

основі точкової оцінки та граничної похибки вибірки Δ=t μ:

для середньої :

 

 

 

 

 

 

 

 

 

 

x - t μ ≤

x

0

x + t μ;

(3.109)

для частки:

 

p - t μ ≤ d0 ≥ p + t μ,

(3.110)

де μ — середня, або стандартна похибка вибірки; t - квантиль розподілу

імовірностей (довірче число); x0 та d0 — середня та частка генеральної сукупності.

Для забезпечення репрезентативності відбору одиниць із генеральної сукупності у вибіркову використовують різні способи відбору [ 5, тема 11]. Кожному способу відбору одиниць сукупності відповідає певна формула розрахунку граничних похибок.

Гранична похибка вибірки - це максимально можлива похибка для прийнятої імовірності F(x). Довірче число t вказує, як співвідносяться гранична та стандартна похибки – дивіться таблицю 3.13. Коефіцієнт довіри визначається в залежності від того, з якою довірчою вірогідністю потрібно гарантувати результати вибіркового обстеження та від чисельності одиниць відбору. На практиці для визначення t користуються таблицями Стьюдента, які наведені в підручниках з математичної статистики.

 

 

Таблиця 3.13

Дані для визначення коефіцієнта довіри

 

 

 

Імовірність F(x)

Коефіцієнт довіри t

Величина помилки

224

225

 

 

вибіркової середньої

0,683

1

1 .

0,954

2

2 .

0,997

3

3 .

0,999

4

4 .

У таблиці 3.14 наведено формули для розрахунку граничної помилки для середньої, а у таблиці 3.15 - для розрахунку граничної помилки для частки.

У таблицях 3.14 та 3.15 використовуються такі умовні позначення: n - число обстежених одиниць вибіркової сукупності;

N - число одиниць генеральної сукупності;

t - коефіцієнт довіри (довірче число) в залежності від рівня імовірності; r - кількість відібраних серій;

R - кількість серій в усій ( генеральній ) сукупності;i2 - середня з внутрішньо групових дисперсій;

W (1-W) - дисперсія частки одиниць, що володіють цією ознакою у вибірковій сукупності – дисперсія альтернативних ознак.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 3.14

 

 

Формули розрахунку граничної помилки для середнеьої

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Спосіб відбору

 

 

 

 

 

 

 

 

 

 

 

Метод відбору

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Повторний

 

 

Безповторний

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Випадковий

 

x t

2

 

 

 

 

 

 

 

x t

2

(1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

n

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Типовий

 

 

 

 

 

i2

 

 

 

 

 

 

 

 

 

i2

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

x t

 

 

n

 

 

x t

 

 

n

(1 N)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Серійний

 

i2

 

 

x i (1

)

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

r

 

 

 

 

 

r

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 3.15

 

 

Формули розрахунку граничної помилки для частки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Спосіб відбору

 

 

 

 

 

 

 

 

 

 

 

 

 

Метод відбору

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Повторний

 

 

Безповторний

 

 

 

 

 

 

 

 

Випадковий та

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w t

 

w(1 w)

 

 

w t

 

 

w(1 w)(1

 

n

)

 

 

типовий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Серійний

 

w t

 

w(1 w)

 

 

 

w t

 

 

w(1 w)

(1

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

r

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

225

226

Фактори, від яких залежить розмір граничної похибки вибірки:

варіація ознаки, σ02; обсяг вибірки, n; частка вибірки в генеральній сукупності, n/N;

заданий рівень імовірності, якому відповідає квантиль (довірче число) t.

При порівнянні точності вибіркових оцінок використовують відносну похибку вибірки Vμ, яка показує, на скільки процентів вибіркова оцінка відхиляється від параметра генеральної сукупності:

 

 

 

 

 

Vμ =

x 100, %.

(3.111)

 

 

 

 

x

 

Визначення мінімально достатнього обсягу вибірки

Будь-яке дослідження, незалежно від його мети (отримання наукових теоретичних результатів чи практичних рекомендацій) повинно бути перш за все правильно організоване. Безумовно, не завжди є можливість вивчити всі одиниці сукупності.

Чисельність відбору залежить від таких факторів:

-від показників варіації досліджуваної ознаки: чим більший показник варіації, тим потрібна більша чисельність вибірки;

-від розміру граничної помилки репрезентативності: чим менший розмір граничної помилки репрезентативності, тим більшою має бути кількість вибірки. Є таке правило: якщо треба зменшити помилку вибірки в 3 рази, чисельність відбору збільшується у 9 разів;

-від розміру імовірності, з якою треба гарантувати результати відбору, що в свою чергу, пов’язано з показниками кратності помилки (t). Чим більша імовірність (Р), тобто чим більший показник кратності помилки (t), тим більшою має бути чисельність вибірки (n);

-від способу відбору одиниць для обстеження.

Зформул визначення середньої помилки власне випадкової вибірки можна вивести формули для потрібної чисельності вибірки - таблиця 3.16.

 

 

 

 

Таблиця 3.16

 

Визначення чисельності вибірки

 

 

 

 

 

 

 

 

 

 

Категорії

Повторна вибірка

Безповторна вибірка

показників

 

 

 

 

 

 

При визначенні

n t2 2

n

2

2

 

середнього розміру

 

Nt

 

x2

 

 

 

 

досліджуваної

 

 

N 2 t2 2

ознаки

 

 

 

x

 

 

226