Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Посібник-Практичні заняття-стат 2012

.pdf
Скачиваний:
175
Добавлен:
04.03.2016
Размер:
2.56 Mб
Скачать

 

 

 

 

 

 

 

 

 

227

 

 

 

 

 

 

 

 

 

 

 

 

При визначенні

 

 

 

n

Nt2w(1 w)

частки

 

2

 

n

t w(1 w)

 

 

 

 

 

 

 

 

 

 

2

 

 

 

ознаки

 

2

 

 

 

 

 

 

N w

t w(1 w)

досліджуваної

 

 

w

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Розрахунок об'ємних показників генеральної сукупності на основі даних вибіркового спостереження називається у статистиці поширенням вибіркових характеристик на всю сукупність.

Є два способи такого поширення:

-спосіб прямого перерахунку, за якого середній розмір ознаки, визначений у результаті вибіркового обстеження, помножується на число одиниць генеральної сукупності;

-спосіб коефіцієнтів, за якого до даних суцільного обстеження вносяться відповідні поправки, відносний розмір яких визначається за результатами вибіркового обстеження.

Задачі для розв’язання

Задача 1

За даними 20%-ого вибіркового обстеження 100 сімей переселенців із зони жорсткого радіаційного контролю, число дітей становить:

Число дітей

0

1

2

3

4

5

Разом

 

 

 

 

 

 

 

 

Число сімей

8

32

28

19

10

3

100

 

 

 

 

 

 

 

 

Обчислити:

1) середнє число дітей у сім’ях переселенців та довірчий інтервал для середньої з імовірністю 0,954;

2) з такою самою імовірністю граничну помилку та довірчий інтервал для частки сімей, які мають троє і більше дітей.

Задача 2

За результатами контрольної перевірки податковими службами 400 бізнесових структур у 140 з них у податкових деклараціях не повністю вказані доходи, які підлягають оподаткуванню.

Визначте частку бізнесових структур, які приховують частину доходів від сплати податків, та довірчі межі частки з ймовірністю 0,954.

Чи погоджуються вибіркові дані з твердженням, що 40 % бізнесових структур не сплачують податків у повному обсязі?

227

228

Задача 3

Дані 20%-го вибіркового обстеження витрат населення області на побутові послуги наведено в таблиці.

Визначити :

1) для всієї обстеженої сукупності середні витрати на побутові послуги та із імовірністю 0,954 довірчий інтервал для середньої;

2) якою має бути вибіркова сукупність, щоб помилка вибірки з імовірністю 0,954 зменшилась в 1,3 рази.

Населений

Число

Витрати на одного члена

Дисперсія

пункт

обстежених сімей

сім’ї, грн. на місяць

витрат

Місто

36

110

380

Село

64

50

140

Задача 4

З метою визначення потенціалу споживчого ринку планується анкетування населення (одна квартира одна анкета).

Визначте мінімально необхідний обсяг вибірки (з імовірністю 0,954) щоб практична помилка для середньомісячного розміру покупки не перевищувала 5 грн. За даними пробних обстежень дисперсія середньомісячного розміру покупок становить 1875.

Задача 5

 

За даними опитування із 325 респондентів основними джерелами

інформації про ринок цінних паперів вважають:

 

Радіо та телебачення

170

Газети та журнали

90

Для кожного джерела інформації визначте його частку та відносну похибку вибірки з імовірністю 0,954.

Порівняйте похибки вибірки.

Задача 6

На лісовому масиві в 400 га передбачається визначити загальний запас деревини. Пробні площі становлять 0,1 га. За даними попередніх обстежень дисперсія виходу деревини з 0,1 га становила 6.

Скільки пробних площ необхідно обстежити, щоб похибка вибірки з імовірністю 0,954 не перевищила 0,5 м3?

Задача 7

Результати вибіркового опитування 400 мешканців міста з метою визначення їхньої думки відносно подальшої долі екологічно шкідливого об’єкта такі:

228

229

 

 

 

Захід щодо об’єкта

Число відповідей

 

 

 

 

Негайно закрити

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Перепрофілювати виробництво

 

120

 

 

 

 

 

іншої продукції

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Збудувати нові очисні споруди

 

80

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для кожної відповіді респондентів визначте відносну похибку

вибірки з імовірністю 0,954, порівняйте їх, зробіть висновки.

 

 

 

 

 

 

 

 

Задача 8

 

 

 

 

 

 

За результатами аналізу зольність вугілля, яке надійшло на

електростанцію, була така:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зольність, %

до 14

 

14-16

 

16-18

18-20

20 і більше

 

Разом

 

 

 

 

 

 

 

 

 

 

 

 

 

Кількість

8

 

17

 

36

25

14

 

100

 

проб

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Визначити:

1.Середню зольність вугілля та довірчий інтервал середньої з імовірністю 0,997.

2.Довірчий інтервал частки вугілля, зольність якого менша як 16%, з такою самою імовірністю.

Зробити висновок.

Задача 9

За даними 5%-го вибіркового обстеження верстати за строком служби розподілились так:

Строк служби,

до 4

4 - 8

8 - 12

12 і більше

Разом

років

 

 

 

 

 

Кількість верстатів

25

40

20

15

100

 

 

 

 

 

 

Обчислити:

1.Середній строк служби верстатів та довірчий інтервал середньої з імовірністю 0,954.

2.Граничну помилку і довірчий інтервал для частки верстатів, строк служби яких більш як 12 років, з такою самою імовірністю.

Зробити висновок.

Задача 10

Хімічний аналіз 10 партій молока дав такі показники кислотності (у

градусах Тернера): 18; 21; 17; 19; 20; 23; 16; 22; 23; 21.

229

~ X X
X min
2

230

Визначте:

а) середній рівень кислотності молока та граничну похибку вибірки для середньої з імовірністю 0,954;

б) частку молока що відповідає стандартові (не більше 210), та похибку вибірки для частки з імовірністю 0,954;

в) скільки партій молока необхідно перевірити, щоб похибка вибірки для частки нестандартного молока зменшилась у 2 рази?

Приклади розв’язання типових задач

Приклад 1

Під час безповторного вибіркового спостереження, яке проводилось в одній з крамниць продажу дешевого одягу, були отримані такі дані:

Розподіл проданого товару за цінами

Ціна товару, грн. (Х)

1 – 2

2 – 5

5 – 10

10 –

15

Разом

 

 

 

 

 

 

 

Кількість проданого

84

69

25

2

 

180

товару (f)

 

 

 

 

 

 

 

Визначити середню ціну та граничну помилку з імовірністю 0,954; побудувати довірчий інтервал для середньої ціни. Загальна кількість товарів (обсяг генеральної сукупності) 3254 одиниць.

Розв’язання

Для розрахунку середньої ціни за одиницю проданого товару замінимо спочатку інтервальний ряд розподілу дискретним. Використовуючи прийняте у статистиці припущення, що в межах одного інтервалу розподіл уважається рівномірним, значення ознаки (у даному прикладі ціна за товар) замінюємо на відповідні середні значення, які розраховуються за формулою:

max,

~

де X – середина інтервалу

Хmin – нижня межа певного інтервалу Хmax – верхня межа певного інтервалу.

Маємо такі значення:

 

 

 

 

~

 

1 2

1,5

~

 

2 5

3,5

Х1

2

Х2

2

 

 

 

 

 

 

~ 5 10 Х3 2 7,5

230

231

~ 10 15 Х4 2 12,5.

З урахуванням обчислених значень середин інтервалів, вихідні дані набувають такого вигляду:

Дискретний ряд розподілу проданого товару за цінами

 

 

~

 

1,5

 

 

3,5

 

 

7,5

 

12,5

 

Разом

 

 

 

 

 

 

 

 

 

 

 

 

Ціна, грн. ( X )

 

 

 

 

 

 

 

 

 

 

Кількість

 

84

 

 

69

 

 

25

 

2

 

180

 

 

 

товару (f)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Середня ціна обчислюється за формулою середньої арифметичної

зваженої:

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi

fi

.

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тоді середня ціна за даними вибіркового спостереження:

Х 1,5 84 3,5 69 7,5 25 12,5 2 3,2 грн. 180

Гранична помилка для безповторного випадкового відбору розраховується за формулою:

 

2

 

n

t

в

1

 

,

n

 

 

 

N

де

t – довірче число (або квантиль розподілу), яке для великої за обсягом

 

 

 

 

вибірки (більше 30 одиниць) для ймовірності 0,954 дорівнює 2

 

 

в2– дисперсія вибірки

 

 

 

 

 

 

n – обсяг вибірки

 

 

 

 

 

 

N – обсяг генеральної сукупності.

 

 

 

 

 

 

Дисперсія вибірки обчислюється за формулою:

 

 

 

 

~

 

 

2

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в2

Хі Х

 

,

 

 

~

fi

 

 

 

 

 

 

 

 

 

де

 

 

 

 

 

 

 

 

 

 

X – середина окремого інтервалу

 

 

 

 

 

 

Х

– середня арифметична (середня ціна)

 

 

 

 

 

fi

– частота (кількість проданого товару) кожного окремого

інтервалу.

 

 

 

 

 

 

Таким чином, дисперсія вибірки:

 

 

 

 

 

2

 

1,5 3,2 2 84 3,5 3,2 2 69 7,5 3,22 25 12,5 3,2 2 2

4,912

 

 

 

 

в

180

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

231

232

Тепер можна визначити граничну помилку:

 

 

 

 

 

 

2

4,912

 

180

0,32.

1

 

 

180

3254

 

Таким чином, Х = 3,2 грн. = 0,32; і з імовірністю 0,954 можна стверджувати, що при середній ціні за одиницю проданого товару у вибірковій сукупності 3,2 грн., у генеральній сукупності коливання навколо неї становитиме 0,32 грн., тобто межі довірчого інтервалу становитимуть:

3,2 – 0,32 ≤ x ≤ 3,2 + 0,32 ,

це означає, що середня ціна за одиницю проданого товару може коливатися від 2,88 до 3,52 грн. у генеральній сукупності, яка складається із 3254 одиниць товару.

Приклад 2

Під час безповторного вибіркового спостереження в одному з судів з метою дослідження термінів позбавлення волі засуджених за тяжкі злочини були отримані такі дані :

Розподіл засуджених за тяжкі злочини за терміном позбавлення волі (дані умовні)

Термін

 

 

 

 

 

 

позбавлення волі,

5

6

7

8

9

Разом

років (Х)

 

 

 

 

 

 

 

 

 

 

 

 

 

Кількість

12

24

40

26

8

110

засуджених (f)

 

 

 

 

 

 

 

 

 

 

 

 

 

Визначити середній термін позбавлення волі та довірчий інтервал з імовірністю 0,954. Загальна кількість засуджених за тяжкі злочини протягом досліджуваного періоду в цьому суді становила 986 осіб.

Розв’язання

Маємо дискретний ряд розподілу, тому середній термін позбавлення волі за тяжкі злочини на підставі вибіркових даних обчислюється за формулою середньої арифметичної зваженої:

X Xi fi .

fi

Тоді

232

233

 

5 12 6 24 7 40 8 26 9 8

764 6,9

 

X

(років).

110

110

 

Для визначення довірчого інтервалу спочатку потрібно обчислити граничну помилку за формулою:

 

2

 

n

t

в

1

 

,

n

 

 

 

N

де t – довірче число, або квантиль розподілу, який для великої за обсягом вибірки (n > 30) визначається з таблиць нормального розподілу та для ймовірності 0,954 дорівнює 2

в2– дисперсія вибірки n – обсяг вибірки

N – обсяг генеральної сукупності.

Для визначення граничної помилки потрібно розрахувати дисперсію

вибірки, яка обчислюється за формулою:

 

 

в2 Хi

 

2 fi ,

 

 

X

 

 

fi

 

2 5 6,9 2 12 6 6,9 2 24 7 6,9 2 40 8 6,9 2 26 9 6,9 2 8

 

в

110

 

 

 

 

 

 

129,9

= 110 = 1,181.

Тепер обчислюється гранична помилка:

 

 

 

 

 

 

 

 

 

 

 

2

1,181

110

0,2.

 

 

 

1

 

 

 

 

110

986

 

 

 

Довірчий інтервал можна записати таким чином:

 

 

6,9 0,2,

 

6,7

 

7,1.

 

Х

або

Х

Відповідь: середній термін позбавлення волі за тяжкі злочини за даними вибіркової сукупності дорівнює 6,9 років з імовірністю 0,954 можна стверджувати, що середній термін позбавлення волі за тяжкі злочини у генеральній сукупності не менше як 6,7 років та не перевищує 7,1 років (або знаходиться в межах від 6,7 до 7,1 років).

Приклад 3

233

234

За звітний період у суді було розглянуто 480 кримінальних справ, за якими проходило 650 злочинців. Розподіл засуджених за віком у 10% вибірці наведений у таблиці. Визначити частку неповнолітніх злочинців та довірчий інтервал частки цих засуджених з імовірністю 0,954.

Розподіл засуджених за віком за звітний період (дані умовні)

Вік

До 18

18 –

25 –

35 –

50

і

Разом

засудженого, років

25

35

50

старші

 

 

Кількість

14

20

10

15

6

 

65

засуджених

 

 

 

 

 

 

 

 

Розв’язання

Частка неповнолітніх злочинців визначається як питома вага кількості злочинців відповідної вікової групи у загальному обсязі вибіркової сукупності, тобто:

р = хі / хі, де хі – кількість неповнолітніх злочинців у вибірці;

хі – загальна кількість злочинців, які потрапили до вибірки. Тоді:

р = 14 / 65 = 0,215 і т.д..

Оскільки обсяги генеральної сукупності та вибірки великі, то для визначення граничної помилки використаємо формулу:

 

 

 

 

 

 

 

pq

 

 

w = pq t

= t

w(1 w)

,

 

n

 

n

 

де t – квантиль розподілу береться з таблиць нормального розподілу й для імовірності 0,954 t = 2;

p – частка неповнолітніх злочинців у вибірці; q – частка повнолітніх злочинців у вибірці;

n – обсяг вибірки.

Оскільки сумарна кількість неповнолітніх та повнолітніх злочинців дорівнює обсягу вибірки, то q = 1 – p, тоді:

q = 1 – 0,215 = 0,785.

Тоді довірчий інтервал:

 

 

 

 

 

pq 2

0,215 0,785

 

 

65

= 0,1.

 

 

 

 

Довірчий

інтервал записується

у вигляді: р = 0,215 0,1

або 0,115 р

0,315.

 

 

 

Таким чином, з імовірністю 0,954 можна стверджувати, що частка

234

235

неповнолітніх злочинців становить 0,215, а довірчий інтервал – р = 0,2150,1 або 0,115 р 0,315, тобто у загальній сукупності із 650 злочинців частка неповнолітніх злочинців може коливатися в межах від 11,5 до 31,5 %.

Приклад 4

Визначити оптимальний обсяг вибірки для повторного механічного відбору з імовірністю 0,954 за умови, що вік працюючих у генеральній сукупності коливається від 16 до 62 років, а гранична помилка середнього віку працюючих не повинна перевищувати 2 роки.

Розв’язання

Оптимальний обсяг вибірки для повторного механічного відбору обчислюється за формулою:

n t2 22 0 ,

де t – квантиль розподілу береться з таблиць нормального розподілу й для імовірності 0,954 t = 2;

02 – дисперсія генеральної сукупності;

– гранична помилка.

Оскільки дисперсія генеральної сукупності невідома й відсутні дані щодо аналогічних досліджень, то для визначення дисперсії скористаємося правилом трьох сигм, тобто:

0 16 xmax xmin .

Тоді:

0 = 1 / 6 (62 – 16) = 7,7.

Тоді оптимальний обсяг вибірки становитиме:

n = 2 2 × 7,7 2 / 2 2 = 60.

Оскільки гранична помилка не повинна перевищувати 2 роки, то обсяг вибірки округлюємо у більший бік незалежно від того, яка цифра стоїть після цілого числа.

Таким чином, можна зробити висновок – з імовірністю 0,954 можна стверджувати, що оптимальний обсяг вибірки має бути 60 одиниць.

Приклад 5

Визначити оптимальний обсяг вибірки для безповторного механічного відбору для визначення частки якісної продукції з імовірністю 0,954 за умови, що обсяг генеральної сукупності дорівнює 2740 виробів, а гранична

235

236

помилка якісної продукції не повинна перевищувати 0,2.

Розв’язання

Оптимальний обсяг вибірки для повторного механічного відбору обчислюється за формулою:

n

t2 2 N

,

2 N t2 2

де t – квантиль розподілу береться з таблиць нормального розподілу й для імовірності 0,954 t = 2;

N– обсяг генеральної сукупності;

2 – дисперсія генеральної сукупності;

– гранична помилка.

Для частки (альтернативної ознаки), коли відсутня будь-яка інформація про структуру сукупності, вважають, що частка р = 0,5, отже:

2 = 0,5 × 0,5 = 0,25.

Тоді оптимальний обсяг вибірки:

n

t2 2 N

 

22 0,25 2740

2 N t2 2

=

 

= 25.

0,22 2740 22 0,25

Таким чином, можна зробити висновок – з імовірністю 0,954 можна стверджувати, що за таких умов оптимальний обсяг вибірки має бути 25 одиниць.

Бібліографічний список до практичного заняття: [5 – 11 , 15 - 20]

236