Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

readmsg

.pdf
Скачиваний:
46
Добавлен:
12.02.2016
Размер:
1.48 Mб
Скачать

За допомогою цього закону розв’язують два взаємозв’язаних завдання: 1) розраховують, із заданою ймовірністю, межі можливих відхилень вибіркового від відповідного показника в генеральній сукупності; 2) визначають ймовірність того, що розмір можливих відхилень вибіркового показника від генерального не перевищить встановленої межі.

При масовому спостереженні, розподіл емпіричних частот більшості явищ підпорядковується закону нормального розподілу.

Доведено, що за нормальним розподілом більша частина величин зосереджена навколо генеральної середньої. Біля 68,3 % чисельність вибіркової середньої буде знаходитись в межах ±σ генеральної середньої; 95,4 % цієї чисельності знаходиться в межах ± 2σ і 99,7 % – не вийде за межі ± 3σ . Нормальний розподіл показує частоту виникнення помилок даного розміру середньої.

Принцип строгої випадковості, який покладений в основу вибірки, забезпечує його об’єктивність, дозволяє встановити межі можливих помилок і отримати практично достовірні дані для характеристики всієї сукупності явищ. Така вибіркова сукупність називається представницькою або репрезентативною. В її склад входять представники всіх груп, з яких складається генеральна сукупність.

Точність результатів вибіркового спостереження, в кінцевому підсумку, буде залежати від способу відбору одиниць, ступеня коливання ознаки в сукупності та від числа одиниць, що їх спостерігатимуть.

9.3. Методи і способи відбору одиниць у вибіркову сукупність Способом відбору називається система організації відбору одиниць з

генеральної сукупності.

Розрізняють два методи відбору одиниць у вибіркову сукупність: повторний і безповторний.

Повторним називається такий метод відбору, при якому кожна раніше відібрана одиниця повертається в генеральну сукупність і може знову брати участь у вибірці.

161

Безповторним називається такий метод відбору, при якому кожна раніше відібрана одиниця не повертається в генеральну сукупність і в подальшій вибірці участі не бере.

Оскільки безповторний відбір охоплює постійно нові одиниці сукупності, а повторний – одну і ту ж сукупність, тому безповторний відбір дає більш точні результати.

Повторний і безповторний методи відбору, в залежності від характеру одиниці відбору, застосовується в поєднанні з іншими видами відбору. В практиці статистичного дослідження використовуються три види відбору:

1)індивідуальний – відбір окремих одиниць сукупності;

2)груповий (серійний) – відбір груп (серій) одиниць;

3)комбінований – комбінація індивідуального і групового.

За способом відбору одиниць для обстеження розрізняють такі види вибіркового спостереження:

1)власне випадкова вибірка;

2)механічна вибірка;

3)типова (районована) вибірка;

4)серійна (гніздова) вибірка;

5)комбінована вибірка;

6)одноступінчаста і багатоступінчаста вибірка;

7)однофазна і багатофазна вибірка;

8)інші види вибірки.

Власне випадковою називається така вибірка, при якій відбір одиниць з генеральної сукупності є випадковим. Часто для цього застосовують жеребкування або таблицю випадкових чисел.

Механічна вибірка – це послідовний відбір одиниць через рівні проміжки в порядку визначеного розположення їх в генеральній сукупності, або в якомунебудь переліку. Інтервали відбору визначаються у відповідності з часткою відбору одиниць (кожна п’ята, десята, сота і т.д.).

При типовому відборі генеральну сукупність поділяють на однорідні групи за певною ознакою, райони, зони. Потім з кожної групи випадковим або

162

механічним способом відбирають певну кількість одиниць, пропорційно частці групи в загальній сукупності.

При серійній (гніздовій) вибірці відбір одиниць проводять цілими групами (серіями, гніздами) сукупності в межах яких обстежують всі одиниці без винятку. Серії для спостереження відбирають випадково, частіше безповторним способом механічної вибірки.

Комбінованою називається така вибірка, коли комбінують два або кілька видів вибірок. Перш за все, комбінують суцільне і вибіркове спостереження. В даному випадку, за основною програмою обстежується генеральна сукупність, а за додатковою – вибіркова.

Одноступінчастою називається вибірка, коли із досліджуваної сукупності зразу відбираються одиниці або серії одиниць для безпосереднього обстеження.

Багатоступінчаста вибірка передбачає поступове вилучення із генеральної сукупності спочатку укрупнення груп одиниць, потім груп менших за обсягом, і так до тих пір, поки не відберуть відповідні групи або одиниці, які будуть досліджуватись. Вибірка може бути двох-, трьох і більше ступінчастою.

Якщо необхідні дані можна отримати на основі вивчення всіх первинно відібраних одиниць, застосовують однофазну вибірку, а якщо тільки на основі деякої її частини, відібраної так, що вона складає підвибірку із початково проведеної вибірки – багатофазну.

Багатофазною називається така вибірка, коли одні відомості збираються від всіх одиниць відбору, потім відбираються ще деякі одиниці і обстежуються за більш широкою програмою. При багатофазній вибірці на кожній фазі зберігається одна і таж одиниця відбору.

Розрахунок помилок репрезентативності багатоступінчастої і багатофазної вибірок проводиться для кожної ступені і фази окремо.

Бувають випадки, коли необхідно застосувати інші види відбору, такі як взаємопроникаючі і квантильні вибірки, направлений відбір, моментні спостереження, або скористатись малою вибіркою.

Взаємопроникаючою називається така вибірка, коли із однієї генеральної сукупності проводять одним і тим же способом декілька незалежних вибірок.

163

Взаємопроникаючі вибірки завжди проводять різні, незалежні один від одного дослідники, що дозволяє порівнювати підсумки по всіх частинах і забезпечити взаємну перевірку їх роботи. Взаємопроникаючі вибірки дають незалежні одна від одної оцінки значень досліджуваної сукупності, і, якщо результати різних вибірок близькі між собою, то такі оцінки дуже переконливі.

Помилки взаємопроникаючих вибірок визначаються за формулами типової пропорційної вибірки.

Квантильні вибірки застосовують тоді, коли виникає потреба дослідження даних суцільного спостереження за додатковою програмою.

Для проведення квантильної вибірки рангують потрібну варіаційну ознаку і за її нагромадженими частотами будують огіву. За огівою механічним способом відбирають потрібну частину одиниць для дослідження цієї ж ознаки. Якщо огіва вибіркової сукупності добре відтворює огіву генеральної сукупності, то помилка репрезентативності буде мінімальною.

Направлений відбір використовують тоді, коли за відомим середнім значенням ознаки в генеральній сукупності вибіркова сукупність повинна характеризувати її структуру за іншими ознаками.

Направлений відбір передбачає проведення відбору таким чином, щоб середній розмір відібраних одиниць дорівнював середньому розміру одиниць всієї сукупності. В тому випадку, коли заміна однієї одиниці іншою призводить до наближеної рівності середніх генеральної і вибіркової сукупностей, вибірку вважають врівноваженою і репрезентативною за всіма іншими ознаками сукупності. Таким чином, направленим відбором називається врівноваження за однією ознакою для вибіркового дослідження інших ознак.

Помилку вибірки направленого відбору визначають в залежності від способу проведення відбору одиниць до врівноваження.

Моментне спостереження використовується для вивчення використання робочого часу робітниками або часу роботи устаткування. В кожний момент спостереження фіксують, чи знаходився робітник або верстат в роботі, а якщо ні , то з яких причин. Вибіркове моментне спостереження вважають через те, що охоплює не весь час роботи цеху, а лише визначені моменти часу.

164

Малою вибіркою називається вибіркова сукупність, яка складається з порівняно невеликої кількості одиниць (20-30). На практиці іноді доводиться обмежуватись малою кількістю спостережень (при перевірці якості продукції, зв’язаної із знищенням продукції, яку перевіряють). Математичною статистикою доведено, що і при малих вибірках характеристики вибіркової сукупності можна поширити на генеральну.

При малих вибірках дисперсію обчислюють з врахуванням кількості ступенів вільності варіації.

Англійський вчений Стьюдент винайшов закон розподілу відхилень вибіркових середніх від генеральної середньої для малих вибірок. Опираючись на цей закон, він склав спеціальні таблиці, в яких наводяться значення критерію «t» для малих вибірок.

9.4. Знаходження середньої і граничної помилок та необхідної чисельності для різних видів вибірок

Для вибіркового спостереження властиві помилки реєстрації і помилки репрезентативності.

Помилки репрезентативності становлять різницю між середніми і відносними показниками вибіркової сукупності та відповідними показниками генеральної сукупності. Вони поділяються на систематичні та випадкові.

Систематичні помилки репрезентативності зумовлені внаслідок порушення принципів проведення вибіркового спостереження.

Випадкові помилки репрезентативності зумовлені тим, що вибіркова сукупність не відображає точно середні і відносні показники генеральної сукупності.

Визначення величини випадкових помилок репрезентативності є одним з головних завдань теорій вибіркового методу.

Для узагальнюючої характеристики помилки вибірки вираховують середню помилку репрезентативності, яку позначають через грецьку букву «мю» ( µ ) і

називають ще стандартом.

165

Для визначення середньої помилки репрезентативності власне випадкової і механічної вибірки застосовують чотири формули для повторного і без

повторного відбору.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При визначенні

 

Спосіб відбору

При визначенні

 

 

середньої

 

 

 

частки

 

 

 

 

Повторний

 

µ =

σ

2

 

 

µ =

w(1w)

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

п

 

 

 

Безповторний

µ =

σ2

 

п

µ =

w(1

w)

n

 

 

п

1

 

п

1

N

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де µ – середня помилка репрезентативності;

σ2 – середній квадрат відхилень у вибірці;

п– чисельність вибіркової сукупності;

N – чисельність генеральної сукупності;

 

 

n

1

 

– необстежена частка генеральної сукупності;

 

 

 

N

Nn – частка обстеженої частини вибіркової сукупності;

w – частка даної ознаки у вибірці;

(1 w) – частка протилежної ознаки у вибірці.

На практиці частіше використовують безповторний відбір, який гарантує більш точні результати.

Для узагальнюючої характеристики помилки вибірки поряд із середньою розраховують ще і граничну помилку вибірки.

При вибірковому спостереженні розмір граничної помилки репрезентативності «» може бути більший, дорівнювати або менший від середньої помилки репрезентативності « µ ». Тому величину граничної помилки репрезентативності обчислюють з певною ймовірністю «р», якій відповідає t-разове значення « µ ». З введенням показника кратності помилки «t», формула

граничної помилки репрезентативності матиме вигляд: ∆ = tµ;

t =

,

 

 

µ

 

де µ – середня помилка вибірки;

 

 

 

166

t – коефіцієнт довір’я, який залежить від ймовірності визначення граничної помилки.

Ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки і обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях «t» визначається за формулою:

 

2

t

 

t 2

 

F(t) =

e

2 dt.

 

2π

0

 

 

 

Значення цього інтеграла при різних значеннях «t» табульовані і приводяться

в спеціальних таблицях, наприклад:

 

 

для t =1

p(∆ ≤ µ) = 0,683;

для

t = 2

p(∆ ≤ µ) = 0,954;

для t = 3

p(∆ ≤ µ) = 0,997;

для

t = 4

p(∆ ≤ µ) = 0,999.

Гранична помилка вибірки дає можливість встановити, в яких межах знаходиться величина генеральної середньої або частки.

Із теореми Чебишева знаходять, що:

 

 

~

і

~

 

 

~

 

 

 

x x = ±∆х

x

− ∆х x x + ∆х.

Додаючи граничну помилку вибірки до вибіркової частки і віднімаючи її від

неї, знаходять межі генеральної частки:

 

 

 

 

 

 

р w = ±∆р і

 

w − ∆p p w + ∆p .

На основі формул граничної помилки вибірки розв’язують наступні завдання:

1)визначають довірчі межі генеральної середньої і частки з прийнятою ймовірністю;

2)визначають ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищать визначену величину;

3)визначають необхідну чисельність вибірки, яка із заданою ймовірністю забезпечить прийняту точність вибіркових показників.

Розглянемо приклад. При 2% власне випадковому відборі у відібраних для обстеження 100 деталей встановлено, що середня вага однієї деталі 2500 г; дисперсія 900, із 100 деталей 10 виявились бракованими. З ймовірністю 0,954

167

встановити межі середньої ваги однієї деталі в генеральній сукупності, а з ймовірністю 0,997 – межі частки якісних деталей в генеральній сукупності.

Граничну помилку визначаємо х = tµ за формулою безповторного відбору,

так як чисельність генеральної сукупності можна знайти:

 

 

 

N =

100 100

= 5000 шт.

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

В спеціальній таблиці знаходимо, що

для

 

ймовірності

0,954 t = 2 , а для

ймовірності 0,997 t = 3.

 

 

 

 

 

 

 

 

 

 

 

 

Таким чином отримаємо:

 

 

 

 

 

 

 

 

 

х = t

σ 2

 

n

= 2

900

 

100

 

= 2 9 0,98 = 2

3 = 6 г.

п

1

 

100

1

5000

 

 

 

 

N

 

 

 

 

 

Звідси довірчі межі генеральної середньої будуть наступні:

~х − ∆х х ~х + ∆х; 2500 6 х 2500 + 6; 2494 х 2506.

Тобто, з ймовірністю 0,954 можна стверджувати, що середня вага однієї деталі в генеральній сукупності знаходиться в межах від 2494 г. до 2506 г.

Аналогічно вирішується завдання і при визначенні інтервалів (меж) для генеральної частки. Вибіркова частка якісних деталей:

w = mn = 10090 = 0,9,

де т – кількість якісних деталей у вибірковій сукупності; п – кількість відібраних деталей.

р = t

w (1

w)

n

= 3

0,9(1 0,9)

100

 

= 3 0,03 = 0,09,

п

1

 

100

1

5000

 

 

 

 

N

 

 

 

 

 

w − ∆p p w + ∆p , 0,9 0,09 p 0,9 + 0,09, 0,81 p 0,99.

Таким чином, з ймовірністю 0,997 можна стверджувати, що частка якісних деталей в генеральній сукупності знаходиться в межах від 81% до 99%.

При розрахунках вибіркових характеристик інколи ставиться завдання визначення ймовірності допуску певної помилки, тобто відхилення від

168

відповідних характеристик генеральної сукупності не більше ніж на певну завдану величину, яку знаходять за формулою граничної помилки.

Використавши розрахунки попередньої задачі знаходимо для середньої: t = µх = 63 = 2.

Для даного значення (t = 2 ) відповідає ймовірність ( р = 0,954 ). Це дає право стверджувати, що при визначенні за вибірковими даними середньої ваги деталей ( ~х = 2500 г) допущена помилка, яка не перевищує 6 г.

Аналогічно розраховують ймовірність допуску помилки для частки:

t = µр = 00,,0903 = 3.

Для цього значення (t = 3) відповідає ймовірність ( р = 0,997 ). Таким чином,

майже достовірно можна стверджувати, що при визначенні за вибірковими даними частки якісних деталей ( w = 0,9 ) допущена помилка, яка не перевищує

9 %.

При організації проведення вибіркового спостереження важливе значення має правильне визначення необхідної чисельності вибірки, яка з відповідною ймовірністю забезпечить встановлену точність результатів спостереження.

Чисельність вибірки залежить від наступних чинників:

1)від варіації досліджуваної ознаки. Чим більша варіація, тим більшою повинна бути чисельність вибірки, і навпаки;

2)від розміру можливої граничної помилки вибірки. Чим менший розмір можливої помилки, тим більша повинна бути чисельність вибірки. Існує правило, якщо помилку потрібно зменшити в три рази, то чисельність вибірки збільшують

вдев’ять раз;

3)від розміру ймовірності, з якою гарантуватимуть результати вибірки. Чим більша ймовірність, тим більша повинна бути чисельність вибірки;

4)від способу відбору одиниць у вибіркову сукупність для обстеження. Основні формули для знаходження необхідної чисельності вибірки для

власне випадкової і механічної вибірки.

169

Способи відбору

 

 

 

Чисельність вибірки

 

 

 

 

 

 

 

 

 

 

при визначенні середньої

при визначенні частки

 

 

 

 

 

 

 

 

 

 

 

 

Повторний

 

п =

t 2σ 2

 

 

п =

t 2 w(1 w)

 

 

 

 

 

 

 

2р

 

2x

 

 

 

 

 

Безповторний

п =

t 2σ 2 N

п =

 

t 2 w(1 w)N

 

 

 

 

 

 

2рN + t 2 w(1 w)

2x N + t 2σ 2

 

 

 

 

 

Покажемо застосування цих формул на прикладі. Припустимо, що для району, в якому є 8000 корів, необхідно організувати вибіркове спостереження з метою встановлення річної удійності корів. Якою повинна бути чисельність вибірки?

Якщо орієнтуватись на повторний вибір , то при граничній помилці в 30 кг. з ймовірністю ( р = 0,954 ) і при середньому квадратичному відхиленні 300 кг.,

визначеному за результатами аналогічних обстежень, необхідна чисельність вибірки повинна бути:

п =

t 2σ 2

=

22 3002

=

4 90000

= 400 корів.

2x

 

 

 

302

 

90

 

При безповторному відборі необхідна чисельність вибірки буде дорівнювати:

п =

t2σ2 N

=

4 90000 8000

= 380 корів.

2x N +t2σ2

900 8000 + 4 90000

 

 

 

Цей розрахунок підтверджує, що при інших рівних умовах, обсяг вибірки при безповторному відборі завжди буде менший, ніж при повторному.

Для визначення частки породних корів з помилкою не більше 5 %, при ймовірності 0,954 і дисперсії альтернативної ознаки 0,25, знаходимо при

повторному відборі:

п =

t 2 w(1w)

=

4 0,25

= 400 корів,

 

2р

0,0025

 

 

 

 

 

 

 

 

 

 

 

і при безповторному відборі:

 

 

 

 

 

 

 

 

 

п =

 

t 2 w(1 w)N

 

=

8000

 

=

8000

= 380 корів.

 

 

 

 

 

 

 

 

 

 

2рN + t 2 w(1 w)

 

0,0025 8000 +1

 

21

 

Таким чином, для забезпечення прийнятої точності при повторному відборі необхідно обстежити 400 корів, а при безповторному відборі – 380.

170

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]