Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
malyuzhenko_m_v_statistika_oporni_lekci.doc
Скачиваний:
7
Добавлен:
08.05.2019
Размер:
696.32 Кб
Скачать
  1. Помилки вибірки.

Вибіркові оцінки надаються у вигляді довірчого інтервалу, який, в певному розумінні, визначає їх точність. Його величина кратна μ, тому останню і називають стандартною похибкою (помилкою). А кожну з половинок довірчого інтервалу називають граничною похибкою (помилкою).

Гранична помилка вибірки – це максимально можлива помилка для взятої ймовірності. Формула граничної похибки (помилки):

Δ = t μ (t – коефіцієнт пропорційності).

Гранична помилка вибірки задає діапазон, де з певною вірогідністю має знаходитись відповідний показник для генеральної сукупності – так званий довірчий інтервал. Коефіцієнт пропорційності t, що зв’язує Δ і μ має назву коефіцієнта довіри. Тобто знайшовши середнє вибіркове значення ми можемо навколо нього вказати довірчий інтервал, де з певною ймовірністю знаходиться невідомий генеральний параметр. Величина ймовірності і інтервал взаємопов’язані. При збільшенні заданої ймовірності оцінок інтервал їх можливого знаходження на жаль збільшується. І навпаки.

Розподілу Гауса підкоряються не тільки кількісні середні показники (як-то середня ціна, вага, ресурс, собівартість, тривалість життя…), але і доля розподілу (для альтернативної ознаки).

ПРИКЛАД- маємо сукупність n виробів. З них q – відсоток бракованих. Якщо з цієї (генеральної) сукупності ми візьмемо різні вибіркові сукупності виробів чисельністю від 1 до m (m< n ) і кожного разу встановимо долю браку у вибірці, то так само отримаємо певну сукупність відсотка браку по можливих вибірках, що може лежати в межах від 0% до 100%. Якщо ми побудуємо гістограму розподілу вибіркового відсотку браку, то виявиться, що цей розподіл теж близький до нормального. Причому вісь симетрії цього розподілу відповідає значенню q для генеральної сукупності.

Вибірковий метод побудований на використанні властивостей нормального розподілу. Вимірюють (а точніше оцінюють) розбіжність між вибіркою і генеральною сукупністю за допомогою стандартної похибки вибірки μ. Зрозуміло, що останню неможливо знаходити, як традиційне СКВ статистичної сукупності (бо це вимагає знання середнього значення всіх можливих вибіркових сукупностей і самої середньої величини по генеральній сукупності, а вибіркове спостереження як раз застосовують там, де нема повної інформації).

Як доведено в теорії вибіркового методу дисперсія вибіркових середніх у m разів менша від дисперсії ознаки у генеральній сукупності.

μ ² = σ²ο / m

Зрозуміло, що в загальному випадку, σ²ο невідома (оскільки вимагає знання всіх варіант генеральної сукупності, а отже яке це тоді вибіркове спостереження). Тому на практиці використовують не саме значення σ²ο, а її приблизну незсунену оцінку, яка грунтується на зв’язку дисперсій генеральної σ²ο і вибіркових σв² сукупностей.

Для повторної:

σ²ο = σв² m /(m-1)

Для безповторної:

σ²ο = σв² (n-m) / (n-1)

Ще один підхід - використання оцінки σ²ο за аналогією з попередніми дослідженнями.

Коли неможливо скористатись оцінками за аналогією то намагаються робити пробні обстеження, щоб скористуватись коефіцієнтами Пірсона.

Пірсон досліджував у різних статистичних сукупностях зв’язок між σ і R. Він знайшов, що у багатьох випадках простежується пропорційна залежність між σο і, так званим, Ŕ cер, який являє собою середнє значення групового варіаційного розмаху. Тобто якщо певну сукупність розбити на групи чисельністю d, то кожна група буде мати свій варіаційний розмах. Середнє арифметичне з них і дає Ŕ cер.

σο ≈ k(d) Ŕ cер.

Ккоефіцієнт k змінюється в залежності від обсягу сукупності групи d. Пірсон довів, що в якості грубих оцінок можна прийняти такі значення коефіцієнту пропорційності.

d

5

10

20

25

30

40

50

100

200

300

400

k

0,43

0,32

0,27

0,26

0,24

0,23

0,22

0,20

0,18

0,17

0,17

На практиці це виглядає так:

  • генеральну сукупність розбивають на рівні частини;

  • для кожної групи знаходять варіаційний розмах;

  • розраховують середній розмах;

  • знаходять СКВ, скориставшись середнім розмахом і коеф. Пірсона.

Якщо апріорно відомо, що генеральна сукупність підкоряється нормальному закону, то з ймовірністю 0,997 можна стверджувати, що

6СКВ = R.

Це окремий випадок, але дуже розповсюджений.

Маючи оцінку дисперсії ознаки у генеральній сукупності σ²ο і чисельність вибірки m можна отримати значення стандартної помилки вибірки μ. Після цього задаючись потрібною ймовірністю щодо оцінки середньої величини у генеральній сукупності можна отримати відповідні граничні помилки вибірки.

Δ = t μ = t σο / √m

Пропорційний зв’язок між стандартною і граничною помилками вибірки призводить до того, що остання залежить від:

  • Загальної варіації ознаки у генеральній сукупності;

  • Обсягу вибірки;

  • Узятого рівня вірогідності оцінок.

4. 1. Репрезентативна помилка альтернативної ознаки.

Помилка вибірки альтернативної ознаки - це невідповідність розподілу долі у вибірці та генеральній сукупності.

ПРИКЛАД – існує реальна картина розподілу електорату у країні (pο, qο ). Здійснюється вибіркове опитування. Встановлюють вибіркові значення (p, q). Треба оцінити частку pο і qο у генеральній сукупності.

Розходження часток (долі) у вибіркових сукупностях від долі у генеральній сукупності також підкоряється нормальному закону (точніше близьке до нормального).

Тому для знаходження долі ознаки у генеральній сукупності потрібно знайти середню помилку вибірки μ, а далі з певною ймовірністю можна вказати довірчий інтервал де буде знаходитись відповідна частка у генеральній сукупності.

Оскільки дисперсія альтернативної ознаки у генеральній сукупності невідома, то аналогічно застосовують оцінки на підставі вибіркової дисперсії.

Для повторної:

σ²ο = pοqο = pq m /(m-1)

Для безповторної:

σ²ο = pοqο = pq (n-m) / (n-1)

Всі підходи, що були застосовані для знаходження середньої величини у генеральній сукупності підходять і для знаходження частки. Треба тільки зробити заміну:

σв²= pq

Підсумовуючи все вищенаведене можна зазначити наступне:

  • Частіше за все вибіркове спостереження має на меті встановлення середнього значення певної ознаки по сукупності, або частки за альтернативною ознакою.

  • Це значення вказується не точно, а у вигляді певного довірчого інтервалу, де з певною ймовірністю знаходиться невідомий параметр. Цю вірогідність можна брати якою завгодно.

  • Гранична помилка, що визначає межі довірчого інтервалу є величиною, кратною μ - СКВ вибіркових середніх (або вибіркових часток).

  • Стандартна похибка вибірки μ однозначно пов’язана з дисперсією ознаки у генеральній сукупності і чисельністю самої вибірки: μ ² = σ²ο / m

  • При оцінюванні дисперсії ознаки у генеральній сукупності σ²ο за допомогою дисперсії ознаки у вибірці σв² потрібно враховувати схеми відбору (повторний, або безповторний).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]