- •Тема 1. Статистика, як наука.
- •1. Предмет, метод та основні завдання статистики.
- •Із історії статистики.
- •3. Категорії статистики.
- •Тема 2. Статистичне спостереження.
- •1. Статистичне спостереження.
- •2. Форми статистичного спостереження.
- •3. Види та способи статистичного спостереження.
- •Тема 3. Зведення статистичних даних.
- •Задачі зведення та його зміст.
- •Статистичні таблиці і графіки.
- •Ряди розподілу.
- •Тема 4. Статистичні показники.
- •Форми статистичних показників:
- •Види статистичних показників.
- •Загальний обсяг ознаки.
- •4. Середня величина.
- •Характеристики варіації.
- •Середнє квадратичне відхилення
- •Тема 5. Характеристики розподілу.
- •Коефіцієнт асиметрії:
- •Ексцес:
- •Тема 5. Вибіркове спостереження.
- •Уява про вибіркове спостереження
- •2 . Види та схеми відбору.
- •3. Парадигма вибіркового методу.
- •Помилки вибірки.
- •Задачі.
- •5 . Відносна похибка вибірки.
- •6. Визначення необхідної чисельності вибірки.
- •7. Мала вибірка
- •Тема 6.Методи аналізу взаємозв’язків.
- •1. Місце статистики у дослідженні взаємозв’язку.
- •2. Метод паралельних рядів.
- •3. Метод аналітичного групування.
- •4. Метод дисперсійного аналізу.
- •5. Перевірка істотності зв’язку.
- •6. Метод кореляційно-регресійного аналізу.
- •7. Оцінка узгодженості варіації атрибутивних ознак.
- •Тема 8. Ряди динаміки.
- •Елементи динамічного ряду.
- •Характеристики інтенсивності динаміки.
- •4. Абсолютне значення 1% приросту:
- •Середня абсолютна та відносна швидкість розвитку.
- •Характеристики основної тенденції розвитку.
- •Оцінка коливань і сталості динаміки
- •Тема 7. Індекси
- •Поняття індексів
- •Агрегатний індекс.
- •Середньозважені індекси.
- •Взаємозв’язок індексів.
- •Індекси середніх величин.
- •Територіальні індекси.
Помилки вибірки.
Вибіркові оцінки надаються у вигляді довірчого інтервалу, який, в певному розумінні, визначає їх точність. Його величина кратна μ, тому останню і називають стандартною похибкою (помилкою). А кожну з половинок довірчого інтервалу називають граничною похибкою (помилкою).
Гранична помилка вибірки – це максимально можлива помилка для взятої ймовірності. Формула граничної похибки (помилки):
Δ = t μ (t – коефіцієнт пропорційності).
Гранична помилка вибірки задає діапазон, де з певною вірогідністю має знаходитись відповідний показник для генеральної сукупності – так званий довірчий інтервал. Коефіцієнт пропорційності t, що зв’язує Δ і μ має назву коефіцієнта довіри. Тобто знайшовши середнє вибіркове значення ми можемо навколо нього вказати довірчий інтервал, де з певною ймовірністю знаходиться невідомий генеральний параметр. Величина ймовірності і інтервал взаємопов’язані. При збільшенні заданої ймовірності оцінок інтервал їх можливого знаходження на жаль збільшується. І навпаки.
Розподілу Гауса підкоряються не тільки кількісні середні показники (як-то середня ціна, вага, ресурс, собівартість, тривалість життя…), але і доля розподілу (для альтернативної ознаки).
ПРИКЛАД- маємо сукупність n виробів. З них q – відсоток бракованих. Якщо з цієї (генеральної) сукупності ми візьмемо різні вибіркові сукупності виробів чисельністю від 1 до m (m< n ) і кожного разу встановимо долю браку у вибірці, то так само отримаємо певну сукупність відсотка браку по можливих вибірках, що може лежати в межах від 0% до 100%. Якщо ми побудуємо гістограму розподілу вибіркового відсотку браку, то виявиться, що цей розподіл теж близький до нормального. Причому вісь симетрії цього розподілу відповідає значенню q для генеральної сукупності.
Вибірковий метод побудований на використанні властивостей нормального розподілу. Вимірюють (а точніше оцінюють) розбіжність між вибіркою і генеральною сукупністю за допомогою стандартної похибки вибірки μ. Зрозуміло, що останню неможливо знаходити, як традиційне СКВ статистичної сукупності (бо це вимагає знання середнього значення всіх можливих вибіркових сукупностей і самої середньої величини по генеральній сукупності, а вибіркове спостереження як раз застосовують там, де нема повної інформації).
Як доведено в теорії вибіркового методу дисперсія вибіркових середніх у m разів менша від дисперсії ознаки у генеральній сукупності.
μ ² = σ²ο / m
Зрозуміло, що в загальному випадку, σ²ο невідома (оскільки вимагає знання всіх варіант генеральної сукупності, а отже яке це тоді вибіркове спостереження). Тому на практиці використовують не саме значення σ²ο, а її приблизну незсунену оцінку, яка грунтується на зв’язку дисперсій генеральної σ²ο і вибіркових σв² сукупностей.
Для повторної:
σ²ο = σв² m /(m-1)
Для безповторної:
σ²ο = σв² (n-m) / (n-1)
Ще один підхід - використання оцінки σ²ο за аналогією з попередніми дослідженнями.
Коли неможливо скористатись оцінками за аналогією то намагаються робити пробні обстеження, щоб скористуватись коефіцієнтами Пірсона.
Пірсон досліджував у різних статистичних сукупностях зв’язок між σ і R. Він знайшов, що у багатьох випадках простежується пропорційна залежність між σο і, так званим, Ŕ cер, який являє собою середнє значення групового варіаційного розмаху. Тобто якщо певну сукупність розбити на групи чисельністю d, то кожна група буде мати свій варіаційний розмах. Середнє арифметичне з них і дає Ŕ cер.
σο ≈ k(d) Ŕ cер.
Ккоефіцієнт k змінюється в залежності від обсягу сукупності групи d. Пірсон довів, що в якості грубих оцінок можна прийняти такі значення коефіцієнту пропорційності.
d |
5 |
10 |
20 |
25 |
30 |
40 |
50 |
100 |
200 |
300 |
400 |
k |
0,43 |
0,32 |
0,27 |
0,26 |
0,24 |
0,23 |
0,22 |
0,20 |
0,18 |
0,17 |
0,17 |
На практиці це виглядає так:
генеральну сукупність розбивають на рівні частини;
для кожної групи знаходять варіаційний розмах;
розраховують середній розмах;
знаходять СКВ, скориставшись середнім розмахом і коеф. Пірсона.
Якщо апріорно відомо, що генеральна сукупність підкоряється нормальному закону, то з ймовірністю 0,997 можна стверджувати, що
6СКВ = R.
Це окремий випадок, але дуже розповсюджений.
Маючи оцінку дисперсії ознаки у генеральній сукупності σ²ο і чисельність вибірки m можна отримати значення стандартної помилки вибірки μ. Після цього задаючись потрібною ймовірністю щодо оцінки середньої величини у генеральній сукупності можна отримати відповідні граничні помилки вибірки.
Δ = t μ = t σο / √m
Пропорційний зв’язок між стандартною і граничною помилками вибірки призводить до того, що остання залежить від:
Загальної варіації ознаки у генеральній сукупності;
Обсягу вибірки;
Узятого рівня вірогідності оцінок.
4. 1. Репрезентативна помилка альтернативної ознаки.
Помилка вибірки альтернативної ознаки - це невідповідність розподілу долі у вибірці та генеральній сукупності.
ПРИКЛАД – існує реальна картина розподілу електорату у країні (pο, qο ). Здійснюється вибіркове опитування. Встановлюють вибіркові значення (p, q). Треба оцінити частку pο і qο у генеральній сукупності.
Розходження часток (долі) у вибіркових сукупностях від долі у генеральній сукупності також підкоряється нормальному закону (точніше близьке до нормального).
Тому для знаходження долі ознаки у генеральній сукупності потрібно знайти середню помилку вибірки μ, а далі з певною ймовірністю можна вказати довірчий інтервал де буде знаходитись відповідна частка у генеральній сукупності.
Оскільки дисперсія альтернативної ознаки у генеральній сукупності невідома, то аналогічно застосовують оцінки на підставі вибіркової дисперсії.
Для повторної:
σ²ο = pοqο = pq m /(m-1)
Для безповторної:
σ²ο = pοqο = pq (n-m) / (n-1)
Всі підходи, що були застосовані для знаходження середньої величини у генеральній сукупності підходять і для знаходження частки. Треба тільки зробити заміну:
σв²= pq
Підсумовуючи все вищенаведене можна зазначити наступне:
Частіше за все вибіркове спостереження має на меті встановлення середнього значення певної ознаки по сукупності, або частки за альтернативною ознакою.
Це значення вказується не точно, а у вигляді певного довірчого інтервалу, де з певною ймовірністю знаходиться невідомий параметр. Цю вірогідність можна брати якою завгодно.
Гранична помилка, що визначає межі довірчого інтервалу є величиною, кратною μ - СКВ вибіркових середніх (або вибіркових часток).
Стандартна похибка вибірки μ однозначно пов’язана з дисперсією ознаки у генеральній сукупності і чисельністю самої вибірки: μ ² = σ²ο / m
При оцінюванні дисперсії ознаки у генеральній сукупності σ²ο за допомогою дисперсії ознаки у вибірці σв² потрібно враховувати схеми відбору (повторний, або безповторний).