- •Національна академія статистики, обліку та аудиту
- •Тематичний план дисципліни
- •Зміст курсу та методичні вказівки
- •Тема 1 Суть та основні поняття вибіркового спостереження
- •1 Суть, мета та завдання вибіркового спостереження
- •2 Переваги та недоліки вибіркового спостереження
- •3 Основні поняття вибіркового методу
- •Тема 2 Етапи проведення вибіркового спостереження
- •1 Етапи вибіркового обстеження
- •2 Планування вибіркового обстеження
- •3 Збір та обробка даних
- •4 Розповсюдження результатів та оцінка якості
- •Тема 3 Впровадження вибіркового обстеження в практику державної статистики
- •1 Передумови проведення вибіркового обстеження
- •2 Проведення робіт з впровадження вибіркового обстеження
- •3 Аналіз основи вибірки
- •Аналіз основи вибірки без проведення вибіркового обстеження
- •Аналіз основи вибірки за допомогою формування “штучних” вибірок
- •Тема 4 Види вибірок та відборів
- •1 Види вибірок
- •2 Види відборів
- •Тема 5 Побудова дизайну вибірки
- •1 Вивчення основних характеристик сукупності
- •2 Стратифікація генеральної сукупності
- •3 Дизайн вибірки
- •Тема 6 Обчислення обсягу вибірки
- •1 Проблеми, що виникають при визначенні обсягу вибірки
- •2 Вимоги до мінімального обсягу вибірки
- •3 Формули обчислення обсягу вибірки Формули обчислення обсягу вибірки через абсолютні величини
- •Тема 7 Виявлення та врахування нетипових одиниць
- •1 Види екстремальних елементів
- •Екстремальні елементи у вибірковому обстеженні
- •2 Методи виявлення екстремальних елементів
- •3 Особливості нетипових одиниць у обстеженні підприємств
- •Тема 8 Імпутація часткових невідповідей
- •1 Проблеми, пов’язані з пропусками у даних
- •2 Методи зменшення рівня невідповідей
- •3 Види часткових невідповідей
- •4 Методи оброблення часткових невідповідей
- •Класифікація методів обробки даних з невідповідями
- •Тема 9 Компенсація повних невідповідей
- •1 Методи компенсації повних невідповідей
- •2 Зважування даних
- •3 Обчислення ваг та вагових коефіцієнтів
- •Тема 10 Розповсюдження результатів вибіркової сукупності
- •1 Етапи обробки та аналізу результатів вибіркового обстеження
- •2 Обчислення оцінок показників генеральної сукупності за вибіркою
- •Тема 11 Обчислення похибок репрезентативності
- •1 Види похибок у вибірковому спостереженні
- •2 Обчислення похибок репрезентативності
- •Класи точності вибіркових даних
- •Класи надійності вибіркових даних
- •Тема 12 Оцінка якості результатів вибіркового спостереження
- •1 Поняття якості
- •2 Критерії якості результатів вибіркового спостереження
- •3 Компроміс між якістю та витратами на обстеження
- •Приклади розв’язання типових задач
- •Вказівки до виконання контрольних робіт для студентів стаціонару
- •Зміст контрольних робіт
- •Вказівки до виконання контрольних робіт для студентів заочної форми навчання
- •Державний комітет статистики України
- •Варіант 2 Задача 1
- •Задача 2
- •Варіант 3 Задача 1
- •Задача 2
- •Варіант 4 Задача 1
- •Задача 2
- •Варіант 5 Задача 1
- •Задача 2
- •Варіант 6 Задача 1
- •Задача 2
- •Варіант 7 Задача 1
- •Задача 2
- •Варіант 8 Задача 1
- •Задача 2
- •Варіант 9 Задача 1
- •Задача 2
- •Варіант 10 Задача 1
- •Задача 2
- •Запитання до іспиту
- •Список рекомендованої літератури
2 Методи зменшення рівня невідповідей
Відомі методи зменшення рівня невідповідей та їх урахування при обчисленні оцінок можна поділити на три категорії:
1) Заходи, які проводяться під час планування обстеження та збору даних і спрямовані на зменшення невідповідей до незначного рівня. Таким чином відсутність відповідей не враховується при обчисленнях, оскільки низький рівень невідповідей несуттєво або зовсім не впливає на достовірність висновків;
2) Методи збору даних і обчислення оцінок, які дають незміщені оцінки параметрів;
3) Застосування для побудови оцінок моделей або припущень відносно взаємозв’язків між змінними, які коригують відсутність відповіді таким чином, що навіть значний рівень пропущених даних можна розглядати як допустимий для одержання достовірних висновків.
Очевидно, що ідеальне обстеження не має пропущених даних. Для наближення до цього ідеалу потрібно дуже ретельно планувати кожну стадію збору даних і особливо брати до уваги, як вплинуть на рівень відсутності відповіді ті чи інші заходи. Процес підготовки персоналу, вибір методу збору даних, зміст і обсяг анкети мають при цьому ключові значення.
Проте, якщо все-таки невідповіді при обстеженні мали місце, доцільно застосовувати найбільш ефективні методи для виявлення причин їх виникнення та для їх обробки.
3 Види часткових невідповідей
Відправною точкою для обробки даних є інформація отримана від респондентів. Помилки, зроблені респондентами при заповненні анкети і операторами при введенні, виявляються і виправляються в процесі редагування даних до здійснення обробки невідповідей.
Після редагування даних увесь масив одиниць вибірки умовно будемо диференціювати на:
одиниці, які подали заповнені анкети (1);
одиниці, які подали неповністю заповнені анкети (2);
одиниці, які не подали анкети (3);
одиниці, які не відповідають ознакам поля спостереження, а отже, знаходяться за його межами (4).
Очевидно, що серед одиниць із третьої групи, а в деяких випадках і другої групи, можуть знаходитись і ті, що не відповідають ознакам поля спостереження, а отже, фактично мають належати четвертій групі. Якщо існує додаткова інформація, яка дозволяє виявити такі одиниці, то вони вилучаються з третьої групи (чи другої) і приєднуються до четвертої. За відсутності такої інформації приймається одна з гіпотез:
усі респонденти, які не повернули анкету, є респондентами за межами спостереження;
усі респонденти, які не повернули анкету, є повними невідповідями.
Наприклад, у обстеженні підприємств одиницями за межами поля обстеження, як правило, є ті, що мають вид діяльності, який не є предметом обстеження та ті, що ліквідовані в попередніх звітному роках. Проте одиниці, які ліквідовані у звітному році і не надали звіт, визнаються повними невідповідями. Крім того при обстеженні малих підприємств до четвертої групи відносять також ті, що у звітному році перестали визначатись як малі.
Одиниці четвертої групи вилучаються з подальшої обробки та аналізу. Однак не слід вважати, що наявність елементів у цьому масиві ніяк не впливає на результати вибіркового обстеження; саме це зменшує точність оцінок, обчислених за вибірковими даними, оскільки при вилученні одиниць цього масиву зменшується загальний обсяг вибірки.
Зазначимо, що коригування вибіркових даних на невідповіді здійснюється обов’язково до проведення аналізу отриманих результатів.
Таким чином, розрізняють два види відсутності даних (невідповідей, пропусків): повна відсутність даних, коли досліджувана одиниця взагалі не надає даних (третя група) і часткова відсутність даних, коли досліджувана одиниця не надає даних лише за одним чи кількома показниками анкети, а за іншими надає (друга група).
Розрізняють три типи часткових невідповідей:
відсутність величин за випадковим законом;
пропуск не залежить від даної змінної, але залежить від іншої змінної;
пропуск залежить від величини змінної, по якій відсутні дані.
Перед тим, як застосовувати той чи інший метод аналізу невідповідей, важливо з’ясувати до якого саме типу невідповідей належить дана. Лише знаючи тип невідповіді та причини її виникнення, можна прийняти правильне рішення щодо найбільш прийнятного методу її обробки.