Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Організація та Методика (ОНДР).doc
Скачиваний:
17
Добавлен:
27.08.2019
Размер:
1.64 Mб
Скачать

4.4. Формування вибіркової сукупності

У прикладному соціологічному дослідженні передусім важливо визначити обсяг вибірки, тобто число опитуваних. Це число залежить від загальної кількості соціальних об'ектів, що вивчаються, які утворюють генеральну сукупність. Якщо досліджується громадська думка жителів регіону, то гене-ральною сукупністю є всі жителі регіону. Якщо у межах ло-кального дослідження вивчаються потреби, пропозиції кори-стувачів конкретної бібліотеки (музею, архіву, дозвільної установи), генеральною сукупністю є сукупність усіх корис-тувачів, відвідувачів ціеї установи. Вибірка має бути опти-мальною, або репрезентативною, яка б у мініатюрі відоб-ражала всі характерні особливості генеральної сукупності. Розрахунок обсягу вибірки часто залежить від методу дослі-дження. Так, при експертному опитуванні обсяг вибірки рідко перевищує 30 % , а при пробному (пілотажному) дослі-дженні він може досягати 100 % .

У більшості випадків великий розмір або мінливість гене-ральної сукупності не дають змоги здійснювати суцільне опитування. Тому застосовують вибірковий метод.

У вибіркових дослідженнях неможливо досягти 100 % точ-ності результатів, завжди залишається ризик помилки. Дос-татньо репрезентативним вважається вибірковий параметр, для якого гранична помилка не перевищує 5 %. Збільшення обся-гу вибірки підвищує точність дослідження через зменшення випадкових помилок, а зменшення обсягу вибірки економить час, кошти, людські ресурси, однак зменшує ймовірність отри-мання точних результатів. Необхідно вибирати "золоту сере-дину". Для цього користуються формулами і таблицями, за допомогою яких можна визначити мінімальний обсяг вибір-кової сукупності, виходячи з обсягу генеральної сукупності та прийнятого рівня значущості залежно від типу вибірки.

Конкретним прикладом розрахунку кількості вибіркової сукупності може послужити реальна і потенційна аудито-рія відвідувачів дозвільних установ. Припустимо, що насе-

лення міста становить 10 тис. жителів. Опитати усіх міських жителів дуже важко. Тому можна опитати кожного десятого жителя, тобто 1 тис. осіб, що і буде потенційною аудиторією міського дозвільного центру.

Щоб вибірка була достовірною, важливо визначити озна-ки, за якими вона буде здійснюватися. Серед таких ознак можуть бути:

У табл. 4.4 подано соціально-демографічне групування вибіркової сукупності. Дані таблиці показують, скільки осіб із кожної соціально-демографічної групи слід опитати. Можна дещо змінити пропорції, наприклад, збільшити групу учнів-респондентів за рахунок зменшення кількості опитуваних пенсіонерів. Такий метод формування вибірки дасть змогу отримати цілісну картину соціально-демографічного складу населення, а отже, забезпечити достовірність інформації про генеральну сукупність.

Є й інші типи вибірки: стихійна, квотна, проста, випадко-ва (повторна, безповторна), систематична, гніздова (серійна).

Стихійна вибірка — це вибір "першого стрічного". Цим методом користуються, коли генеральна і вибіркова сукуп-ності за своїми обсягами достатньо великі. Так, для середньо-го міста обсяг вибірки може становити 800—1000 осіб, для малого — 400—500 осіб. Прикладом методу стихійної ви-бірки може бути опитування громадської думки на вули-цях за допомогою засобів масової інформаці'ї (преси, радіо, телебачення), поштове опитування читачів. Найбільш при-датним та ефективним є метод формування вибірки на базі трудових колективів (підприємств, установ, організацій) міста. Однак поки що немає надійних способів перевірки репрезентативності стихійної вибірки, а отже, достовірності її результатів.

Квотна вибірка використовується, якщо прагнуть досяг-ти структурної відповідності вибіркової та генеральної су-купностей. її застосовують найчастіше, якщо методом опи-тування є інтерв'ю. При цьому необхідно визначити ознаки, за якими здійснюється відбір респондентів (наприклад, роз-поділ за статтю, віком, освітою, соціально-професійною належ-ністю). Така вибірка характерна для ситуації, коли відома загальна кількість опитуваних, серед яких повинна бути про-порційна кількість представників різних груп населення.

Проста, випадкова (ймовірна) вибірка виконується на основі повних списків усіх членів генеральної сукупності (ці списки називають основою вибірки): списки виборців, кар-тотека читацьких формулярів тощо. Припустимо, в місті про-живає 10 тис. жителів і треба проанкетувати 1000. Можна взяти списки виборців (формуляри читачів), довільно вибра-ти необхідну кількість респондентів і занести у вибіркову сукупність. Для всіх одиниць сукупності забезпечують рівні можливості (однакову ймовірність) потрапити у вибірку, тому й називають цей спосіб ймовірним. Ця вибірка особливо ефек-тивна в локальних дослідженнях, оскільки забезпечено пов-ний перелік усіх одиниць генеральної сукупності, а крім того, ця сукупність є відносно однорідною.

Систематпична (механічна) вибірка — це спрощений ва-ріант ймовірного відбору. Користуючись тими ж самими спис-ками генеральної сукупності (наприклад, списками виборців), відбір здійснюють не випадковим способом, а послідовно, че-рез один і той же інтервал (так званий крок вибірки). На-приклад, у списку виборців (картотеці читацьких формулярів) взяти кожного десятого і занести у вибіркову сукупність.

Крок вибірки визначаготь як пропорцію обсягів генераль-ної та вибіркової сукупностей:

К = N/n , де К — крок вибірки;

N — розмір генеральної сукупності;

п — розмір вибіркової сукупності.

Починають відбір найчастіше не з першого кандидата, а з випадково визначеного або з кандидата, номер якого К/2. При цьому рекомендується використовувати абеткові спис-ки або картотеки.

При гніздовій (серійній) вибірці за одиницю відбору бе-руть не окремих респондентів, а групи або інші підрозділи (сім'я, бригада, шкільний клас, студентська група, відділ в установі) з суцільним опитуванням. Гніздова вибірка репре-зентативна лише за умови, що склад груп подібний.

Зазначеними типами вибірок способи формування вибі-рок не обмежуються. У дослідженнях державного й регіо-нального масштабів використовуються складніші способи вибірки — районовані, комбіновані, багатоступеневі, багато-фазові. Наприклад, для вивчення і порівняння читацьких потреб у бібліотеках України спочатку визначають області, у межах області — райони, далі — населені пункти, бібліоте-ки, і, нарешті, у кожній бібліотеці відбираються читачі.

Розрахунки обсягу вибіркової сукупності залежать від обсягу генеральної сукупності, а також від вибраного рівня, точності репрезентативності. Як правило, приймають 5 %-ву граничну помилку репрезентативності на 5 % -му рівні зна-чущості. 3 урахуванням цих припущень визначають обсяг вибіркової сукупності для простого ймовірного відбору за такою формулою:

д = 1/0,0025 + 1/N ,

це N — обсяг генеральної сукупності;

п — обсяг вибіркової сукупності.

Декілька розрахованих значень для прикладу наведено у табл. 4.5.

Таблиця 4.5. Обсяги генеральної та вибіркової сукупностсй

Можна дійти висновку, що для проведення будь-яких до-сліджень досить опитати, провести спостереження всього над 400 одиницями. Однак ці розрахунки статистично обґрунто-вують обсяг вибірки, достатній для вивчення лише одного параметра генеральної сукупності або однієї ознаки (одного запитання анкети). Інакше кажучи, формула гарантує зна-чущість лише одновимірних розподілів. Якщо потрібно одер-жати значущі двовимірні розподіли, треба суттєво збільшу-вати вибірку.

Вважається, що для пробних опитувань достатньою є вибір-ка обсягом 100—250 осіб. Якщо величина генеральної су-купності становить менш 5000 осіб, достатній обсяг вибірко-вої сукупності — не менш 500 респондентів. Якщо ж обсяг генеральної сукупності 5000 осіб та більше, то необхідно опи-тати 10 % усієї сукупності, але не більше 2000—2500 респон-дентів. Немає й не може бути універсальної методики вибір-ки на всі випадки, однак важливо знати, що достовірність інформації про досліджуваний о'б'єкт залежить від вибору

найсуттєвііпих ознак, за якими буде здійснюватись відбір респондентів. Необхідно, щоб до складу вибірки входили пред-ставники всіх категорій населення, з яких складається гене-ральна сукупність.

4.5. Підготовка даних до обробки

Інформацію, отриману під час опитування, готують до по-дальшої обробки. Зібрана інформація має відповідати вимо-гам повноти, надійності, технологічності.

Під час вивчення дослідник часто стикається з відмовою частини респондентів брати участь в опитуванні або відпові-дати на окремі запитання. Через це необхідно на стадії кон-струговання інструментарію ретельно будувати запитання. Важливу роль відіграють також психологічні фактори взає-мовідносин між анкетером (інтерв'юером) та респондентом, час і місце проведення опитування. Одержати всі відповіді майже ніколи не вдаеться. Тому після проведення опитуван-ня здійснюють контроль повнотпи даних і вибраковують ан-кети з надмірною кількістю "пропусків".

Загальних норм, стандартів наповнення інструментарію немає. Дослідник має їх визначити для себе сам, виходячи з поставлених завдань та вибраних статистичних методів об-робки. Як правило, вимоги до наповнення відкритих запи-тань суб'єктивного характеру (думка, погляди читача) не можуть бути високими, тому що багато респондентів зали-шають їх без відповіді, не маючи чіткої точки зору.

Під надійніспгю даних розуміють, по-перше, відповідність структури вибірки структурі генеральної сукупності, по-дру-ге, змістовну однаковість інтерпретації запитань і відповідей дослідником і респондентом, по-третє, точність і логічну не-суперечливість відповідей.

Якщо структура генеральної сукупності відома, під час формування вибірки та проведення опитування стежать за дотриманням пропорційної відповідності соціально-демогра-фічного складу респондентів цій структурі. Незважаючи на це, бажано ще раз перевірити вже зібраний матеріал, одержа-ти кількісні показники реального складу респондентів і, якщо виявлено розбіжності із структурою генеральної сукупності, виконати так званий ремонт вибірки.

Є два способи "відремонтувати" вибірку: за допомогою вилучення документів (заповнених бланків інструментарію) з масиву та за допомогою додаткового опитування.

Обсяг вибіркової сукупності слід визначати з деяким за-пасом (10—20 % для анкетних опитувань) для компенсації втрат, які будуть спричинені вибракуванням певної частини анкет під час перевірок. Якщо відхилення від вибірки неве-ликі, користуючись запасом обсягу вибірки і вилученням відповідних анкет з масиву, вирівнюють структуру вибірки. Для цього беруть за основу соціально-демографічну групу з найбільш заниженою квотою у вибірці і відносно неї перера-ховують в абсолютних числах, якими б за обсягом мали бути інші групи пропорційно до структури генеральної сукупності. За кожною групою підраховують різницю між її теоретич-ним та наявним (перебільшеним) розміром і так визнача-ють, скільки анкет з кожної групи треба вилучити. Випадко-вим способом або підрахунком інтервалу (кроку) визнача-ють порядкові номери анкет, що вилучаються, окремо в кожній скорочуваній групі.

Інколи роблять додаткове опитування, відбираючи респон-дентів, які мають представляти недостатньо заповнені у вибірці соціально-демографічні групи. Анкети, одержані під час додаткового опитування, перевіряють на якість даних, як і анкети основного масиву.

Причиною для вибраковування анкети може бути не тільки велика кількість "пропусків". Деякі люди відповідають на-вмання, трапляються й "жартівники". Інколи людина не зовсім точно зрозуміла запитання, у підкреслений варіант вкладає трохи інший зміст, ніж складач анкети, або вважає, що запитання сформульовано недостатньо гостро, не акту-ально, і тому відповідає на своє власне запитання, більпі "пра-вильне".

Фальсифікацію анкет можна розпізнати за змістом відпо-відей, особливо відкритих. Якщо в масиві, одержаному з од-ного населеного пункту, є подібні анкети, роблять припущен-ня, що їх заповнювала одна людина. Припускають також, що ця людина — респондент, тому одну анкету залишають, як його власну, а решту ("за іншого") вилучають з подальшої обробки. Коли ж виявляється, що фальшиві анкети вигаду-вав анкетер (таке іноді трапляється в масштабних досліджен-нях із одноразовим залученням тимчасових помічників у ролі анкетерів та інтерв'юерів), ці анкети вибраковують усі.

Вилучаються й анкети, заповнені несерйозно, поспіхом, "аби відчепилися". їх можна розпізнати за характерними відпові-дями на відкриті запитання (або коли таких відповідей май-же немає), за логічною суперечливістго відповідей на пов'я-зані між собою запитання. Але треба приймати рішення про

відбраковку виважено, обережно. Може статися, що вся ан-кета заповнена вдумливо, а два-три запитання викликали іронію респондента лише через їх недосконалу побудову. Цілком імовірно, що і для решти респондентів ці запитання мали дещо дивний або недоречний вигляд, тобто не "спрацю-вали" так, як передбачалося. У такому разі можна прийняти рішення про відмову від статистичної обробки саме цих за-питань. Щоб не було таких неприємних сюрпризів, недоско-налість інструментарію намагаються виявити у пробному (пілотажному) дослідженні.

Технологічністю даних називають можливість оператив-но й легко працювати з відповідями. Для цього необхідно, щоб варіанти відповідей були позначені одноманітно, чітко, відкриті відповіді вписані зрозумілим почерком, сформульо-вані ясно і не допускали подвійного тлумачення. Забезпе-чення цих вимог особливо важливе, коли анкети кодуються та вводяться в ЕОМ операторами, що не мають безпосереднього відношення до дослідження. Тому виникає потреба виконати технічну корекцію відповідей. Анкети можуть містити ме-ханічні огріхи респондентів — відповідь помилково занесе-на у поле сусіднього запитання, вписана дуже нерозбірливо, містить вузькопрофесійні абревіатури (такі як скорочена назва місця роботи), маловідомі слова одного з розмовних діалектів тощо. Такі відповіді редагують, а якщо це неможливо — вибраковують анкету.

Після перевірки якості інформації підраховують кількість документів у робочому масиві (кожний вид документа — анкети, бланки інтерв'ю, картки аналізу формулярів — окремо), одночасно нумеруючи їх. Якщо документи логічно взаємопов'язані між собою — наприклад, опитували читачів, чиї формуляри потрапили у вибірку для аналізу — на них проставляють однакові номери. До речі, такі документі^ ви-лучати з масиву треба всі разом, якщо бракується хоча б один із них. Нумерація необхідна, якщо обробка здійснюється за допомогою ЕОМ. При виявленні помилок у комп'ютерній копії масиву даних лише номер анкети дає можливість звер-нутися до першоджерела на папері.

Підготовка масиву до статистичного аналізу завершуєть-ся процедурою кодування відповідей. Для повноцінного ви-користання статкстичних методів необхідно, щоб початкові дані були формалїзовані, тобто подані у вигляді чисел, інтер-валів або уніфікованих варіантів. Формалізовані відповіді становлять так звану кількісну (математичну) модель якіс-них властивостей: досліджуваного об'єкта.

Процес формалізації починається ще на етапі підготовки інструментарію, коли "кристалізуються" списки варіантів майбутніх напівзакритих і закритих запитань. Після одер-жання всього масиву зібраних даних і перевірки його якості закривають усі відкриті запитання. Ця робота складається з трьох частин: підготовка списків відповідей, класифікація (узагальнення) відповідей, "заміна" відповідей респондентів їхніми формалізованими аналогами (кодування).

Класифікацію проводять для кожного запитання окре-мо. Виняток становлять запитання, які мають спільну пред-метну основу, наприклад, якщо пропонувалося респонденту назвати газети, які він передплачував у минулому році, пе-редплачує тепер і які збирається передплачувати у наступно-му році, то ці три запитання доцільно закривати спільно.

Усі відповіді виписують в окремий список безповторним способом, тобто тотожні за змістом формулювання подають-ся лише одним прикладом, але з підрахованою кількістю повторів (частотою). Рахунок ведеться на папері за допомо-гою "паличок". Можуть траплятись формулювання, в яких міститься фактично декілька відповідей. Такі формулюван-ня розбивають на прості неподільні вислови, які починають фігурувати в загальному списку окремо один від одного.

Одержаний список детально аналізують з метою узагаль-нення відповідей, тобто об'єднання їх у характерні смислові групи, у більш загальні класи. Фактографічна інформація класифікується, як правило, легше, ніж особисті думки, по-гляди, пропозиції респондентів.

Обробку відкритих запитань найчастіше закінчують уза-гальненням відповідей. Одержані частоти переводять у відсот-ки, a y звіті аналізують їх лиіпе в порівнянні між собою, не маючи можливості простежити зв'язки з іншими запитан-нями анкети. Таке вимушене обмеження пов'язане з висо-кою трудомісткістю ручної обробки даних.

Якщо планується побудування комбінаційних таблиць, після узагальнення відкритих відповідей одержаний список варіантів знову "розчиняють" у масиві анкет, тобто кожній відповіді в анкеті приписують відповідний варіант. Викону-ють цю процедуру за допомогою кодів, тому називається вона кодуванням відкритих відповідей, a формалізований спи-сок варіантів з кодами — кодифікатором. Комплексним формулюванням відповідатимуть одночасно декілька кодів. В анкеті заздалегідь передбачають вільні місця для майбутніх кодів біля кожного відкритого запитання. Користуються і таким прийомом: оцінюють імовірну кількість майбутніх

формальних варіантів (наприклад, їх не може бути більше 5—7) і в такій же кількості поряд із запитанням друкують ланцюжок кодів, які наповнюватимуться конкретними зна-ченнями після узагальнення відповідей.

Подальпіа робота залежить від запланованого способу обробки даних.

Системи кодування можна поділити на символьні і по-зиційні. У позиційній системі кожному варіанту анкети відве-дене місце (позиція) на спеціальній картці, і для фіксації да-них ці позиції або заштриховують олівцем, або пробивають. Для обробки таких карток необхідне спеціальне обладнання.

Більш поширена символьна система кодування, в якій кожний варіант позначається певним символом, кодом. Під символом розуміють умовну позначку, яка може бути номе-ром, літерою, коротким словом. Найпоширеніші цифрові коди, що зумовлено їх високою технологічністю (спрощується вве-дення в ЕОМ). Коди не повинні повторюватися в межах од-ного запитання, можуть не повторюватися взагалі в межах всієї анкети (так зване наскрізне, або безперервне, кодуван-ня), і, навпаки, нумерація варіантів може починатися з оди-ниці у кожному наступному запитанні (періодичне кодуван-ня). Оскільки в наскрізній системі всі коди унікальні, для великих анкет (декілька десятків запитань) доводиться ко-ристуватися дво- і тризначними числами. Це дещо переван-тажує інструментарій і уповільнює перенесення даних на ма-шинні носії у порівнянні з компактнішою періодичною си-стемою кодування, але дає можливість виявляти такі помил-ки операторів, як уведення коду в позицію іншого запитання.

При застосуванні персонального комп'ютера порядок по-передньої підготовки масиву до обробки може бути дещо іншим. На комп'ютер можна перекласти рутинну роботу з перевірки репрезентативності вибірки, логічності відпсщідей. З'являється навіть така цінна можливість, як швидке закрит-тя відкритих відповідей однією людиною: машина бере на себе складання списків відповідей і автоматичне кодування за кодифікатором (звичайно, не на папері, а лише у комп'ю-терній пам'яті), соціологу залишається творча робота — кла-сифікація, яка проводиться також за допомогою ЕОМ. Але, крім наявності відповідного програмного забезпечення, для використання таких можливостей необхідне введення повно-го масиву даних у комп'ютер до виконання всіх подальіпих процедур, тобто традиційно остання операція підготовки да-них (уведення в ЕОМ) має бути першою. Зокрема відкриті відповіді необхідно вводити в їх первісному вигляді. Деяка

частка введених анкет пізніше виявиться вибракуваною. Це все, звичайно, помітно збільшує обсяг роботи з перенесення да-них на магнітний диск, але витрати потім повністю перекри-ваються оперативністю, зручністю і точністю обробки.