- •Тема 5. Определение выборочной совокупности Выборки. Типы выборок. Расчет ошибки выборки
- •Расчет ошибки и размера выборки (для случайной выборки)
- •Выборочный метод в социологических исследованиях
- •Генеральная и выборочная совокупность.
- •Репрезентативность и основные принципы формирования выборочной совокупности.
- •4. Основа и объем выборки.
- •Вероятностные способы формирования выборочной совокупности
- •Простая вероятностная выборка.
- •2.Неслучайные (не вероятностные) методы отбора.
- •Направленный отбор.
- •Многоступенчатые и комбинированные способы формирования выборочной совокупности
Репрезентативность и основные принципы формирования выборочной совокупности.
Если исследователь построил выборку, которая представляет интересующую его совокупность с приемлемой степенью точности, то полученная выборка является репрезентативной (представительной). Репрезентативностью называется свойство выборочной совокупности воспроизводить характеристики генеральной совокупности.
Под формированием репрезентативной выборки понимается построение выборочной совокупности, которая воспроизводит статистически структуру генеральной совокупности с точки зрения тех ее характеристик, которые изучаются в исследовании. Относительно этих характеристик выборочная совокупность выступает как своеобразная модель генеральной совокупности.
Особенностью выборочной совокупности как модели является то, что эта модель конструируется из тех же самых элементов, что и объект моделирования. Другая определяющая особенность модели состоит в том, что ее размер обязательно меньше размера моделируемой (генеральной) совокупности.
Построить модель генеральной совокупности — значит определить, какие именно и сколько элементов этой совокупности войдут в состав выборки, а затем обосновать репрезентативность сформированной модели (выборки), а именно — степень ее приближения к моделируемому объекту (генеральной совокупности). Это достигается расчетом выборочных оценок и ошибки репрезентативности1.
Репрезентативность выборки означает, что с некоторой наперед заданной или вычисленной на фактической выборке погрешностью можно отождествить установленное на выборочной совокупности распределение изучаемых признаков с их действительным распределением в генеральной совокупности или, если использовать язык статистики, найти оценки параметров генеральной совокупности.
Ошибками выборки называют отклонение статистической структуры выборки от структуры соответствующей генеральной совокупности. Существуют два типа ошибок, которые необходимо учитывать при использовании выборочного метода и организации выборок: случайные и систематические.
Случайные ошибки. К случайным ошибкам относят статистические погрешности, органически присущие выборочному методу, и ошибки, вызываемые случайными нарушениями в процедурах сбора информации.
Случайные ошибки первого вида представляют собой отклонения характеристик выборочного распределения от генерального распределения. Их причина — различие размера двух совокупностей.
Величина такой случайной ошибки поддается измерению. Ее мера — ошибка репрезентативности. Задачей социолога является обязательный учет этой погрешности при расчете всех выборочных показателей.
Итак, ошибкой репрезентативности называется отклонение характеристик выборки, имеющее статистическую природу, от истинных значений этих характеристик в генеральной совокупности.
Другим видом случайных ошибок, вызываемых неконтролируемыми отклонениями от планируемой выборки, являются ошибки наблюдения и процедур сбора информации. К источникам этих ошибок можно отнести следующие.
1. Замена намеченных по плану выборки единиц наблюдения другими, более доступными, которые, однако, оказываются неполноценными с точки зрения выработанного плана выборки.
Такого рода ошибки могут происходить при использовании недостаточно квалифицированных кадров анкетеров и интервьюеров. (Например, опрос намечено проводить в каждой десятой квартире жилого массива, номера которых определены процедурой систематического отбора. Никого не застав в части выбранных квартир, интервьюер иногда обращается в соседнюю квартиру и берет интервью. В итоге в выборке может оказаться значительный перевес пенсионеров, больших семей и могут быть слабо представлены одинокие лица и малочисленные семьи.) Ошибки этого типа (ошибки подстановки) могут быть предотвращены выборочным контролем за деятельностью анкетеров и интервьюеров и качеством собранной ими информации. Они могут привести к серьезным смещениям в выборке.
2. Неполный охват выборочной совокупности, т. е. неполучение информации от части единиц наблюдения, включенных в выборку (например, недополучение почтовых анкет, не полностью заполненные анкеты).
Эти ошибки устанавливаются путем сравнения реально сформированной выборки с ее разработанным планом. Ошибки подобного рода «снимаются» так называемой процедурой «корректировки» выборки, т. е. организацией дополнительного сбора недостающей информации.
Систематические ошибки. Значительно более серьезную проблему создает наличие систематических смещений, возникающих в результате нарушения случайного характера выборочной процедуры. Результаты такого «не вполне случайного» отбоpa могут выглядеть более или менее правдоподобно, однако сами по себе он: никогда не позволят обнаружить смещение или оценить его величину.
Последнее утверждение можно проиллюстрировать на примере классического опыта с рулеткой. Если нам скажут, что вчера десять раз подряд выпало «красное», мы сможем назвать такую серию событий крайне маловероятной. Однако этот субъективно подозрительный результат сам по себе не дает оснований для каких-то суждений о величине и характере ошибок, порождаемых выборочной процедурой, т. е. об исправности механизма самой рулетки.
Неадекватное воспроизведение в выборке генеральных распределений может быть вызвано причинами, носящими неслучайный (вероятностный) характер. Такие ошибки называют систематическими. Они приводят к искажению в выборке характера генерального распределения: либо к резкому завышению, либо к резкому занижению значений характеристик генеральной совокупности. Систематические ошибки могут обесценить результаты всего исследования.
Основными источниками систематических ошибок могут быть:
а) неадекватность сформированной выборки задачам исследования; б) незнание характера распределений в генеральной совокупности и выбор процедур отбора, которые могут исказить эти распределения (например, нарушение необходимой для репрезентативной выборки пропорциональности в представительстве различного типа элементов генеральной совокупности (если последняя статистически неоднородна) вследствие отсутствия необходимой информации); в) сознательный отбор наиболее удобных и «выигрышных» для решения задач исследования элементов генеральной совокупности, которые, однако, не представляют ее в целом (например, отбор только передовых предприятий, совхозов и т. п.).
Всякое отклонение структуры выборки от реальной структуры генеральной совокупности (за исключением ошибок репрезентативности) называется смещением выборки.
Формирование выборки как модели генеральной совокупности основывается на учете реальных отношений и связей, формирующих ее структуру. Если структура выборки не соответствует тем характеристикам, которые интересуют исследователя, структуре генеральной совокупности, то выборка является смещенной.
Причинами смещения являются, как правило, систематические ошибки, однако и ошибки наблюдения и процедур сбора могут привести к серьезным смещениям в выборочных распределениях.
Самым знаменитым примером смещенной выборочной процедуры в истории социологии стал предвыборный опрос, проведенный американским журналом «The Literary Digest» в 1936 г. Результаты опроса показывали, что Ф. Д. Рузвельт получит 40,9% голосов и уступит президентское кресло республиканцу А. Ф. Лэндону. В действительности Рузвельт получил 60,2% голосов избирателей. Расхождение в 19,3% в значительной степени объяснялось характером выборочной процедуры. Дело в том, что на практике для построения любой выборки используют какой-то список всех членов изучаемой совокупности, называемый основой выборки. В опросе, проведенном «The Literary Digest», в качестве основы выборки использовались телефонные справочники, а также регистрационные списки владельцев автомобилей1. Во второй половине 1930-х гг. такие списки включали в себя почти исключительно представителей экономически благополучных классов. Беднейшие слои населения, избирательная активность которых, кстати, существенно увеличилась в годы Великой Депрессии, оказались недостаточно представлены в выборке, что и послужило причиной столь значительной ошибки. (Интересно отметить, что объем выборки в описываемом случае был просто огромным — свыше двух миллионов человек!)
Смещения, таким образом, возникают за счет преимущественного включения в выборочную совокупность тех или иных социальных групп. Так, почтовые анкеты чаще заполняют лица с более высоким уровнем образования, чем лица с низким уровнем, причем мужчины чаще, чем женщины, пенсионеры чаще, чем работающие, и т. д.
Источником серьезных смещений может быть и ошибка подстановки.
Обычно выделяются следующие основные этапы формирования выборочной совокупности.
1. Прежде чем организовывать процедуры непосредственного отбора объектов в выборку, необходимо обосновать ее структуру с точки зрения задач исследования.
Структура выборочной совокупности задается на основе основных исследовательских гипотез. Например, при исследовании киноаудитории социолог может выдвинуть гипотезу о зависимости вкусов и предпочтений кинозрителя от его образования. Тогда, зная, что в исследуемой генеральной совокупности 15 % лиц с высшим образованием, 40% — со средним и 45% — с неполным средним образованием, он должен выдержать эти пропорции и в выборке. Если исследовательская гипотеза предполагает также, что вкусы кинозрителя зависят в среднем от его возраста, то в выборке должны также быть пропорционально представлены те возрастные группы генеральной совокупности, которые интересуют исследователя.
Структура выборочной совокупности полностью определяется характером гипотез исследования, так как невозможно репрезентировать генеральную совокупность по ее бесчисленным свойствам. Общий принцип выборочного исследования — выборочная совокупность должна быть копией генеральной совокупности. Это значит, что речь идет об учете только тех характеристик и свойств генеральной совокупности, которые существенны для поставленных в исследовании задач.
Непосредственным отражением гипотез исследования в планировании выборки является содержательный отбор тех характеристик и свойств объекта исследования, которые будут использованы для формирования выборки и распределение которых в генеральной совокупности должна воспроизвести выборка.
2. Структура выборочной совокупности задается с учетом наличной и доступной исследователю социальной информации.
3. После того как определена необходимая структура выборочной совокупности, например распределение индивидов по возрасту, бригад — по производительности труда и т. д., возникает вопрос, как практически отбирать объекты из генеральной совокупности, чтобы получить нужную структуру. На этом этапе социолог выбирает тип и объем выборки (количество единиц выборочной совокупности), составляет перечень доступной информации, отрабатывает методику организации выборки с целью предотвратить возможность ошибок, вызывающих смещение выборки.