Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Рабочая книга социолога.doc
Скачиваний:
6
Добавлен:
03.11.2018
Размер:
5.22 Mб
Скачать

5. Многоступенчатые и комбинированные способы формирования выборочной совокупности

Выборка может строиться как одно- или многоступенчатая.

При многоступенчатом отборе на каждой ступени меняется еди­ница отбора. Например, на первой ступени производится отбор про­мышленных предприятий, на второй — отбор бригад на предприя­тиях, попавших в выборку па первой ступени, на третьей — отбор рабочих из бригад, попавших в выборку на второй ступени, отбора, и т. д.

Необходимость многоступенчатого отбора вызвана, как правило, отсутствием информации о всех единицах генеральной совокупности. При многоступенчатом отборе для организации первой ступени не­обходимо иметь информацию о распределении того или иного приз­нака по всей совокупности единиц отбора первой ступени. Для организации второй ступени нужна уже только информация об отобранных единицах первой ступени.

На первой ступени, как правило, используется случайный отбора начиная со второй ступени случайно отбирается количество еди­ниц, пропорциональное размеру соответствующей единицы преды­дущей ступени и т. д.

Доли отбора на каждой ступени комбинируются таким образом, чтобы в целом доля отбора выборки обеспечивала всем единицам генеральной совокупности равные шансы попасть в выборку.

Пропорциональный способ организации многоступенчатой вы­борки имеет определенные неудобства. Социолог, с одной стороны, уменьшает объем выборки в целях экономии средств и сокращения сроков проведения исследования, а с другой, — соблюдая принцип пропорциональности, он может получить очень малочисленные группировки по отдельным факторам, которые окажутся недостаточ­ными для статистического анализа.

Существует несколько способов формирования многоступенчатых выборок.

Для примера рассмотрим способ организации двухступенчатой выборки, отбор единиц которой на первой ступени осуществляется с вероятностью, пропорциональной размеру. Воспользуемся для при­мера условиями и задачами организации выборки в известном ис­следовании ленинградских социологов.

Единицы первой ступени отбора — предприятия города.

Составляется полный список единиц наблюдений первой ступени отбора — промышленных предприятий и численности молодых рабочих па каждом из них. Генеральная совокупность включала 50 таких предприятий.

Предприятие (i)

Число молодых рабочих

Накопленные частоты

1

2

.

.

.

i

.

.

.

50

N1

N2

.

.

.

Ni

.

.

.

N50

N1

N1 + N2

.

.

.

N1 + N2 + ... + Ni

.

.

.

N1 + N2+ ... + N50 = 50

Единицы отбора ранжируются по численности рабочих, выделен­ных в качестве единиц наблюдения. Принимается решение о вклю­чении в выборку определенного числа заводов, например пяти. По таблице случайных чисел выбирается 5 чисел (, , , и ) между N1 и N (общей кумулированной численностью рабочих в генеральной совокупности); В выборку включаются те предприятия, чьи номера (i) оказались в той же строке (j), которая соответствует кумуляте, содержащей одно из чисел (k = 15), т. е. i = j, если N1 + N2 + ... + Nj-1<< N1 + N2 + ... + Nj по всем k.

Вторая ступень отбора реализуется, следующим образом. На каждом предприятии, включенном в выборку, выбирается одно и то же число рабочих ( единиц второй ступени отбора). Далее отбор может быть случайным или систематическим.

Ошибка многоступенчатой выборки (на примере двухступенча­той выборки). При многоступенчатом отборе (начиная с двухсту­пенчатого) следует учитывать специфику расчета ошибки выборки. Каждая ступень отбора делает свой вклад в отклонение находи­мых оценок от истинных значений характеристик в генеральной совокупности.

Для достаточно большого объема выборки существуют упрощен­ные формулы расчета средней ошибки.

Для двухступенчатой выборки

(10)

где — дисперсия единиц первой ступени отбора и п1 их числен­ность; —дисперсия единиц второй ступени отбора и — их численность в составе единиц первой ступени отбора в выборке.

В формуле учтены оба источника ошибок репрезентативности при двухступенчатом отборе. Первый член формулы под корнем указывает па дисперсию, вызванную формированием первой ступени отбора. Второй член указывает па внутригрупповую дисперсию, связанную с организацией второй ступени выборки.

Упрощенность этой формулы состоит в том, что внутригрупповые дисперсии рассчитываются внутри каждой единицы первой ступени после отбора из нее единиц второй ступени. Здесь указана «невзвешенная» средняя из квадратов ошибок по всей сумме единиц второй ступени (). Это второй источник случайных ошибок.

Многофазовый отбор. Многофазовый отбор является особым ви­дом многоступенчатого отбора. Он заключается в том, что из сфор­мированной выборки большего объема производится новая выборка (подвыборка) меньшего объема и т. д.

Особенностью этого способа формирования выборочной совокуп­ности является то, что независимо от числа фаз в последующих подвыборках используется неизменно одна и та же единица отбора, что и в основной выборке.

К многофазовому отбору прибегают тогда, когда в рамках ис­следования, которое проводится на большой выборке, возникает не­обходимость тщательного изучения более узкого круга вопросов. Для этих целей формируется вторая фаза — та же выборка в миниатю­ре и т. д.

Как и в многоступенчатых выборках, при многофазовом отборе каждая фаза является источником случайных ошибок.

Пример двухфазовой стратифицированной выборки121. В ходе, ис­следования сельского населения возникла необходимость более уг­лубленно изучить его культурные потребности и материальные за­траты на потребление культуры.

Основная выборка (п) была сделана из стратифицированной ге­неральной совокупности изучаемый регион был разделен на 5 трат по типу хозяйств: от мелких (1) до самых крупных (5). Вто­рая фаза выборки () была организована из этой основной.

Тип хозяйств

Число людей в первой фазе выборки

Число людей во второй фазе выборки

1

2

3

4

5

635

570

475

303

89

84

125

138

112

41

n = 2072

= 400

При исчислении выборочных показателей по выборке необходи­мо учитывать оба компонента случайной ошибки (как и в случае двухступенчатого отбора), связанного со структурой выборки первой фазы (n) и второй фазы ().

Комбинированные выборки. Соединение в многоступенчатой вы­борке различных приемов отбора (простого случайного, системати­ческого или серийного) делает выборку комбинированной.

Как уже указывалось, большинство используемых в современ­ных социологических исследованиях выборок являются комбиниро­ванными.

Одноступенчатая стратифицированная выборка. Комбинирован­ная одноступенчатая выборка использовалась социологами ИСИ АН СССР при формировании выборочной совокупности для изучения индивидуальной производительности труда (индивидуальных норм выработки) рабочих сдельщиков.

Пример. На основе предварительного анализа пилотажного мас­сива из шести возможных для формирования выборки признаков {возраст, образование, стаж по профессии и на данном заводе, за­работная плата и квалификация) были выбраны два—заработная плата и стаж по профессии. Эти признаки обнаружили наибольшее влияние на изучаемый показатель — норму выработки122.

Генеральная совокупность была стратифицирована на 6 страт, различающихся уровнем заработной платы.

Отбор в стратах имел случайный характер — по распределению второго по весу признака (стаж по профессии).

Были известны следующие данные по генеральной совокупности.

№ группы

Заработная плата, руб.

Численность рабочих

№ группы

Стаж по профессии, лет.

Численность рабочих

1

2

3

4

5

60-80

81-100

101-130

131-160

Более 160

46

162

500

292

101

1

2

3

4

5

1-2

3-4

5-10

11-16

Более 16

164

109

381

168

279

 = 1100

 = 1100

Размер выборки для бесповторного отбора был определен по формуле (см. табл. 16).

где mвыборочная доля. Дисперсия качественного признака (выполнение нормы сдельщиками) при отсутствии информации была принята равной = 0,5*0,5 = 0,25. Доверительная ве­роятность 1 —  = 0,95; предельная ошибка репрезентативности  = 0,05.

В связи с тем что построение репрезентативной районированной выборки означает сохранение в выборке пропорции для групп ге­неральной совокупности, для определения размера групп выборочной совокупности принимается следующий план123: , где N и п — размеры соответственно генеральной совокупности и выборки; и — размеры соответственно страт в генеральной и выборочной совокупностях. Рассчитывается численность каждой страты (представи­тельство групп заработной платы) в выборке

.

Пропорциональнее построение выборки соответствовало следующим необходимым размерам групп:

, , , ,

Следующая стадия работы заключалась в расчете доли для страт стажа.

Для пропорционального построения выборки отбор по стажу сле­дует согласовать с планом: ,

где численность каждой страты по стажу в отдельной страте по уровню зарплаты в генеральной совокупности, соответст­венно для выборки.

Когда найдены эти доли для каждой страты по стажу, рассчи­тывается, сколько единиц наблюдения и с каким стажем должно попасть из каждой такой страты в выборочную совокупность. На­пример, доля для стажа 1 — 2 года и заработной платы 60 — 80 руб. равна 0,60, а для стажа 3 — 4 года в той же типической группе до­ля равна 0,40. Исходя из них, находим размер выборки для каждой страты:

и

Аналогичный расчет производится по всем остальным стратам, В результате формируется план пропорциональной выборки в абсо­лютных числах и процентах (табл. 20).

По таблице случайных чисел выбираются случайные числа в со­ответствии с размером каждой группы, представленной в выборке (табл. 20).

Предварительно картотека была стратифицирована по группам заработной платы и карточки пронумерованы. Из каждой группы выбирались карточки, соответствующие случайным числам. Если стаж на выбранной карточке должен был быть представлен в группе, карточка отбиралась в выборку. Если стаж не должен, был быть представлен в данной группе, карточка возвращалась в генераль­ную совокупность.

Появление карточек, которые возвращались в массив, потребо­вало дополнительного выбора случайных чисел для каждой группы, пока не был обеспечен намеченный по плану размер. Как видно из табл. 20, некоторые смещения оказались в группах с большим ста­жем. Но выборка репрезентативна по контролируемому признаку — средней норме выработки: в генеральной совокупности—109%, в выборке—108,9%.

Таблица 20. План выборки

Стаж по профессии, лет

Численность выработки в группах по уровню заработной платы

Всего

% генеральной совокупности

% в окончательной выборке

1 – 2

3 – 4

5 – 10

11 – 16

Больше 16

7

5

0

0

0

18

11

14

0

0

18

14

53

19

28

0

0

28

18

31

0

0

6

7

14

43

30

101

44

73

14,9

9,9

34,6

15,2

25,3

14,8

9,6

36,4

16,5

22,7

12

43

132

77

27

291

99,9

100,0

Рассчитаем по этой выборке оценку доли перевыполняющих план выработки в генеральной совокупности124 (табл. 21).

Таблица 21. Распределение численности выполняющих план (выборочные данные)

Группа зарплаты

Выполняют план, абс. цифры

Перевыполняют план

Общий объем группы, абс. цифры

абс. цифры

доли

1

2

3

4

5

8

21

21

5

0

4

22

111

72

27

0,33

0,51

0,84

0,935

1,00

12

43

132

77

27

Общая доля рабочих, перевыполняющих план, равна

Чтобы использовать показатель доли по выборке как оценку соответствующего параметра в генеральной совокупности, необхо­димо рассчитать среднюю ошибку выборки.

Расчет дисперсии доли в стратифицированной выборке произво­дится по формуле

(11)

; ;

; ;

; , или 2,78%.

Расчет средней ошибки выборки производится по формуле

(12

При доверительной вероятности 0,95 предельная ошибка выборки  = ZМ = 1,96 * 0,0084 = 0,016, или 1,6%.

Таким образом, с вероятностью 0,95 можно утверждать, что доля перевыполняющих план будет в интервале (81 ± 1,6)%.