Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
80
Добавлен:
10.02.2015
Размер:
334.85 Кб
Скачать

8.2 Методы (алгоритмы) отбора единиц в выборочную совокупность

Процесс формирования выборочной совокупности основан на принципе случайности, реализация которого обеспечивается применением соответствующих методов, или алгоритмов, отбора единиц. В простейшем варианте отбор единиц в выборочную совокупность может быть проведен методом жеребьевки. Для этого необходимо располагать достаточным количеством жребиев (фишек, карточек), соответствующих объему генеральной совокупности. Каждый жребий должен содержать информацию об отдельной единице совокупности - номер, название, фамилию лица, адрес или какой-либо другой отличительный признак. Требуемое в соответствии с установленным процентом отбора число жребиев извлекается из общей совокупности в случайном порядке.

Жеребьевка является в большей степени теоретическим методом формирования выборки, так как ее техническая реализация при большом объеме генеральной совокупности затруднительна. Используемые же на практике методы отбора единиц в выборочную совокупность базируются на специальных алгоритмах, реализующих принцип случайности. Рассмотрим некоторые из них.

Метод случайной сортировки включает три шага:

  1. Каждой единице генеральной совокупности присваивается случайное число , полученное с помощью процессора случайных чисел в интервале от 0 до 1 (полученные случайные числа должны в той или иной степени соответствовать закону равномерного распределения). Отметим, что генерация случайных чисел может быть произведена вMicrosoftExcel(Вставка функции - Математические - Случайное число).

  2. Единицы генеральной совокупности ранжируются в соответствии с полученным значением .

  3. Отбираются первых единиц.

Достоинства данного метода заключаются в простом алгоритме отбора единиц, а также в возможности формирования нескольких выборок без перекрытия. К недостатку данного метода относят наличие процедуры сортировки единиц генеральной совокупности, которая при достаточно большом ее объеме нежелательна.

Метод прямой реализации предполагает следующую последовательность действий:

  1. Все единицы генеральной совокупности, расположенные в случайном порядке или ранжированные по какому-либо признаку, нумеруются от 1 до .

  2. С помощью процессора случайных чисел получают значений в интервале от 1 до. Если первоначально случайные числа получены в интервале от 0 до 1, их необходимо умножить на и округлить по правилам до целого значения.

  3. Из сформированного списка единиц генеральной совокупности отбираются единицы, соответствующие по номеру полученным случайным числам.

Отметим, что если полученные в п. 2 случайные числа ранжировать, то реализация данного алгоритма потребует только одного считывания файла единиц генеральной совокупности.

Упрощенным вариантом метода прямой реализации является отбор единиц в выборочную совокупность на основе таблицы случайных чисел (см. приложение 15). Для проведения отбора могут быть использованы цифры любого столбца данной таблицы, при этом необходимо учитывать объем генеральной совокупности.

Рассмотрим процедуру отбора на основе фрагмента таблицы случайных чисел. Предположим, объем генеральной совокупности составляет 70 000 ед. и требуется сформировать выборку объемом 500 ед.; тогда цифры таблицы следует перегруппировать для получения пятизначных чисел следующим образом:

5489

5

583

31

56

083

5

1988

3522

0

935

78

77

566

5

7020

7555

7

579

25

50

248

7

9477

5759

3

554

50

80

907

4

7001

6303

6

895

33

71

319

6

7231

Для формирования выборки мы должны взять 500 чисел в интервале от 00001 до 70000. Таким образом, нам следует из списка единиц генеральной совокупности отобрать единицы под номером 54895, 35220, 57593 и т.д. При этом номера свыше 70000 (75557, 93578 и подобные) будут проигнорированы.

При проведении бесповторного отбора повторяющиеся номера следует учитывать только один раз. При повторном отборе, если тот или иной номер случайно встретится еще один или более раз, соответствующая этому номеру единица в каждом случае повторно включается в выборочную совокупность.

Метод отбора-отказа включает следующие итерации:

  • последовательно образуют случайные числа , ... в соответствии с законом равномерного распределения в интервале от 0 до 1;

  • для первой единицы генеральной совокупности проверяется выполнение следующего неравенства:

.

(8.1)

Если данное неравенство выполняется, то первая единица включается в выборку, в противном случае - нет;

  • для оставшихся единиц последовательно проверяется выполнение неравенства

(8.2)

где - число отобранных в выборку единиц среди первых просмотренных единиц. Если для-й единицы это неравенство выполняется, то данная единица включается в выборку, в противном случае - нет;

  • процедура заканчивается, когда , т. е. когда выборка необходимого объема полностью сформирована. Этот момент вполне может наступить и до завершения полного просмотра всех единиц генеральной совокупности. Следует отметить, что данный метод основан на алгоритме последовательного извлечения единиц, не требующем ни предварительной сортировки единиц генеральной совокупности или образованных случайных чисел, ни многократного считывания исходного файла.

При любых условиях положенный в основу метода отбора-отказа алгоритм приведет к формированию выборки желаемого объема. Наилучшие же результаты, безусловно, будут получены тогда, когда генерируемые случайные числа подчиняются закону равномерного распределения. Методы отбора единиц в выборочную совокупность используются при различных способах (видах) выборки, которые рассмотрены в последующих разделах.

Соседние файлы в папке Общая теория статистики