Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая теория статистики Назаров

.pdf
Скачиваний:
158
Добавлен:
27.05.2015
Размер:
2.8 Mб
Скачать

14.2. Основные способы формирования выборочной совокупности... 331

будь территориальные единицы — населенные пункты или их части (территориальные участки), а для их стратификации используется какой нибудь признак или ряд признаков. Отбор территориальных единиц осуществляется на основании списков населенных пунк тов, в которых установлено число человек (или других обследуе мых единиц), проживающих в данном населенном пункте.

Многоступенчатая выборка основана на случайном или механи ческом способе отбора по ступеням (этапам). При использовании такого вида выборки на первой ступени из основы выборки отби раются единицы первой ступени; на второй ступени из единиц со вокупности, полученной после отбора первой ступени, отбирают единицы второй ступени и т.д. При таком отборе изучаемый мате риал считается состоящим из некоторого числа единиц отбора пер вой ступени, каждая из которых в свою очередь состоит из единиц второй ступени и т.д.

Комбинированная многоступенчатая выборка имеет несколько различных схем проведения. В одном варианте это может быть боль шой охват единиц на первом этапе наблюдения (в некоторых слу чаях даже сплошное наблюдение), но при этом обследуется неболь шое количество признаков. На следующих этапах наблюдения численность обследуемых единиц сокращается, но при этом обсле дование становится все более детальным.

В другом варианте сначала отбираются более крупные части (груп пы) генеральной совокупности, после чего в отобранных группах отбирают более мелкие части совокупности (подгруппы). В после дней подгруппе производится индивидуальный отбор единиц для обследования. На разных этапах отбора могут применяться различ ные виды отбора: типический, механический, собственно случай ный и серийный.

От многоступенчатого отличается многофазный отбор, который предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. Данные по интересующим исследователя признакам можно анализировать на основании изучения всех еди ниц выборочной совокупности, а по другим признакам — на осно вании части единиц выборочной совокупности, которые представ ляют подвыборку из единиц первоначальной выборки. В таком случае — это двухфазный отбор, при наличии нескольких подвы борок — многофазный отбор. Такая выборка используется для рас

332

Глава 14. Выборочное наблюдение

ширения программы наблюдения и дает возможность экономии средств для проведения выборочного наблюдения.

Многофазным отбором чаще всего пользуются в тех случаях, когда число единиц, необходимых для определения отдельных по казателей с заданной точностью, различается. Ошибки при много фазной выборке рассчитываются на каждой фазе отдельно.

Для разрешения ряда проблем, возникающих при проведении выборочных обследований, требуется построение многомерных вы0 борок. Разработки по теории многомерных выборок находятся еще на начальной стадии, отдельные работы по этому вопросу появи лись в мировой экономической и статистической литературе начи ная с 1990 х гг. Только многомерный отбор дает возможность полу чения репрезентативных выборок небольшого объема. Это такой вид выборки, при котором случайный и механический отбор еди ниц осуществляется по совокупности количественных и атрибутив ных признаков. Отбор может производиться: из типизированной основы выборки, составленной по сочетанию ряда качественных и количественных признаков; из множественной основы выборки; по композитному признаку; по специально разработанным про цедурам отбора (отбор по решетке). Так как в таких основах выбор ки каждая единица объекта наблюдения описывается характер ными для него реквизитами признаками, то случайно отобранная единица типизированной или множественной основы выборки од новременно является носителем ряда реквизитов признаков, а под множество таких единиц позволяет наиболее полно и адекватно отразить свойства изучаемой совокупности.

14.3. Понятие ошибки выборки

Выборочный метод широко используется органами государ ственной статистики, так как позволяет при значительной эконо мии средств и затрат получать необходимую достоверную инфор мацию. Следует иметь в виду, что при сопоставлении показателей по результатам выборочного исследования с характеристиками для всей генеральной совокупности могут иметь место отклонения. Величина этих отклонений называется ошибкой наблюдения, кото рая может быть или ошибкой регистрации (несовершенство техни ческих условий), или ошибкой репрезентативности (случайное или систематическое нарушение правил при отборе единиц). Ошибки

14.3. Понятие ошибки выборки

333

регистрации могут носить случайный (непреднамеренный) и сис тематический (тенденциозный) характер.

При выборочном методе обследованию подлежит сравнительно небольшая часть всей изучаемой совокупности (обычно до 5—10%, реже — до 15—20%). Отбор единиц из генеральной совокупности производится таким образом, чтобы выборочная совокупность была

представительна (репрезентативна) и характеризовала генеральную совокупность. Степень представительности выборки зависит от способа организации выборки и ее объема. Ошибки репрезента тивности возникают в результате того, что выборочная совокуп ность не воспроизводит генеральную полностью и органически присущи выборочному наблюдению. Полной репрезентативности выборки достичь не удается. Поэтому необходима оценка надеж ности результатов выборки и возможности их распространения на генеральную совокупность.

Разность между показателями выборочной и генеральной сово купностями называется ошибкой выборки. Ошибки выборки подраз деляются на ошибки регистрации и ошибки репрезентативности. Плохо, когда ошибка выборки превышает допустимый размер по грешности, но слишком высокая точность также подозрительна и, как правило, свидетельствует об ошибках отбора.

Ошибки регистрации возникают из за неправильных или неточ ных сведений. Источниками таких ошибок могут быть непонима ние существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при за полнении формуляров и т.д.

Среди ошибок регистрации выделяются систематические и слу чайные. К систематическим ошибкам приводят ошибки отбора. Систематические ошибки репрезентативности возникают из за неправильного, тенденциозного отбора единиц, при котором на рушается основной принцип научно организованной выборки — принцип случайности. Так бывает, когда объективный отбор под меняется «удобной» выборкой и это приводит к ошибочному зак лючению о генеральной совокупности. Такая же опасность возни кает при замене по какой либо причине единиц, которые попали в выборку другими единицами. Систематические ошибки представ ляют собой некоторое постоянное смещение, которое не уменьша ется с увеличением числа опрошенных, и вызваны недостатками и просчетами в системе отбора респондентов. Неслучайные ошибки

334

Глава 14. Выборочное наблюдение

могут возникнуть из за методов сбора данных: наличия вопросов, которые неприятны или болезненны для опрашиваемых, неудач ной формы задания вопроса или времени опроса.

Случайные ошибки — те, которые изменяются по вероятностным законам. К случайным ошибкам относится ошибка выборки. Воз никает в силу того, что выборочное статистическое наблюдение является несплошным наблюдением, и выборка недостаточно точ но воспроизводит (репрезентирует) генеральную совокупность.

Ошибка выборки или, иначе говоря, ошибка репрезентативно сти — это разница между значением показателя, полученного по выборке, и генеральным параметром.

Каждая выборка имеет свою ошибку репрезентативности. Сле довательно, можно построить ряды распределения выборок по ве личине ошибки репрезентативности для каждого показателя: для средней, относительной величины и т.д. В таких распределениях прослеживается тенденция к концентрации ошибок около централь ного значения. Число выборок с той или иной величиной ошибки репрезентативности может быть симметрично или асимметрично относительно его центрального значения. При бесконечно боль шом числе выборок получится кривая частот, которая представля ет кривую выборочного распределения. Свойства таких распреде лений используются для получения статистических заключений, установления вероятности появления той или иной величины ошибки репрезентативности.

При определении величины репрезентативной ошибки предпо лагается, что ошибка регистрации равна нулю. Определение ошиб ки производится по формулам ошибки выборочной средней и ошибки выборочной доли. Систематическая ошибка репрезента тивности возникает в результате нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастно го, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.

Ошибка выборочной средней представляет собой расхождение (разность) между выборочной средней и генеральной средней , которое возникает в результате несплошного характера выбороч ного наблюдения. Величина ошибки выборочной средней опреде ляется как предел отклонения от , гарантируемый с заданной вероятностью:

14.3. Понятие ошибки выборки

335

где t — гарантийный коэффициент, зависящий от вероятности Pt, кото рый гарантирует, что разность x x не выйдет за пределы tμx (tμx — сред няя ошибка выборочной средней).

Значения гарантийного коэффициента t и соответствующие им вероятности Pt приведены в табл. 14.1. Обычно вероятность при нимается равной 0,9545 или 0,9973, а t при этом равно соответствен но 2 и 3.

 

 

 

 

 

Таблица 14.1

 

Значения гарантийного коэффициента t

 

 

 

 

 

 

 

 

 

t

Pt

t

Pt

t

 

Pt

1,00

0,6827

1,70

0,9109

2,40

 

0,9836

1,10

0,7287

1,80

0,9281

2,50

 

0,9876

1,20

0,7699

1,90

0,9426

2,60

 

0,9907

1,30

0,8064

2,00

0,9545

2,70

 

0,9931

1,40

0,8385

2,10

0,9643

2,80

 

0,9949

1,50

0,8664

2,20

0,9722

2,90

 

0,9963

1,60

0,8904

2,30

0,9786

3,00

 

0,9973

 

 

 

 

 

 

 

Средняя ошибка определяется как среднее квадратическое от клонение средней величины в генеральной совокупности (средней генеральной):

μx = σ x2 .

Величина средней квадратической стандартной ошибки простой случайной повторной выборки может быть определена по формуле

μx

=

σ X2

,

n

 

 

 

где σ 2X — дисперсия признака в генеральной совокупности.

Дисперсия суммы независимых величин равна сумме диспер сий слагаемых:

σ2 ( X1 + X2 + ... + Xi + ... + X n ) = σ 2n

Xi

i=1

n

= ∑ σ 2 .

i=1 Xi

Если все величины Xi имеют одинаковую дисперсию, то:

σ 2 Xi = nσ X2 . Тогда дисперсия средней:

336

Глава 14. Выборочное наблюдение

 

 

 

n

 

 

 

 

 

 

 

 

 

σ X2

= σ 2

 

Xi

 

=

1

σ 2

 

n

 

=

i=1

 

 

 

 

 

 

Xi

n

n

2

 

 

 

 

 

 

 

 

i=1

 

 

σ X2 i = nσ X2 = σ X2 . n2 n2 n

При определении средней средняя ошибка будет равна

μ

x

=

σ 2

=

σ X2

.

 

 

 

X

 

n

 

 

 

 

 

Между дисперсиями в генеральной и выборочной совокупнос тях существует следующее соотношение:

где

— дисперсия признака в выборке.

 

 

Если n достаточно велико, то

n

близко к единице и диспер

 

n − 1

 

сию в генеральной совокупности можно заменить на дисперсию в выборке.

Тогда средняя ошибка средней в генеральной совокупности мо жет быть определена как среднее квадратическое отклонение сред ней величины в выборочной совокупности (средней выборочной).

При повторном отборе средняя ошибка определяется следую щим образом:

где σ 2x — средняя величина дисперсии количественного признака x, кото рая рассчитывается по формуле средней арифметической невзвешенной:

 

 

n

(xi x)2

 

σ x2 =

 

i=1

 

,

 

 

 

 

 

 

 

n

 

или средней арифметической взвешенной:

 

n

 

 

 

σ x2 =

∑ (xi x)2 fi

 

i=1

 

,

 

n

 

 

 

fi

 

 

 

 

i=1

 

где fi статистический вес.

Формулы расчета средней ошибки выборочной средней для раз личных, наиболее часто используемых способов отбора выбороч

14.3. Понятие ошибки выборки

337

ной совокупности представлены в табл. 14.2, где применены следу ющие обозначения:

N — численность генеральной совокупности;

δ w2 — межсерийная дисперсия выборочной доли; r — число отобранных серий;

R — число серий в генеральной совокупности;

σw2 — средняя из групповых дисперсий выборочной доли;

σx2 — дисперсия признака x в выборке;

δ x2 — межсерийная дисперсия выборочных средних;

σ x2 — средняя из групповых дисперсий выборочной средней.

Таблица 14.2

Формулы расчета средних ошибок выборочной доли и выборочной средней

Метод отбора выборки

 

 

 

 

Средняя ошибка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выборочной доли

выборочной средней

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Механический или собствен

 

 

 

σ w2

 

 

 

 

 

 

 

σ x2

 

 

 

 

но случайный повторный

 

μw

=

 

 

 

μx

=

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

отбор

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Механический или собствен

 

 

σ 2

 

n

 

σ 2

 

n

 

 

 

 

но случайный бесповторный

μw

=

w 1

 

 

 

μx =

 

x

1

 

 

 

 

отбор

 

 

n

N

 

 

n

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Серийный отбор при повтор

 

μw

=

δ w2

 

 

 

μx

=

 

δ x2

 

 

 

 

ном отборе равновеликих

 

 

r

 

 

 

 

r

 

 

 

 

серий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Серийный отбор при беспов

 

 

δ 2

 

r

 

 

δ 2

 

r

торном отборе равновеликих

 

 

 

 

μw

=

w

1

 

 

μx =

 

x

1

 

 

серий

 

 

r

R

 

 

r

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Типический отбор при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

повторном случайном отборе

 

μw

=

σ w2

 

 

 

μx

=

σ x2

 

 

 

 

внутри групп, пропорцио

 

 

n

 

 

 

 

n

 

 

 

 

нальном объему групп

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Типический отбор при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

бесповторном случайном

 

 

σ 2

 

n

 

σ 2

 

n

отборе внутри групп, пропор

μw

=

w 1

 

 

 

 

μx =

 

x

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

N

 

 

n

N

циональном объему групп

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

338

Глава 14. Выборочное наблюдение

При бесповторном оборе с каждой отобранной единицей или серией вероятность отбора оставшихся единиц или серий повыша ется, при этом средняя ошибка выборочной средней уменьшается по сравнению с повторным отбором и имеет следующий вид:

а) для механического или собственно случайного бесповторно го отбора:

 

σ 2

 

μx

= x

 

N

n

.

 

 

 

n

N 1

При достаточно большом объеме совокупности N можно вос пользоваться формулой

μx =

σ 2

 

n

x

1

 

;

n

 

 

 

 

N

б) для серийного бесповторного отбора равновеликих серий:

 

δ 2

 

 

μx

= x

 

R

r

.

 

 

 

r

R 1

 

При достаточно большом числе серий в генеральной совокуп ности R можно воспользоваться формулой

μx =

δ 2

 

r

x

1

 

;

r

 

 

 

 

R

в) для типического отбора при бесповторном случайном отборе внутри групп, пропорциональном объему групп:

μx =

σ 2

 

N n

=

x

 

 

 

 

 

 

n

N 1

 

σ 2

 

n

x

1

 

.

n

 

 

 

N

Межсерийная дисперсия выборочных средних δ x2 и средняя из

выборочных дисперсий типических групп σ x2 вычисляются следу ющим образом:

 

 

r

(x j

x)2

 

 

δ 2

=

j=1

 

 

;

 

 

 

x

 

 

r

 

 

 

 

 

 

 

σ 2xj

14.3. Понятие ошибки выборки

339

 

 

 

k

 

 

 

 

=

∑ σ xj2 nj

 

 

σ x

k

,

 

2

 

j=1

 

 

nj

j=1

где x j — среднее значение показателя в j0й серии;

— дисперсия признака x в j0й типической группе; nj — число единиц в j0й типической группе.

Средние ошибки выборки при типическом методе отбора, про порциональном объему групп и колеблемости признака в группе, приведены в табл. 14.3, где приняты следующие обозначения:

Nj — число единиц в j0й типической группе;

nj — число отобранных единиц в j й типической группе;

σ xj2 — выборочная дисперсия признака x в j0й типической груп пе (дисперсия признака в выборке из j0й типической группы);

σ wj2 — выборочная дисперсия доли в j0й типической группе (дис персия доли в выборке из j0й типической группы);

σ xj — среднее квадратическое отклонение признака x в выборке из j0й типической группы.

Средние ошибки выборки при комбинированной выборке с рав новеликими сериями приведены в табл. 14.4, где приняты следую

щие сокращения:

 

 

 

 

 

n

 

— общее число единиц в отобранных сериях n

=

N

 

;

 

R

 

r

 

r

 

 

 

n — выбранное число единиц, подвергающихся обследованию, из отобранных серий.

При многоступенчатом отборе на каждой ступени отбора может быть найдена своя средняя ошибка. При отборе, например, n1 круп ных групп из генеральной совокупности средняя ошибка выбор ки — μ1; при отборе n2 мелких групп из крупных средняя ошибка выборки — μ2; при отборе n3 отдельных единиц совокупности из мелких групп средняя ошибка выборки — μ3. Если численность групп одинаковая, то средняя ошибка как для средней, так и для доли трехступенчатого отбора может быть определена по формуле

μ = μ12 + μ22 + μ32 . n1 n1n2

340

Глава 14. Выборочное наблюдение

Таблица 14.3

Формулы расчета средних ошибок выборочной средней и выборочной доли при типическом методе отбора

Метод отбора выборки

 

 

 

 

 

 

 

 

Средняя ошибка

 

 

 

 

 

 

 

 

выборочной доли

 

выборочной средней

Повторный случайный

 

 

1

 

 

 

σ

2

 

 

 

 

 

 

1

σ

2

 

 

 

 

отбор внутри групп,

 

 

 

 

N

2

 

 

 

 

N

2

 

 

 

 

 

 

 

 

wj

 

 

 

 

 

 

 

xj

 

 

непропорциональный

 

 

N

 

 

 

nj

 

j

 

 

 

 

N

nj

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

объему групп

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Бесповторный случай

 

 

 

σ 2

 

 

 

 

 

 

 

 

 

σ

2

 

 

 

 

 

 

ный отбор внутри

1

 

 

 

 

 

n

 

1

 

 

 

n

 

групп, непропорцио

N

 

 

wj N 2j 1

 

j

 

 

 

 

xj

N 2j 1

 

j

 

нальный объему групп

 

 

 

nj

 

 

 

 

N j

N nj

 

 

 

N j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Повторный случайный

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отбор внутри групп,

 

 

1

 

 

 

2

 

 

 

 

 

 

1

 

 

2

N j

 

 

пропорциональный

 

 

 

∑σwj N j

 

 

 

 

 

 

∑σ xj

 

 

колеблемости признака

 

 

N

 

 

nj

 

 

 

 

 

 

N

 

 

nj

 

 

 

в группах

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Бесповторный случай

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ный отбор внутри

1

 

 

 

2

 

 

 

 

n

1

 

 

2

 

 

 

 

 

n

групп, пропорциональ

 

∑σwj N j

 

1

 

∑σ xj N j

 

1

 

N

 

 

nj

 

N

N

 

nj

 

N

ный колеблемости

 

 

 

 

 

 

 

 

 

 

 

 

 

признака в группах

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 14.4

Формулы расчета средних ошибок выборки при комбинированной выборке с равновеликими сериями

Метод отбора

 

 

 

 

 

 

 

Средняя ошибка

 

 

 

 

 

 

 

 

выборки

выборочной доли

 

 

выборочной средней

 

Повторный

 

 

σ 2

 

δ 2

 

 

 

 

 

 

 

σ 2

+

δ 2

 

 

 

 

отбор серий

 

 

 

w +

 

w

 

 

 

 

 

 

 

x

x

 

 

 

 

 

 

 

n

 

 

r

 

 

 

 

 

 

 

n

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Бесповторный

σ 2

 

1

n

 

 

δ 2

 

r

σ 2

 

 

 

n

 

δ 2

 

 

r

отбор серий

w

 

 

+

w 1

 

 

x

 

1

 

+

x

1

 

 

 

 

 

 

r

 

R

 

 

 

 

 

r

 

 

R

 

 

n

 

nr

 

 

 

 

n

 

 

nr