Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие по статистике.doc
Скачиваний:
445
Добавлен:
19.03.2015
Размер:
2.64 Mб
Скачать

3.4.2. Виды и способы отбора

По виду отбор бывает: индивидуальный, групповой и комбинированный.

Индивидуальный отбор – выборочная совокупность образуется при последовательном отборе отдельных единиц.

Групповой (серийный) – качественно однородные группы или серии изучаемых единиц. Отбору подлежат целые группы (серии, гнезда), отобранные случайным или механическим способом. В каждой такой группе проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Комбинированный отбор – предполагает сочетание первого и второго видов, может проходит в одну или несколько ступеней. При многоступенчатой выборке типический отбор сочетают с несколькими стадиями (ступенями) отбора. При этом каждая стадия имеет свою единицу отбора. Например, при обследовании бюджетов семей рабочих: 1 стадия – распределение по отраслям; 2 стадия – распределение по предприятиям; 3 стадия – отбор рабочих групп внутри предприятия; 4 стадия – разбивка рабочих на квалифицированных и неквалифицированных.

По степени охвата единиц совокупности различают большие и малые: малая выборка (численность единиц в ней меньше 20).

По способу формирования выборки:

  • Собственно-случайный отбор; осуществляется с помощью жеребьевки или по таблице случайных чисел. Пример, тиражи выигрышей. Используется на практике редко.

  • Механический отбор. Вся совокупность подразделяется на типы и проводится случайный или механический отбор из каждого типа. Так, если надо провести 10% механическую выборку студентов, то составляется список их фамилий по алфавиту и механически отбирается каждый десятый студент, например, 1-й, 11-й, 21-й, 31-й и т.д.

  • Типический отбор. Изучаемая неоднородная совокупность разбивается по типическому признаку на качественно однородные, однотипные группы. Затем из каждой группы случайным способом отбирается количество единиц, пропорциональное удельному весу группы во всей совокупности. Например, отрасль и подотрасль, формы собственности. Этот обор дает более точные результаты, чем случайный и механический.

По методу отбора различают повторный и бесповторный

Повторный отбор – это схема возвращенного шара. Общая численность единиц генеральной совокупности в процессе выборки остается неизменной. В социально-экономических исследованиях встречается редко.

Бесповторный отбор – это схема невозвращенного шара. Единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует, численность генеральной совокупности сокращается в процессе исследования. Случайно-бесповторный отбор чаще всего имеет место в социально-экономических исследованиях.

3.4.3. Ошибки выборки

При случайном отборе выборочная средняя и выборочная доля является переменной величиной при различных исходах выборки и колеблется около соответствующих генеральных значений средней и доли. Мерой этой колеблемости является стандартная ошибка средней и доли, которые называют ошибкой выборки или ошибкой репрезентативности. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей. Основные понятия и обозначения приведены в табл.3.32.

Таблица 3.32.

Показатели генеральной и выборочной совокупности

Показатели

Генеральная совокупность

Выборочная

совокупность

Численность единиц

N

n

Относительная численность выборки

-

n / N

Средняя вкличина

Доля единиц, обладаю

щих изучаемым признаком

р =М / N

w = m / n

Дисперсия

σ²

Число единиц, обладающих изучаемым признаком

М

m

Доля единиц, не обладающих данным значением признака

q

(1-w)

Дисперсия альтернативного признака

рq

w - (1-w)

Среднее квадратическое отклонение

σ

S

Средняя групповая дисперсия средней

2

S²

Внутригрупповая дисперсия

σ i²

Si²

Межгрупповая дисперсия средней

δ²

δ²

Межгрупповая дисперсия доли

-

δ²w

Средняя групповая выборочная дисперсия доли

-

w(1-w)

Число равных серий

R

r

Предельная (максимально возможная)

ошибка средней

-

Δх

Предельная (максимально возможная) ошибка доли

-

Δр

Средняя ошибка выборки

µ

Коэффициент кратности средней ошибки выборки (коэффициент доверия)

-

t

Формулы расчета, зависящие от вида, метода и способа формирования выборочной совокупности, приведены в табл.3.33.

Таблица 3.33.

Формулы расчета, используемые при выборочном наблюдении

При повтор-ном отборе

При бесповторном отборе

Что показывает

1

2

3

4

Формулы ошибок и определения численности простой случайной выборки

Средняя ошибка выборки, μ

Для средней

Для доли р

µx =√ s ² / n

µ р =

√ w(1-w)/ n

µ x =√ ( s ² / n) ٭ (1- n/N)

µр =√{w(1-w)/ n}/{1- n/N }

Среднюю величину всех возможных расхождений выборочной и генеральной средней

Предельная ошибка ∆

Для средней

Для доли

x=t٭√S² / n

р= t

√ w(1-w)/ n

x = t ٭ √ ( s ² / n) ٭ (1- n/N)

р=t ٭√{w(1-w)/ n}/{1- n/N)

С определенной степенью вероятности отклонения выборочных характеристик от генеральных не превысят предельной ошибки выборки

Численность

выборки, n

Для средней

Для доли

n = t²S²/∆²x

n = t² ٭ w(1-w)/∆² р

n=t²NS²/(∆²xN+t² ٭S²

n = t² ٭ N ٭w(1-w) / {∆² рN+t ² ٭ w(1-w)}

Необходимую

численность

выборки

Формулы ошибок типической выборки

Средняя ошибка

выборки, μ

Для средней: при пропорциональном размещении единиц

при оптимальном размещении единиц

µx =√ s ² / n

µx =(1/N)٭

√ s ² N² / n

µ x =√ (s ² / n) ٭ (1- n/N)

µx =(1/N)٭√( s ² N² / n)٭ (1- n/N)

Для доли: при пропорциональном размещении единиц

при оптимальном размещении единиц

р= t ٭

√ w(1-w)/ n

µ р =1/N٭

√{w(1-w)٭N²}/ n

р= t ٭

√{ w(1-w)/ n) /{1- n/N }

µ р =1/N٭√{w(1-w)٭N²}/ n} / (1- n/N)

Формулы ошибок серийной выборки

Средняя ошибка выборки, μ

Для средней

µx =√δ²х /r

µ x =√ (δ² х / r

) ٭ (1- r /R)

Для доли

µр =√δ²w/ r

µ р =√ (δ² w/ r) ٭(1-

r / R)

Численность выборки, r

r= µр2:: δ²

r = t2 δ2R : (R∆²x + t2 δ2 )

Необходимую численность

выборки

Формулы расчета ошибок механической выборки

Средняя ошибка выборки, μ

Для средней

-

µ x=√ ( s ² / n)٭ (1- n/N)

Для доли

-

µр =√{w(1-w)/ n}/{1- n/N }

Продолжение табл.3.33

1

2

3

4

Предельная ошибка ∆

Для средней

Для доли

x = t ٭ µ x

р = t ٭ µр

-

-

Формулы расчета ошибок комбинированной выборки

Средняя ошибка выборки, μ

µ x=√(s ²/ n + δ²/ m )

µ x ==√(s ²/ n٭ (1- n/N)+ δ²/ m٭(1- m/М) )

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Средняя ошибка выборки зависит от:

  • объема выборки: чем больше численность, тем меньше величина средней ошибки выборки;

  • степени варьирования изучаемого признака. Чем меньше вариация признака (дисперсия), тем меньше средняя ошибка выборки. При нулевой дисперсии средняя ошибка выборки равна нулю.

Средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном.

Если в генеральной совокупности единицы располагаются случайным образом по отношению к изучаемому признаку, то механический отбор можно рассматривать как разновидность случайного бесповторного отбора; для оценки ошибки механической выборки применяются формулы случайной бесповторной выборки.

Комбинированная выборка предполагает использование нескольких способов выборки. Например, серийная выборка и случайная.

В каждой конкретной выборке расхождение между выборочной средней и генеральной 11 может быть меньше средней ошибки выборки, равно ей или больше ее. Каждое из этих расхождений имеет различную вероятность. Величина предельной ошибки выборки может быть установлена с определенной вероятностью.

Выборка считается репрезентативной, если - относительная ошибка – процентное отношение абсолютной ошибки к исследуемому параметру Δотн ≤5%.

Формулы предельной ошибки выборки позволяют решить следующие три задачи:

  • определить доверительные пределы

- для генеральной средней х –tμ ≤ ≤ х + tμ

- для доли w–tμ ≤ р ≤ w + tμ

  • определить вероятность допуска той или иной заданной ошибки. Определяется t= Δ/ μ и по таблице при n >20 находится вероятность р.

  • определить необходимую численность выборки n , обеспечивающую с определенной вероятностью заданную точность Δ.

t – коэффициент доверия (краткость ошибки выборки), который определяется по таблице значений интегральной функции Лапласа при заданной вероятности Р имеет определенные значения, приведенные в табл. 3.34.

Таблица 3.34.

Основные значения параметра

Р

0,683

0,954

0,988

0,997

t

1

2

2,5

3

Пример: Методом собственно-случайной выборки обследована жирность молока у n = 100 коров. По данным выборки средняя жирность молока оказалась равной 3,64%, а дисперсия составила s² = 2,56. Определить среднюю ошибку выборки с вероятностью равной 0,954; предельные значения генеральной выборки.

Решение: По формуле средней ошибки выборки: µx = 1,6/10 = 0,16%

По формуле предельной ошибки Δ = tμ. При Р= 0,954 t = 2. Отсюда Δ = 2 * 0,16 = 0,32 или х = 3,64 ± 0,32, т.е. предельные значения жирности молока (или доверительный интервал генеральной средней) определяются как 3,32% ≤ х ≤ 3,96 %

Пример: Для определения средней заработной платы рабочих завода была произведена 20% бесповторная выборка (по цехам) с отбором единиц пропорционально численности групп. Результаты выборки представлены в табл.3.35.

Таблица 3.35.

Результаты выборки

Цех

Объем выборки чел., n

Средняя заработная

плата, руб., х

Среднее квадратическое отклонение, руб. s

1

120

873

30

2

100

886

80

3

180

900

60

Всего

400

-

-

С вероятностью 0,997 (т.е. t = 3) определить пределы, в которых находится средняя заработная плата всех рабочих завода.

Решение: Находим общую выборочную среднюю заработную плату.

=(873*120 + 886*100 + 900*180) / 400 = 355360/400 =888,4 руб.

Находим среднюю из групповых дисперсий:

s² = (900*120 + 6400*100 + 3600*180) / 400 = 1396000/ 400 = 3490

Определим предельную ошибку выборочной средней заработной платы. По формуле для типической бесповторной выборки: Δр = 3 * √(3490/400)* (1- 0,2) =3/20√ 3490 * 0,8 = 3 * 52,84 / 20 = 7,9, отсюда генеральная средняя = ± Δ = 888,4 ± 7,9 или 80,5 ≤ х ≤ 896,3, т.е. средняя заработная плата всех рабочих находится в пределах от 880,5 руб. до 896,3 руб.

Пример: Предприятие выпустило 100 партий готовой продукции А по 50 шт. в каждой из них. Для проверки качества готовой продукции была проведена 5 серийная выборка, в результате которой установлено, что доля бракованной продукции составила 12% . Дисперсия серийной выборки равна 0,0036. С вероятностью 0,997 определите пределы, в которых находится доля бракованной продукции А

Решение: Определим предельную ошибку выборки

Δw = 3 * √(0,0036:10) * (1-10/100) = 0,054 или 5,4%

С вероятностью 0,997 можно утверждать, что доля бракованной продукции А находится в пределах 6,6% ≤ р ≤ 17,4%.