Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Общая стат.лекции.doc
Скачиваний:
30
Добавлен:
23.03.2015
Размер:
2.68 Mб
Скачать

Тема 4. Выборочное наблюдение

    1. Понятие о выборочном наблюдении

Выборочное наблюдение представляет собой один из наиболее широко применяемых видов сплошного наблюдения.

Выборочное наблюдение – это метод статистического исследования, при котором характеристика всей совокупности фактов (генеральной совокупности) дается по некоторой ее части (выборочной совокупности).

В последние годы выборочное наблюдение широко применяется в работе органов статистики, так как это позволяет:

− сэкономить затраты средств и труда на обработку информации;

− сократить ошибки регистрации на этапе сбора данных;

− повысить оперативность получения сведений.

В отличие от других методов несплошного наблюдения (монографического наблюдения, метода основного массива) выборочное наблюдения имеет важную особенность – возможность попадания в выборочную совокупность равна для всех единиц генеральной совокупности.

Это предупреждает появление тенденциозных ошибок при формировании выборки.

    1. Виды выборочного наблюдения

Рис.1. Классификация выборочного наблюдения

В зависимости от способа отбора единиц различают:

повторную выборку – после отбора, какой-то единицы, она снова возвращается в совокупность и может быть снова набрана, т.е. вероятность попадания каждой отдельной единицы в выборочную совокупность остается постоянной;

бесповторную выборку – отобранная единица не возвращается обратно и возможность попадания у оставшихся единиц в выборочную совокупность постоянно возрастает.

По форме организации способа отбора выборочное наблюдение может быть:

  • случайным – случайный отбор;

  • механическим – отбор единиц в выборочную совокупность из генеральной производится через равные интервалы (группы);

  • типическим – в выборочной совокупности более равномерно представлены различные типы (части) генеральной совокупности;

  • серийным – отбираются серии единиц, которые подвергаются сплошному исследованию;

  • комбинированным – комбинация нескольких форм организации выборочного наблюдения.

    1. Ошибки выборочного наблюдения

Между характеристиками выборочной и генеральной совокупности, как правило, существует расхождение, которое называется ошибкой.

Ошибки выборочного наблюдения могут быть двух видов:

− ошибки регистрации – свойственны любому наблюдению, вызваны несовершенством измерительных приборов, недостаточной квалификацией работников и т.п.;

− ошибки репрезентативности (представительности) присущи только несплошным наблюдениям, возникают из-за того, что выборочная совокупность не точно характеризует генеральную.

Ошибка выборки зависит от следующих факторов:

− степени вариации изучаемого признака;

− численности выборки;

− метода отбора единиц в выборочную совокупность;

− принятого уровня достоверности результатов исследования.

В математической статистике доказывается, что значение средней ошибки повторной выборки равно:

−средняя,

−среднее квадратическое отклонение выборочное или генеральное,

где µ − ошибка выборки;

δ2 − дисперсия (средний квадрат отклонений);

n − объем выборки (число обследованных единиц).

При бесповторном отборе формула средней ошибки выборки принимает вид:

, где

N – объем генеральной совокупности.

Предельная ошибка выборки , гдеt – коэффициент доверия. Определяется по справочным таблицам в зависимости от уровня вероятности.

В целом ряде случаев средние и относительные величины для какой-либо совокупности рассчитываются на основе данных выборочного наблюдения, суть которого заключается в том, что из генеральной совокупности, наудачу, чисто случайно, отбирается n единиц, составляющих выборочную совокупность; для отобранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели), а затем результаты выборочного обследования распространяются на всю генеральную совокупность. Основной задачей при этом является определение ошибок выборки, т.е. возможных расхождений между выборочной средней () и генеральной () или выборочной долей единиц (w), обладающих изучаемым признаком, и генеральной долей (p).

Различают среднюю и предельную ошибки выборки.

Средняя ошибка выборки (µ) характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли) и представляет собой по форме и содержанию среднее квадратическое отклонение возможных значений выборочной средней от генеральной.

В математической статистике доказывается, что - дисперсия возможных значений выборочной средней – вn раз меньше дисперсии изучаемого признака и генеральной совокупности, т.е. .

Исходя из этого средняя ошибка выборочной средней при повторном отборе определяется по формуле:

,

где - дисперсия изучаемого показателя в генеральной совокупности (т.к. дисперсия изучаемого показателя в генеральной совокупности неизвестна, то фактически в формулу подставляется дисперсия выборочная, которая при большом числе наблюдений близка к генеральной), аn – объем (численность) выборки.

Как видно из формулы, средняя ошибка выборки (µ) при повторном отборе зависит от показателя вариации () и от объема выборки (n).

Средняя ошибка выборочной доли определяется по формуле:

, где w – выборочная доля единиц, обладающих изучаемым признаком, а w(1 − w) – дисперсия доли (альтернативного признака).

При бесповторном отборе в формулах под знаком радикала появляется множитель , гдеN –численность генеральной совокупности.

Говоря об ошибках выборки, следует иметь в виду, что в каждой конкретной выборке разность может быть меньше, больше или равнаµ. И вероятность каждой такой ошибки различна.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки.

Предельная ошибка выборки, обозначаемая через , рассчитывается как

,

где µ − средняя ошибка выборки,

t – коэффициент доверия.

При бесповторной выборке формула ошибки выборки имеет вид:

,

где δ2 – межсерийная дисперсия;

s – число отобранных серий;

S число серий в генеральной совокупности.

Все рассмотренные выше формулы используются при так называемой большой выборке.

Если n < 20 (у некоторых авторов n <30), то выборка именуется малой и при расчете ошибок выборки необходимо учитывать следующие моменты. Во-первых, в формуле средней ошибки в знаменателе принимается n – 1, т.е.

.

И, во-вторых, при нахождении вероятности допуска той или иной ошибки или определении доверительных интервалов исследуемого показателя в генеральной совокупности пользуются таблицами вероятность Стьюдента, где определяется в зависимости от объема выборки иt.

Формулы предельной ошибки выборки позволяют решить следующие три задачи:

  1. Определить доверительные пределы:

для генеральной средней

;

для доли

.

  1. Определить вероятность допуска той или иной заданной ошибки .

В этом случае определяется и по таблице (приn>20) находится вероятность (P).

3. Определить необходимую численность выборки (n), обеспечивающую с определенной вероятностью заданную точность ().

Формулы для n определяются из соответствующих формул предельной ошибки.

Так, для определения средней () из формулыприповторном отборе имеем:

.

Для доли аналогично из получаем:

.

При бесповторном отборе из иимеем:

−для средней ();

−для доля (w).

Как видно, в формулах для определения необходимой численности выборки, получаемых из формул случайной ошибки выборки, предполагается обязательное знание величины дисперсии признака () или [w (1w)].

Обычно в этих формулах используется значение дисперсии признака в аналогичных предшествующих исследованиях или же проводится пробное обследование небольшого числа единиц, для которых определяется значение . В случае изучения доли определенных единиц в совокупности при отсутствии каких-либо сведений о дисперсии принимается максимальное значение [w (1w)], равное 0,25.

Рассмотрим решение некоторых задач к этой теме с применением формул предельной ошибки выборки.

Задача 1.

Методом собственно случайной выборки обследована жирность молока у 100 коров. По данным выборки средняя жирность молока оказалась равной 3,64%, а дисперсия составила 2,56.

Определить: а) среднюю ошибку выборки; б) с вероятностью, равной 0,954, предельные значения генеральной средней.

Решение.

А. Формула средней ошибки выборки: .

По условию n = 100, =2,56. Отсюда

Б. Формула предельной ошибки выборки: .

По таблице значений F(t) при P = 0,954 находим, что t = 2. Отсюда , или, т.е. предельные значения жирности молока (или доверительный интервал генеральной средней) определяются как.

Задача 2.

На основе выборочного обследования 600 рабочих (n = 600) одной из отраслей промышленности установлено, что удельный вес численности женщин составил 0,4 (w = 0,4).

С какой вероятностью можно утверждать, что при определении доли женщин, занятых в отрасли, допущена ошибка (), не превышающая 5% (0,05)?

Решение.

Чтобы определить вероятность допуска той или иной ошибки, из формулы находим показательt, связанный с вероятностью:

По таблице значений F(t) для t=2,5 находим, что P=0,988, т.е. с вероятностью 0,988 можно утверждать, что при определении доли женщин (0,4) в общем числе рабочих допущена ошибка не более 0,05 (5%).

Задача 3.

Сколько рабочих завода нужно обследовать в порядке случайной выборки для определения средней заработной платы, чтобы с вероятностью (P),равной 0,954, можно было бы гарантировать ошибку не более 50 руб.? Предполагаемое среднее квадратическое отклонение заработной платы =200 руб.

Решение.

Из формулы находимn:

(человека).

Контрольные вопросы к теме:

  1. Дайте определение выборочного наблюдения. Для чего в экономике применяют выборочное наблюдение.

  2. Перечислите и охарактеризуйте виды выборочного наблюдения.

  3. Расскажите об ошибках выборочного наблюдения, от каких факторов они зависят.

  4. Расскажите о предельной ошибке выборки, какие задачи позволяют решить формулы предельной ошибки выборки.