- •Глава 8 выборочное наблюдение
- •Значение и теоретические основы выборочного наблюдения
- •Варианты повторной выборки из генеральной совокупности
- •Методы (алгоритмы) отбора единиц в выборочную совокупность
- •Реализация метода отбора-отказа для совокупиости а
- •Собственно-случайная (простая случайная) выборка
- •Результаты выборочного обследования жилищных условий жителей города
- •Расчет средней общей (полезной) площади жилищ, приходящейся на 1 чел., и дисперсии
- •8.4 Механическая (систематическая) выборка
- •Типическая (стратифицированная) выборка
- •8.6 Серийная выборка
- •Практика применения выборочного наблюдения в социально-экономических исследованиях
- •Основные понятия
- •Глава 10 статистическое изучение динамики социально-экономических явлений
- •Понятие и классификация рядов динамики
- •Число квартир, построенных предприятиями и организациями всех форм собственности и их средний размер в рф
- •Динамика продукции сельского хозяйства рф за 1997-2000 гг., млн руб.'
- •Сопоставимость уровней и смыкание рядов динамики
- •Дннямикя объема продукции*
- •Аналитические показатели изменения уровней ряда динамики
- •10.4 Компоненты ряда динамики
- •Виды трендовой компоненты и проверка гипотезы о существовании тенденции
- •Реализованная продукция производственного объединения
- •Методы анализа основной тенденции (тренда) в рядах динамики
- •1Почком.
- •Удельный вес воздушных судов, прибывших без опоздания по сравнению с расписанием за 1991-2001 гг.
- •Динамика урожайности зерновых культур в хозяйстве
- •10.7 Методы выявления периодической компоненты. Модели сезонных колебаний
- •Дмвамнка поквартальной продажи безалкогольных напитков • одной из республик за 1999-2001 гг.
- •Регрессионный анализ связных динамических рядов
- •Элементы прогнозирования и интерполяции
- •Прогнозные значения урожайности зерновых культур в хозяйстве на 2002-2005 гг.
- •Основные понятия
- •Глава 12 экономические индексы
- •Понятие экономических индексов. Классификация индексов
- •Рве. 12.1. Классификация экономических индексов
- •Индивидуальные и общие индексы
- •Агрегатный индекс как исходная форма индекса
- •12.4 Средние индексы
- •Основные формулы исчисления сводных, или общих, индексов
- •12.5 Выбор базы и весов индексов
- •Системы индивидуальных индексов
- •12.6 Индексы структурных сдвигов
- •Индексы пространственно-территориального сопоставления
- •Важнейшие экономические индексы и их взаимосвязи
- •12.9 Свойства индексов ласпейреса и пааше
- •Индекс Ласпейреса и Пааше
- •12.10 Идеальный индекс фишера
- •12.11 Индексы-дефляторы
- •Основные понятия
Расчет средней общей (полезной) площади жилищ, приходящейся на 1 чел., и дисперсии
Общая (полезная) площадь жилищ, приходящаяся
|
Число жителей /
|
Середина интервала X
|
rf
|
хУ
|
на 1 чел., кв. м
|
|
|
|
|
До 5,0
|
8
|
2,5
|
20,0
|
50,0
|
5,0-10,0
|
95
|
7.5
|
712,5
|
5343,75
|
10,0-15,0
|
204
|
12.5
|
2550,0
|
31875,0
|
Продолжение
Общая (полезная) площадь жилищ, приходящаяся на 1 чел., кв. м
|
Число жителей /
|
Середина интервала
|
V
|
^/
|
15,0-20,0
|
270
|
17,5
|
4725,0
|
82687,5
|
20,0-25,0
|
210
|
22,5
|
4725,0
|
106312,5
|
25,0-30,0
|
130
|
27,5
|
3575,0
|
98312,5
|
30,0 и более
|
83
|
32,5
|
2697,5
|
87668,75
|
Итого
|
1000
|
-
|
19005,0
|
412250,0
|
Средняя ошибка выборки составит:
Определим предельную ошибку выборки с вероятностью 0,954 (/=2):
Установим границы генеральной средней:
298
или
Таким образом, на основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в
пределах от 18,5 до 19,5 кв. м.
При расчете средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:
(8.6)
Если предположить, что представленные в табл. 8.4 данные являются результатом 5%-го бесповторного отбора (следовательно, генеральная совокупность включает 20 000 ед.), то средняя ошибка выборки будет несколько меньше:
Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней. Особенно ощутимо влияние поправки на бесповторность отбора при относительно большом проценте выборки.
Мы рассмотрели определение границ генеральной средней. Рассмотрим теперь, как определяются границы генеральной доли, т.е. границы доли единиц, обладающих тем или иным значением признака.
Воспользуемся еще раз данными табл. 8.4 для того, чтобы определить границы доли лиц, обеспеченность жильем которых составляет менее 10 кв. м. Согласно результатам обследования, численность таких лиц составила 103 чел. Определим выборочную долю и дисперсию:
299
Рассчитаем среднюю ошибку выборки:
Предельнахюшнбка выборки с заданной вероятностью составит:
Определим границы генеральной доли:
или
Следовательно, с вероятностью 0,954 можно утверждать, что доля лиц, имеющих менее 10 кв. м жилья на человека, в целом по данному городу находится в пределах от 8,4 до 12,2%.
Мы рассмотрели определение границ генеральной средней и генеральной доли по результатам уже проведенного выборочного наблюдения при известном объеме выборки или проценте отбора. На этапе же проектирования выборочного наблюдения именно объем выборочной совокупности и требует определения.
Чем больше объем выборки, тем меньше значения средней и предельной ошибок выборочного наблюдения и, следовательно, тем уже границы генеральной средней и генеральной доли. В то же время необходимо учитывать, что большой объем выборки приводит к удорожанию обследования, увеличению сроков сбора и обработки материалов, требует привлечения дополнительного персонала и соответствующего материально-технического обеспечения. Поэтому при подготовке выборочного наблюдения необходимо определить тот минимально необ-
,300
водимый объем выборки, который обеспечит требуемую точность подученных статистических характеристик при заданном уровне вероятности.
Представим формулу (8.4) следующим образом:
(8.7)
Отсюда можно вывести формулу для определения необходимого объема собственно-случайной повторной выборки:
(8.8)
Полученный на основе использования формулы (8.8) результат всегда округляется в большую сторону. Например, если необходимый объем выборки составляет 493,1 ед., то, обследовав 493 ед., мы не достигнем требуемой точности. Поэтому для достижения желаемого результата обследованием должны быть охвачены 494 ед. С другой стороны, рассчитанное значение необходимого объема выборки свободно может быть увеличено в большую сторону на несколько единиц. Если мы располагаем необходимыми ресурсами, если по причинам организационного порядка (компактность расположения единиц, фиксированная нагрузка на каждого регистратора и т.п.) мы вполне можем охватить больший объем, то включение в выборочную совокупность 500 или, например, 550 ед. только уменьшит значения полученных случайной и предельной ошибок.
Как видно из формулы (8.8), необходимый объем выборки будет тем больше, чем выше заданный уровень вероятности и чем сильнее варьирует наблюдаемый признак. В то же время повышение допустимой предельной ошибки выборки приводит к снижению необходимого ее объема.
Предположим, что в рассмотренном выше примере нас вполне устроят границы генеральной средней (средней площади, приходящейся на 1 чел.) с точностью 0,5 кв. м. Определим необходимый объем выборки:
301
Мы получили, что для определения с заданной точностью границ средней площади, приходящейся на 1 жителя, достаточно в порядке собственно-случайной повторной выборки обследовать 821 чел.
Расчет необходимого объема выборки предполагает, что организаторы выборочного наблюдения уже на этапе его проектирования располагают по крайней мере косвенными данными о вариации изучаемых признаков. Источниками таких данных могут служить:
• результаты обследования данного объекта в предшествующие периоды;
• результаты обследования аналогичных объектов (жителей других населенных пунктов, предприятий других регионов и т.п.);
• специально проведенное небольшое по объему выборочное обследование данного объекта, ставящее целью лишь изучение вариации наблюдаемых признаков.
При определении необходимого объема выборки для определения границ генеральной доли задача оценки вариации решается значительно проще. Если дисперсия изучаемого альтернативного признака неизвестна, то можно использовать ее максимальное возможное значение:
Пример. Предприятию связи с вероятностью 0,954 необходимо определить удельный вес телефонных разговоров продолжительностью менее 1 мин. с предельной ошибкой 2%. Сколько разговоров нужно обследовать в порядке собственно-случайного повторного отбора для решения этой задачи?
Для получения ответа на поставленный вопрос воспользуемся формулой (8.8) и будем ориентироваться на максимальную возможную дисперсию доли телефонных разговоров такой продолжительности. Расчет приводит к следующему результату:
302
Таким образом, обследованием должны быть охвачены не менее 2 500 разговоров на предмет их продолжительности.
Необходимый объем собственно-случайной бесповторной выборки может быть определен по следующей формуле:
(8.9)
Формула (8.9) выводится из формулы (8.4) при условии расчета средней ошибки выборки с поправкой на бесповторность отбора. При определении границ генеральной доли в знаменатель этой формулы подставляется допустимая предельная ошибка доли Д .
Пример. В табл. 8.4 представлены результаты 5%-го бесповторного выборочного обследования (следовательно, объем генеральной совокупности составляет 20 000 чел.). Воспользовавшись значением дисперсии, полученным на основе расчетов, произведенных в табл. 8.5, определим необходимую численность собственно-случайной бесповторной выборки для определения жилищных условий с предельной ошибкой, не превышающей 0,5 кв. м, при уровне вероятности 0,954:
Выполненный расчет показал, что для достижения заданной точности необходимо обследовать не менее 788 чел. Как и следовало ожидать, необходимая численность бесповторной выборки оказалась несколько меньше необходимой численности выборки при повторном отборе, полученной выше (821 чел.).
Укажем на одну особенность формулы (8.9). При проведении вычислений объем генеральной совокупности должен быть выражен только в единицах, а не в тысячах или в миллионах единиц. Например, подставив в данную формулу общую численность населения резона, выраженную в тысячах человек, мы не получим правильного эначения необходимой численности выборки, также выраженной в тысячах человек, как это иногда бывает в других расчетах. Результат вычислений будет неверен.
303