- •Ссэи рэу им. Г.В. Плеханова
- •Тема 1. Предмет, метод и задачи статистики
- •Методические указания
- •Тема 2. Статистическое наблюдение
- •Методические указания
- •Тема 3. Статистическая сводка и группировка
- •Методические указания
- •Ряд распределения рабочих по тарифному разряду
- •Ряд распределения рабочих по уровню квалификации
- •Задачи для самостоятельной работы
- •Тема 4. Абсолютные и относительные величины
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 5. Средние величины и показатели вариации
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 6. Индексы
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 7. Ряды динамики
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 8. Выборочное наблюдение
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 9. Статистическое изучение связи между признаками
- •Методические указания
- •Задачи для самостоятельной работы
- •План для самоконтроля
- •Список рекомендуемой литературы
Методические указания
Эта тема связана со многими другими темами курса теории статистики, а также с математической статистикой и теорией вероятностей, в которых дается математическая теория закона больших чисел, являющаяся теоретической основой выборочного метода исследования.
Вначале здесь необходимо выяснить причины применения выборочного наблюдения, далее надо ознакомиться с основными его понятиями. Один из вопросов темы – виды выборки (повторная и бесповторная) и способы отбора, обеспечивающие репрезентативность выборки (случайный или собственно случайный, механический, типический, серийный).
Главными вопросами этой темы являются определение средней ошибки выборки собственно случайного отбора – для средней и для доли; предельной ошибки выборки при заданном уровне вероятности; пределов для средней и для доли; необходимой численности выборки (объема выборки).
Для успешного усвоения темы 8 необходимо ознакомиться с представленным теоретическим материалом и целесообразно решить предлагаемые задачи.
Выборочное наблюдение (ВН) – один из видов несплошного наблюдения. Выборочным наблюдением называют такое несплошное наблюдение, при котором статистическому обследованию подвергаются не все единицы изучаемой совокупности, а лишь отобранные случайным образом.
Цель ВН состоит в том, чтобы по характеристикам отобранной части единиц судить о характеристиках всей совокупности.
Причины применения ВН:
экономия времени и средств в результате сокращения объема работ;
минимум порчи или даже уничтожения исследуемых объектов;
необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц;
достижение большей точности результатов обследования.
При изучении темы необходимо усвоить следующие понятия:
а) генеральная совокупность – вся изучаемая совокупность (общее число рабочих завода). Объем генеральной совокупности обозначают N;
б) выборочная совокупность – часть генеральной совокупности, отобранная для ВН. Число единиц выборочной совокупности обозначают n;
в) генеральная средняя () – средняя величина признака для генеральной совокупности;
г) выборочная средняя () – средняя величина признака для выборочной совокупности;
д) генеральная доля (p) – отношение числа единиц генеральной совокупности, обладающих значением изучаемого признака ко всему числу единиц генеральной совокупности;
е) выборочная доля (w) – отношение числа единиц выборочной совокупности, обладающих значением изучаемого признака к числу единиц выборочной совокупности, т.е. это доля признака в выборочной совокупности.
Различают повторную и бесповторную выборку. При повторной выборке единицы генеральной совокупности, попавшие в выборку, вновь возвращаются после обследования в генеральную совокупность и участвуют в дальнейшей процедуре отбора, а при бесповторной – не возвращаются.
Примером повторной выборки является обследование пассажиропотока на городском транспорте, а бесповторной – выборочное изучение качества какой-либо продукции. Бесповторная выборка применяется чаще, чем повторная.
Различают следующие основные способы отбора:
случайный (собственно случайный);
типический;
серийный (гнездовой);
механический.
Первые три способа отбора могут быть проведены с помощью повторной или бесповторной выборки, механический отбор производится только с помощью бесповторной выборки.
В процессе ВН возникают специфические ошибки – ошибки репрезентативности(ОР). Они возникают вследствие различия структуры выборочной и генеральной совокупностей. В общем виде ОР – это разность между обобщающими выборочными показателями и соответствующими показателями генеральной совокупности. ОР для средней – это , а для доли –.
Для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
Средняя ошибка выборки показывает, на сколько в среднем отклоняются выборочные характеристики от генеральных. Если обследуется признак в форме средней, то средняя ошибка выборки () определяется:
а) при повторной выборке:
,
где – выборочная дисперсия,
–объем выборки;
б) при бесповторной выборке:
,
где N – объем генеральной выборки,
–доля выборки.
Вторая формула может быть использована не только для собственно случайного отбора, но и для механического.
Если обследуется признак в форме доли, то средняя ошибка выборки () определяется:
а) при повторной выборке:
,
где w – доля признака в выборочной совокупности;
б) при бесповторной выборке:
.
Заметим, что формулы повторной и бесповторной выборки отличаются на выражение , которое всегда меньше единицы. Из этого следует, что средняя ошибка выборки при бесповторном отборе меньше средней ошибки выборки при повторном отборе.
При проведении выборочного наблюдения исследователя устраивает средняя ошибка выборки в определенных границах. Поэтому необходимо ориентироваться на предельную ошибку выборки при заданном уровне вероятности.
Предельная ошибка выборки () – это наперед заданное сколь угодно малое число, которое определяется по формуле:
,
где – коэффициент доверия, зависящий от вероятности, определяется по соответствующим таблицам (если, например, =0,954, то =2, если =0,997, то =3).
Таким образом, предельная ошибка выборки равна t-кратной средней ошибки. Для ее определения при заданном уровне вероятности необходимо: а) определить среднюю ошибку выборки () – по соответствующей формуле, б) исходя из заданной вероятности , с помощью специальных таблиц, найти число , соответствующее вероятности, в) найти произведение .
Пределы (вероятные границы, доверительные интервалы), в которых находятся соответствующие генеральные показатели, устанавливаются по следующим формулам:
1) для средней:
,
где – генеральная средняя;
–выборочная средняя;
–предельная ошибка выборочной средней;
2) для доли:
,
где – генеральная доля;
w – выборочная доля;
–предельная ошибка выборочной доли.
Определение объема выборки (n) при заданной ее точности является проблемой, обратной рассмотренной ранее – определение предельной ошибки выборки при данном ее объеме. Формула объема выборки – в четырех вариантах – получается из соответствующей формулы предельной ошибки.
Если обследуется признак в форме средней, то объем выборки при повторной выборке определяется:
;
при бесповторной выборке:
.
Если обследуется признак в форме доли, то объем выборки при повторной выборке определяется:
,
при бесповторной выборке:
.
Для успешного усвоения темы целесообразно решить предлагаемые типовые задачи.
Типовая задача 1
Для определения среднего срока пользования краткосрочным кредитом в банке была проведена пяти процентная бесповторная выборка, в которую попало 100 счетов. В результате обследования установлено, что средний срок пользования краткосрочным кредитом – 30 дней при среднем квадратическом отклонении – 9 дней. В пяти счетах срок пользования кредитом превышал 60 дней.
С вероятностью 0,954 определите пределы, в которых будет находиться срок пользования краткосрочным кредитом в генеральной совокупности и доля счетов со сроком пользования более 60 дней.
Для определения пределов, в которых будет находиться срок пользования краткосрочным кредитом в генеральной совокупности, рассчитаем среднюю и предельную ошибки выборки. Так как отбор бесповторный и обследуется признак в форме средней, то воспользуемся следующими формулами:
- средняя ошибка выборки:
;
- предельная ошибка выборки:
.
Для вероятности 0,954 t=2. Следовательно, дней.
Тогда пределы, в которых будет находиться срок пользования краткосрочным кредитом в генеральной совокупности, определяются как:
,
,
.
Срок пользования краткосрочным кредитом находится в границах от 28,2 до 31,8 дней.
Определим долю счетов со сроком пользования более 60 дней.
Выборочная доля счетов со сроком пользования более 60 дней равна:
.
Средняя ошибка выборки для доли счетов со сроком пользования более 60 дней определяется по формуле:
,
.
Предельная ошибка выборки для доли счетов со сроком пользования более 60 дней равна:
.
Тогда пределы, в которых будет находиться доля счетов со сроком пользования более 60 дней, равны:
,
,
.
Удельный вес счетов со сроком пользования более 60 дней находится в границах от 1 до 9%.
Типовая задача 2
Произведено выборочное обследование длительности производственного стажа рабочих. В выборку было взято 200 рабочих из общего количества в 1000 человек. Результаты выборки следующие:
Стаж, лет |
2-4 |
4-6 |
6-8 |
8-10 |
Число рабочих |
50 |
80 |
45 |
25 |
На основании приведенных данных определить:
1) с вероятностью 0,954 возможные пределы колебаний средней продолжительности стажа всех рабочих;
2) какое число рабочих надо взять в выборку, чтобы ошибка не превышала 0,5 года на основе приведенных выше показателей.
Возможные пределы колебания среднего стажа рабочих:
,
гдепредельная ошибка определяется по формуле .
Определим средний стаж и дисперсию стажа работников и подставим полученные значения в формулу предельной ошибки выборки:
лет,
года.
,
.
Средний стаж рабочих предприятия с вероятностью 0,954 находится в границах от 5,25 до 5,75 года.
Объем выборки рассчитывается по следующей формуле:
рабочих.
Для выполнения поставленных условий необходимо обследовать 58 рабочих.