- •Лабораторная работа №1 Вариационный ряд. Его основные показатели
- •Основные показатели вариационного ряда (вариации)
- •Практическое задание
- •Лабораторная работа №2 Числовые характеристики и законы распределения случайных величин
- •Числовые характеристики распределения случайной величины
- •Форма распределения
- •Практическое задание
- •Формулы расчета средней ошибки выборки для различных способов формирования выборочной совокупности
- •Постановка задачи
- •Результаты выборочного обследования жилищных условий жителей города
- •Практическое задание
- •Результаты обследования рабочих предприятия.
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности.
- •Определение оптимального объема выборки
- •Задачи для самостоятельного решения
- •Лабораторная работа №4 Нормальное распределение. Критерии согласия
- •Построение нормального распределения по эмпирическим данным
- •Критерии согласия
- •- Критерий Пирсона
- •Критерий Романовского
- •Критерий Колмогорова
- •Практическое задание Задача 1
- •Указания к решению
- •Задача 2
- •Указания к решению
- •Задача 3
- •Указания к решению
- •Задача 4
- •Задача 5
- •Темы для самостоятельного изучения Задачи математической статистики
- •Сравнение характеристик областей применения аппарата теории вероятностей и математической статистики
- •Этапы решения задачи описания эмпирических (полученных в результате опыта) данных вероятностными моделями
- •Оценки неизвестных параметров
- •Точечные оценки
- •Метод Монте - Карло
- •Вычисление определенного интеграла методом статистических испытаний (методом Монте - Карло)
- •Элементы теории случайных процессов
- •Уравнения Колмогорова – Чемпена
Определение оптимального объема выборки
Вторая задача выборочного наблюдения заключается в определении объема выборки (n), при котором с заданной вероятностью средняя ошибка выборки не превосходит некоторой заранее заданной величины.
Для определения необходимой численности выборки исследователь должен задать уровень точности выборочной совокупности с определенной вероятностью. Эта вероятность =Ф(t) позволяет с помощью таблиц найти соответствующее ей значение коэффициента доверия t, используемого в формулах.
Величина, которую не должна превосходить средняя ошибка выборки, - это уже известная нам предельная ошибка выборки, обозначаемая .
Необходимый объем выборки определяется по формулам:
-
при повторной выборке
-
при бесповторной выборке
Из формулы видно, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки n. Так, увеличение допустимой ошибки выборки в 2 раза уменьшает необходимый ее объем в 4 раза. Необходимая численность выборки прямо пропорциональна дисперсии признака и коэффициенту доверия.
Одним из наиболее важных и в то же время сложных вопросов определения необходимого объема выборки в исследованиях является расчет показателя вариации изучаемого признака (). При подготовке выборочного наблюдения у его организаторов часто отсутствуют необходимые для этих вычислений данные. Основой оценки степени колеблемости изучаемого признака служат, как правило, материалы предыдущих обследований. Обращение к ним при отсутствии какой-либо другой информации вполне оправдано. Однако следует иметь в виду, что использование данных прошлых обследований имеет смысл только тогда, когда за прошедший до нового обследования период в генеральной совокупности не произошло значительных изменений.
Часто более точное представление об изучаемой совокупности может дать пробное обследование. По его данным можно рассчитать среднее квадратическое отклонение и дисперсию для последующего обоснования необходимого объема выборки.
Зная примерную величину средней, дисперсию можно найти из соотношения . Если известны xmax и xmin, то можно определить среднее квадратическое отклонение в соответствии с правилом «трех сигм»: , так как в нормальном распределении в размахе вариации «укладывается» 6 (3).
При расчете n не следует гнаться за большими значениями t и малыми значениями , так как это приведет к увеличению объема выборки, а следовательно, к увеличению затрат средств, труда и времени, вовсе не являющемуся необходимым.
Рассмотрим несколько примеров расчета объема выборки при различных способах отбора.
Пример 1. В микрорайоне города проживает 5000 семей. В порядке случайной бесповторной выборки предполагается определить средний размер семьи. Какое количество семей нужно обследовать, если ошибка выборочной средней не должна превышать 0,8 человек с вероятностью 0,954; а среднее квадратическое отклонение, полученное из материалов предыдущих обследований, равно 3 человека.
Решение: при =0,954 по функции Лапласа t=2. Тогда необходимая численность выборки n равна:
семей.
Пример 2. Для определения средней длины детали следует провести выборочное обследование методом случайного повторного отбора. Какое количество деталей надо отобрать, чтобы ошибка выборки не превышала 3 мм с вероятностью 0,997 при среднем квадратическом отклонении 6 мм (ошибка и среднее квадратическое отклонение заданы исходя из технических нормативов).
Решение: при =0,997 по функции Лапласа t=3, объем выборки рассчитывается следующим образом:
деталей.
Пример 3. В фермерских хозяйствах Кировской области 10000 коров. Из них в Зуевском районе - 5000, в Белохолуницком районе - 3000, в Лебяжском районе - 2000. С целью определения средней удойности предполагается провести типическую выборку коров с пропорциональным отбором внутри групп (механическим). Какое количество коров следует отобрать, чтобы с вероятностью 0,954 ошибка выборки не превышала 5 л, если на основе предыдущих обследований известно, что дисперсия типической выборки (внутригрупповая дисперсия) равна 1600?
Решение: рассчитаем необходимую численность типической выборки:
коров.
Необходимо отобрать 250 коров, из них:
в Зуевском районе: коров;
в Белохолуницком районе: коров;
в Лебяжском районе: коров.
Пример 4. На склад завода поступило 100 ящиков готовых изделий по 80 шт. в каждом. Для установления среднего веса деталей следует провести серийную выборку деталей методом механического отбора так, чтобы с вероятностью 0,954 ошибка выборки не превышала 2 г. На основе предыдущих обследований известно, что дисперсия серийной выборки равна 4. Определить необходимый объем выборки.
Решение:
ящика.
Замечание: n и N выражаются в ящиках, а не в штуках изделий.
Пример 5. Определите, сколько семей необходимо охватить собственно-случайной выборкой для определения доли семей, не имеющих детей с вероятностью 0,954 и предельной ошибкой 2%. Известно, что в регионе проживают 600 семей, и по результатам ранее проведенных обследований доля семей, не имеющих детей, составляет 25%.
Решение: при =0,954 по функции Лапласа t=2.
=2%=0,02; N=600; w=25%=0,25. Следовательно, дисперсия при изучении доли признака вычисляется по формуле =0,25*0,75=0,1875
семей.