- •Утверждаю
- •Одномерный статистический анализ Лекция № 1
- •Введение.
- •Генеральная совокупность значений
- •1.1.1. Погрешности (ошибки) результатов (наблюдений) при проведении исследований.
- •1.1.2. Типы выборок при использовании статистических методов управления качеством продукции.
- •Лекция № 2
- •1.1.3. Однородность и репрезентативность выборки.
- •1.1.4. Среднее и дисперсия выборки.
- •Лекция № 3
- •1.1.5. Средняя квадратическая ошибка выборки
- •1.1.6. Определение необходимой численности выборки.
- •1.1.7. Малые выборки.
- •1.2. Графическое изображение и основные характеристики вариационного ряда. Лекция № 4
- •1.2.1. Графическое изображение рядов распределения.
- •- Тарифный разряд рабочего; - число рабочих (частота).
- •Теоретической кривой нормального распределения.
- •- Тарифный разряд рабочего; - число рабочих (накопленная частота).
- •1.2.2. Основные показатели (характеристики) ряда распределения.
- •Лекция № 5
- •Относительное линейное отклонение
- •Коэффициент вариации
- •Лекция № 6
- •И отрицательным (справа) эксцессом.
- •В зависимости от расстояния от среднего значения.
- •Лекция № 7
- •Лекция № 8
- •1.3. Виды статистических оценок параметров распределения. Лекция № 9
- •1.4. Дополнительные показатели распределения:
- •Контрольные вопросы по разделу 1.
1.1.6. Определение необходимой численности выборки.
Как уже отмечалось, средняя квадратическая (стандартная) ошибка выборки зависит от объема выборки и степени вариации исследуемого признака в генеральной совокупности. Уменьшение стандартной ошибки выборки, а следовательно, увеличение точности оценки, всегда связано с увеличением объема выборки (1.4). В этой связи уже на стадии организации выборочного наблюдения (экспериментального исследования) приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений. Из формулы (1.5) предельной ошибки выборки для случая простой случайной повторной выборки с учетом формулы (1.4) легко получить зависимость для установления необходимого объема выборки
. (1.6)
Рассмотрим установление численных значений составляющих этой формулы.
1. При проектировании выборочного наблюдения (экспериментального исследования) предполагается заранее заданной величина допустимой предельной ошибки выборки в соответствии с задачами конкретного исследования.
2. Также заранее задается уровень доверительной вероятности , с которым можно утверждать о полученных результатах и выводах.
Знание уровня доверительной вероятности позволяет, используя центральную предельную теорему Ляпунова (1.3), найти соответствующее числовое значение табличного распределения (критерия) Стьюдента. Делается это следующим образом. Заданный уровень доверительной вероятности соответствует вероятности в этой формуле, т. е. правая часть этого равенства, а именно – значение интегральной функции Лапласа становится известным. Используя таблицы распределения функции Лапласа, можно по известному значению функции найти ее аргумент, которым является табличное значение Стьюдента (обратная задача).
3. До проведения исследования остается неизвестной величина дисперсии . Если закон распределения заранее неизвестен, то можно использовать метод пробных обследований (пробных выборок). Можно использовать известные результаты аналогичных исследований, проведенных в адекватных условиях.
Предварительная оценка дисперсии существенно упрощается, если обоснованно предположить наличие нормального закона распределения.
Тогда можно использовать так называемое правило «трех сигм». Оно вытекает из приближенного значения вероятностей для нормального закона распределения.
Если брать приближенные значения вероятностей, то получатся удобные для запоминания правила:
1) вероятность стандартного отклонения равна 2/3 (правило сигмы);
2) вероятность удвоенного стандарта равна 95 % (правило двух сигм);
3) вероятность утроенного стандарта равна 1 (правило трех сигм).
Считая, что вероятность, равную 1, могут иметь только достоверные события, последнему правилу можно придать следующую формулировку: отклонения, большие, чем утроенный стандарт, практически невозможны.
Исходя из последнего правила можно считать, что размах генеральной совокупности , откуда . Предельные допустимые значения исследуемого признака в генеральной совокупности обычно известны. Например, действительные размеры изделия лежат в пределах допусков на их изготовление.
Когда информации о дисперсии недостаточно, используют метод последовательных приближений. Задаются объемом выборки, проводят исследования, определяют выборочную дисперсию и, принимая ее за генеральную, проверяют выборку на репрезентативность по формуле (1.6).