- •Тема 7. Основные понятия математической статистики
- •§1. Выборочный метод, основные понятия и принципы
- •§2. Статистическое распределение выборки
- •§3. Числовые характеристики выборочной совокупности
- •§4. Точечные оценки числовых характеристик генеральной совокупности
- •§5. Интервальные оценки числовых характеристик генеральной совокупности. Доверительный интервал
§3. Числовые характеристики выборочной совокупности
Статистическое распределение выборки содержит всю информацию о выборке. В ряде случаев нет необходимости в такой полной информации, кроме того, обилие числовых данных затрудняет их восприятие. Вычисление числовых характеристик позволяет максимально сжать информацию о выборке.
Выборочная средняя – это средняя арифметическая всех вариант в выборке, обозначается и вычисляется по формуле: (для группированной выборки) или (для негруппированной выборки).
Выборочная средняя характеризует среднюю варианту признака.
Выборочная дисперсия – это средняя арифметическая квадратов отклонений вариант от выборочной средней, обозначается и вычисляется по формуле: (для группированной выборки) или (для негруппированной выборки).
Выборочная дисперсия описывает разброс вариант относительно выборочной средней и характеризует точность измерений. Чем сильнее разброс значений относительно выборочной средней, тем больше выборочная дисперсия. Выборочная дисперсия всегда неотрицательна.
На практике более удобна формула , где .
Недостатком дисперсии является то, что ее размерность не равна размерности изучаемой величины, а является квадратом ее размерности. Например, если величина измеряется в метрах, то дисперсия – в м2. Для устранения этого недостатка используется следующая числовая характеристика.
Выборочное среднеквадратическое отклонение – это квадратный корень из выборочной дисперсии, обозначается и вычисляется по формуле . Оно характеризует то же самое, что и выборочная дисперсия, но его размерность равна размерности самой изучаемой величины.
Исправленная выборочная дисперсия:
Стандартное отклонение:
Стандартная ошибка (или ошибка средней):
Замечание: В большинстве случаев результаты исследований представляются в виде
§4. Точечные оценки числовых характеристик генеральной совокупности
В генеральной совокупности можно вычислить аналогичные числовые характеристики: генеральную среднюю, генеральную дисперсию и генеральное среднеквадратическое отклонение.
В силу указанных выше причин генеральная совокупность недоступна для исследования, поэтому вычислить данные характеристики невозможно, можно лишь оценить их по выборке. Можно дать оценки двух видов: точечные и интервальные. Точечная оценка дается одним числом, этим объясняется ее название (число отмечается на числовой оси точкой). Причем оценка будет тем точнее, чем больше объем выборки. Интервальная оценка дается в виде интервала.
Точечной оценкой генеральной средней является выборочная средняя.
Точечной оценкой генеральной дисперсии является исправленная выборочная дисперсия .
Точечной оценкой генерального среднеквадратического отклонения является стандартное отклонение .
Таким образом,
§5. Интервальные оценки числовых характеристик генеральной совокупности. Доверительный интервал
Если на основании выборочных данных дается оценка того или иного параметра генеральной совокупности, то при этом необходимо иметь в виду, что данная оценка является лишь приближенным значением неизвестного параметра. При малом объеме выборки значение точечной оценки может очень сильно отклоняться от истинного значения параметра. Вопрос состоит в том, как велико это отклонение.
Чтобы решить этот вопрос, используются интервальные оценки, которые даются в виде доверительного интервала.
Доверительный интервал – это интервал со случайными границами, в котором с заданной вероятностью находится значение параметра генеральной совокупности.
называется доверительной вероятностью, она характеризует надежность результатов. Чем выше , тем выше надежность, но при этом снижается точность. В медицинских и биологических исследованиях в качестве берут 0,9; 0,95 или 0,99.
Доверительный интервал может быть построен для различных числовых характеристик генеральной совокупности. Мы рассмотрим построение доверительного интервала для генеральной средней в том случае, когда исследуемая величина распределена по нормальному закону, выборка малого объема ( ), генеральное среднеквадратическое отклонение неизвестно.
В этом случае доверительный интервал строится по формуле: , где - вычисленная по выборке выборочная средняя, - квадратный корень из исправленной выборочной дисперсии (стандартное отклонение), - объем выборки, - коэффициент Стьюдента, вычисляемый по таблице. Он зависит от доверительной вероятности и числа степеней свободы .
Критические значения коэффициента Стьюдента для различной доверительной вероятности и числа степеней свободы f
Число степеней свободы f |
Доверительная вероятность |
Число степеней свободы f |
Доверительная вероятность |
||||
0,95 |
0,99 |
0,999 |
0,95 |
0,99 |
0,999 |
||
5 |
2,571 |
4,032 |
6,859 |
20 |
2,086 |
2,845 |
3,85 |
6 |
2,447 |
3,707 |
5,959 |
21 |
2,08 |
2,831 |
3,819 |
7 |
2,365 |
3,499 |
5,405 |
22 |
2,074 |
2,819 |
3,792 |
8 |
2,306 |
3,355 |
5,041 |
23 |
2,069 |
2,807 |
3,767 |
9 |
2,262 |
3,250 |
4,781 |
24 |
2,064 |
2,797 |
3,745 |
10 |
2,228 |
3,169 |
4,587 |
25 |
2,06 |
2,787 |
3,725 |
11 |
2,201 |
3,106 |
4,437 |
26 |
2,056 |
2,779 |
3,707 |
12 |
2,179 |
3,055 |
4,318 |
27 |
2,052 |
2,771 |
3,69 |
13 |
2,160 |
3,012 |
4,221 |
28 |
2,048 |
2,763 |
3,674 |
14 |
2,145 |
2,977 |
4,140 |
29 |
2,045 |
2,756 |
3,659 |
15 |
2,131 |
2,947 |
4,073 |
30 |
2,042 |
2,750 |
3,646 |
16 |
2,120 |
2,921 |
4,015 |
40 |
2,021 |
2,704 |
3,551 |
17 |
2,110 |
2,898 |
3,965 |
60 |
2,001 |
2,66 |
3,46 |
18 |
2,101 |
2,878 |
3,922 |
120 |
1,980 |
2,617 |
3,373 |
19 |
2,093 |
2,861 |
3,883 |
|
1,960 |
2,576 |
3,291 |
Доверительная вероятность характеризует надежность оценки генеральной средней, полученной с помощью доверительного интервала. Из таблицы значений коэффициента Стьюдента видно, что чем больше доверительная вероятность , тем больше коэффициент и, следовательно, больше длина доверительного интервала. Но увеличение длины доверительного интервала ведет к потере точности оценки . Таким образом, требование большей надежности оценки числовой характеристики ведет к потере точности этой оценки. При одной и той же надежности более точную оценку можно получить, если увеличить объем выборки n.
Величина , равная половине длины доверительного интервала, представляет собой наибольшее отклонение выборочной средней от генеральной средней , которое возможно при заданной доверительной вероятности . Она называется абсолютной погрешностью оценки генеральной средней по выборочной средней (или предельной ошибкой выборки).
Относительной погрешностью называют отношение абсолютной погрешности к величине выборочной средней, выраженное в процентах:
Задача. Из большой партии таблеток некоторого лекарственного препарата случайным образом были извлечены 8 таблеток. При измерении массы таблеток были получены следующие результаты (в мг): 151, 147, 152, 152, 151, 148, 151, 148.
Построить ряд распределения данной выборки.
Построить полигон частот.
Найти числовые характеристики выборки.
Дать точечные оценки числовым характеристикам генеральной совокупности.
Оценить истинную массу таблетки с помощью доверительного интервала с доверительной вероятностью .
Найти абсолютную и относительную погрешности.
Решение.