Добавил:
chemist5734494@gmail.com Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УСР 23БХ-1 / УСР_3_ Средние величины и показатели вариации колич

.docx
Скачиваний:
3
Добавлен:
01.05.2024
Размер:
19.17 Кб
Скачать

УСР№3 Средние величины и показатели вариации количественных признаков

**

23БХ-1

Основной характеристикой вариационного ряда являются средние величины: степенные (средняя арифметическая) и структурные (медиана, мода). Средняя величина – это наиболее типичное для совокупности значение признака.

В статистике выделяют несколько видов средних величин:

1. По наличию признака-веса:

а) невзвешенная средняя;

б) взвешенная средняя.

2. По форме расчета:

а) средняя арифметическая;

б) средняя гармоническая;

в) средняя геометрическая;

г) средняя квадратическая, кубическая и т.д.

В случае, если известны лишь экстремальные значения признака (хmin и хmax), средняя рассчитывается как корень квадратный произведения между ними.

Средняя гармоническая величина  – это сумма обратных значений вариант, деленная на их число.

Средняя геометрическая величина  – более точная характеристика при определении средних прибавок, прироста численности популяции или изменения линейных размеров за определенный промежуток времени.

Структурные средние.

Медиана (Ме) – это средняя величина, относительно которой вариационный ряд распределения делится на две половинки. Мода (Мо) – величина, которая встречается в данной совокупности наиболее часто.

Лимиты (lim) – значения минимальной xmin и максимальной xmax вариант совокупности. Например, для выборки (таблица 3): xmin = 4, xmax = 8.

Размах вариации (R) – это разность между максимальной и минимальной вариантами выборки, он отражает пределы изменчивости признака:

R = (xmax) – (xmin). Для выборки (таблица 3): R = 8 – 4 = 4.

Сумму квадратов отклонений вариант от их среднего значения называют девиатой (Dx):

Средний квадрат отклонений вариант от средней величины называется смещенной дисперсией (Variance):

 Чем менее однородна совокупность, тем большее значение будет иметь дисперсия.Для получения несмещенной дисперсии вводят поправку на смещенность , называемую поправкой Бесселя. В результате:

Нормированное отклонение – отклонение варианты от средней величины, отнесенное к величине среднего квадратического отклонения:Этот показатель позволяет измерять отклонения отдельных вариант от среднего значения и сравнивать их для разных признаков.

Квантили.

К структурным характеристикам вариационного ряда относятся квантили, отсекающие в пределах ряда определенную часть его членов (вариант). К ним относятся квартилидецили и перцентили (процентили или персентили).

Квартиль – величина, отсекающая 1/4 всех членов ряда. Три квартиля – q1q2q3 – делят весь вариационный ряд на четыре равночисленные части (кварты).

Дециль – величина, отделяющая 1/10 всех членов ряда. Девять децилей делят весь вариационный ряд на десять равных частей.

Соответственно, перцентиль (процентиль) (Pi) – величина, отделяющая 1/100 всех членов ряда. Девяносто девять перцентилей делят весь вариационный ряд на сто равных частей. В практике используются обычно перцентили: P3, P5, P10, P25, P50, P75, P90, P95, P97, причем P50 равен медиане, второму квартилю q2 и пятому децилю данного распределения. Между P25 и P75 и соответственно между q1 и q3 находится 50 % всех членов совокупности (P25 = q1 и P75 = q3), этот интервал называется интерквартильный диапазон (IQR).

исловые показатели, характеризующие генеральную совокупность некоторой случайной величины (изучаемого признака), называют генеральными параметрамиа числовые показатели, характеризующие выборку, – выборочными характеристиками или статистикамиГенеральные параметры принято обозначать буквами греческого алфавита, а выборочные – латинского. К выборочным характеристикам относятся , wdк соответствующим генеральным параметрам – генеральная средняя , генеральная дисперсия , среднее квадратическое отклонение генеральная доля Pd.

Выборочные характеристики являются приближенными оценками генеральных параметров. Это величины случайные, варьирующие вокруг своих параметров. Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Выборочная средняя  является оценкой генеральной средней , выборочная дисперсия  – оценкой генеральной дисперсии , среднее квадратическое отклонение  – оценкой стандартного отклонения выборочная доля wd – оценкой генеральной доли Pd.

Точечные оценки представляют собой числа («точки»), вычисляемые по случайной выборке.

Оценка называется несмещеннойесли ее математическое ожидание (сумма произведений отдельных значений xi случайной величины на их вероятности рi) совпадает со значением генерального параметра. Выборочная средняя  – несмещенная оценка генеральной средней , но выборочная дисперсия  и среднее квадратическое отклонение  оказываются смещенными относительно параметров  и . Поэтому для получения несмещенных дисперсии и СКО сумму квадратов отклонений нужно относить не к числу наблюдений, а к числу степеней свободы k = n – 1.

Статистические ошибки. Выборочные характеристики, как правило, не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой или ошибкой репрезентативностиСтатистические ошибки присущи только выборочным характеристикам, они возникают в процессе отбора вариант из генеральной совокупности. Ошибки обозначаются буквой Sв качестве индекса ставится показатель (параметр), ошибку которого рассчитывают.

Ошибки репрезентативности уменьшаются при увеличении объема выборкиЧем меньше ошибка, тем ближе выборочная характеристика к величине генерального параметра.

Существует несколько способов создания статистических выводов. Первый – построение доверительных интервалов. Второй – проверка статистических гипотез.

Интервальные оценкиПо известным выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью, называемой доверительной, находится генеральный параметр. В качестве доверительных используют вероятности Р1 = 0,95; Р2 = 0,99; Р3 = 0,999. Выбор того или иного порога доверительной вероятности осуществляется исходя из практических соображений той ответственности, с какой делаются выводы о генеральных параметрах. 

窗体顶端