Тема 5.Статистические распределения и их основные характеристики.
5.1. Вариация признаков совокупности. Ряды распределения и их статистическое изучение. Различия в величинах того или иного количественного признака у отдельных единиц совокупности, носит название вариации признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности, является важнейшим вопросом любого статистического исследования. Изучение вариации возможно с помощью построения статистических рядов распределения. Ряды распределения построены по качественному признаку и называются атрибутивными, а по количественному вариационными. В статистики различают признаки дискретные и непрерывные. Дискретные признаки принимают значения, которые отличаются друг от друга на некоторую конечную величину. Непрерывными признаки принимают значения, которые отличаются между собой насколько угодно малую величину и в определённых границах могут принимать любые значения.
5.2. Построения ряда распределения дискретного признака.
Предположим имеются данные о квалификации двадцати рабочих производственного участка.
Тарифный разряд Xi |
Число рабочих fi |
Частость или относительная величина Wi |
Накопленная чистота Si |
Xifi |
2 3 4 5 6 |
1 5 ←8 4 2 |
0,05 0,25 0,40 0,20 0,10 |
1 6 14 18 20 |
2 15 32 20 12 |
Итог |
20 |
1,00 |
X |
81 |
Wi = fi
∑fi
5.3. Построение вариационного ряда (непрерывный признак) построения.
Для построения данного вариационного ряда используем данные по средней квартальной прибыли в миллионов рублей 20-ти коммерческих банков.
Xi – 3,7; 4,3; 6,7; 5,6; 5,1; 8,1; 4,6; 5,7; 6,4; 5,9; 5,2; 6,2; 6,3; 7,2; 7,9; 7,6; 7; 6,9.
Формула Стэрджесса:
M = 1,0 + 3,322 lgN = 1,0 + 3?322 * 1,301 = 5,32 →5гр.
……………
Прибыль в миллионах рублей. X |
Число банков F |
Xi |
Xifi |
|
|
|
|
3,7 – 4,6 4,6 – 5,5 5,5 – 6,4 6,4 – 7,3 7,3 – 8,2 |
2 4 6 5 3 |
4,15 5,05 5,95 6,85 7,75 |
8,30 20,20 35,70 34,25 23,25 |
|
|
|
|
Итого: |
20 |
X |
121,70 |
|
|
|
|
3,7 – 4,6 |
// 2 |
4,6 – 5,5 |
//// 4 |
5,5 – 6,4 |
////// 6 |
6,4 – 7,3 |
////// 5 |
7,3 – 8,2 |
/// 3 |
К эти показателям относится среднее арифметическое, мода и медиана.
Мода для дискретного признака является наиболее часто встречающимися его значения. Для непрерывного признака мода находится по специальной формуле и представляет с собой уже среднее значение признака, которое соответствует наибольшему числу единиц совокупности.
Модальный интервал – это интервал с наибольшей чистотой.
H – это величина интервала
Лекция.
5.4.Статистические показатели вариации признака совокупности. Для изменения вариации признака, применяются различные статистические показатели к которым относятся:
1.равзмах вариации – это интервал в котором находится значение всех единиц данной совокупности.
1) X = Xmax –Xmin = 8,1 – 3,7 = 4,4 (млн.руб.)
Достоинства у этого показателя, является простота расчёта, а недостатком его слабая аналитическая пригодность. Точнее характеризует вариацию показатели, основанные на учёте отклонений индивидуальных значений признака под средние величины. (Xi – x) таким показателем является среднее линейное отклонение и обозначается как
∑│xi - x│fi 17,640
2) d = ∑fi = 20 = 0,882 (млн.руб.)
Знак модуль необходим для того, чтобы числитель дроби не ровнялся нулю. В связи с нулевых свойством средней арифметической.
Дисперсия
3) ….формула
5.6.Вариация банка по прибыли не высокая. Правило (теорема) сложения дисперсий. Если статистическая совокупность разбита на группы, по какому-либо качественному или количественному, факторному признаку, то общая дисперсия результативного признака, то общая дисперсия результативного признака будет равна сумме двух её составляющих:
- межгрупповая дисперсия – характеризует вариация результативного признака, которая вызвана влиянием факторного признака, поэтому средняя из внутригрупповых дисперсий измеряет уровень вариации,
- средняя из внутригрупповых дисперсий
Лекция
Данные о производительности труда (выработка число детали за смену) 10 рабочих производственного участка и стажа их работы по данной специальности:
Производительность труда |
|||||||||
Стаж до 10 лет |
Стаж до 10 лет и более |
||||||||
62 |
68 |
82 |
88 |
105 |
84 |
93 |
95 |
101 |
102 |
Требуется найти общую дисперсию результативного признака.
1.проверить правила сложения дисперсии
2.проверить правила сложения дисперсии
3.измерить степень тесноты связи между производительности труда и стажем работы рабочих.
Проверить правила сложении дисперсии значит – рассчитать общую дисперсию с помощью другой формулы, и получить тот же самый результат, тогда проверка будет выполнена.
5.8.коэфициенты децельной и фондовой дифференциации. Анализ вариации в рядах распределения может быть заполнен показателями дифференциации.
…………………………
Если представлены сгруппированные данные, то для характеристики дифференциации можно воспользоваться коэффициентом децельной дифференциации.
…………………………….
График!
Прямая ОА – это прямая равномерного распределения или она называется прямая равенства.
Площадь, которая находится между прямой ОА и кривой Лоренса, называется площадью концентрации, чем больше площадь концентрации, тем не равномернее распределяется признак в совокупности и наоборот, чем меньше площадь концентрации, т.е. когда кривая стремится к прямой линии, тем равномернее распределяется признак совокупности. Измерять уровень концентрации можно с помощью показателя – коэффициент джинни, расчёт которого базируется на сопоставлении площади концентрации с площадью треугольника ОБА. Коэффициент джинни измеряется в %.
Коэффициент джинни
Кдж. = ∑(Qi +1Pi - ∑Qi *Pi + 1) * 100% = (3,6258 – 3,3709) * 100% = 25,5%