- •Оглавление
- •Статистическое наблюдение
- •Группировка и сводка статистических данных
- •Обобщающие статистические показатели
- •3.1. Абсолютные величины
- •3.2. Относительные величины
- •3.3. Средние величины
- •3.3.1. Средняя арифметическая
- •3.3.1.1. Метод отсчёта от условного нуля
- •3.3.2. Средняя гармоническая
- •3.3.3. Средняя геометрическая
- •3.3.4. Средняя квадратическая
- •Вариационные ряды
- •Основные показатели вариационных рядов
- •Показатели среднего уровня
- •Средние степенные
- •Медиана
- •Показатели степени вариации
- •4.1.2.6. Виды дисперсий
- •4.1.2.6.1. Правило сложения дисперсий
- •4.1.2.6.2. Эмпирическое корреляционное отношение
- •4.1.2.6.3. Правило сложения дисперсий для доли признака
- •4.1.3. Показатели дифференциации и концентрации
- •4.1.3.1. Показатели дифференциации
- •20 – 30
- •50 – 60
- •4.1.3.2. Показатели концентрации
- •4.1.4. Показатели формы распределения
- •4.1.4.1. Моменты распределения
- •4.1.4.1.1. Начальные моменты
- •4.1.4.1.2. Условные моменты
- •4.1.4.1.3. Центральные моменты
- •4.1.4.2. Показатели асимметрии распределения
- •4.1.4.3. Показатели крутизны распределения
- •4.1.5. Кривые распределения
- •Нормальное распределение
- •Распределение Пуассона
- •Критерии согласия
- •Критерий согласия Пирсона
- •Критерий согласия Романовского
- •Критерий согласия Колмогорова
Нормальное распределение
Распределение непрерывной случайной величины x называют нормальным N(x, ), если соответствующая ей плотность распределения выражается формулой
или
где
x – значение изучаемого признака;
– средняя арифметическая ряда (центр распределения);
– дисперсия значений изучаемого признака;
- среднее квадратическое отклонение изучаемого признака;
– нормированное отклонение.
Кривая нормального распределения обладает рядом особенностей:
кривая симметрична и имеет максимум в точке
кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности;
чем больше отдельные значения отклоняются от , тем реже они встречаются;
кривая имеет две точки перегиба на расстоянии ± от ;
площадь между ординатами, проведёнными на расстоянии ± составляет 0,683, т.е. 68,3% всех частот находятся в пределах ±;
площадь между ординатами, проведёнными на расстоянии ± 2 составляет 0,954, т.е. 95,4% всех частот находятся в пределах ±;
площадь между ординатами, проведёнными на расстоянии ± 3 составляет 0,997, т.е. 99,7% всех частот находятся в пределах ±;
коэффициенты асимметрии и эксцесса равны нулю;
при неизменном , тем больше вытянута кривая вверх, а чем больше, тем кривая более плоская и вытянутая вдоль оси абсцисс.
при неизменной чем больше, тем больше максимальная ордината кривой.
исунокиенты асимметрии и эксцесса равны нулю
Алгоритм вычисления теоретических частот кривой нормального распределения:
вычислить среднюю арифметическую ряда
вычислить среднее квадратическое отклонение ;
вычислить нормированное отклонение каждого варианта от средней арифметической t
вычислить значение функции (t)
вычислить теоретические частоты
где
N – объём совокупности;
hi– длина интервала.
Распределение Пуассона
Распределение Пуассона выражается формулой
где
P(x) – вероятность того, что признак примет то или иное значение.
Графически распределение Пуассона представлено на рисунке
Распределение Пуассона наблюдается в совокупностях, число единиц которых достаточно велико (N ≥ 100), а доля единиц, обладающих большими значениями признака, мала. Средняя арифметическая ряда и дисперсия, как правило, совпадают или почти совпадают.
Алгоритм вычисления теоретических частот кривой распределения Пуассона:
вычислить среднюю арифметическую ряда
вычислить теоретические частоты
где
N – объём совокупности;
Критерии согласия
Выдвинутая гипотеза относительно того, к какому типу относится распределение, должна быть проверена с помощью критериев согласия. Критерии согласия, опираясь предполагаемый закон распределения, позволяют установить являются ли расхождения между теоретическими и эмпирическими частотами несущественными. Наиболее часто применяются критерии согласия Пирсона, Романовского и Колмогорова.
Критерий согласия Пирсона
Критерий согласия Пирсона (хи-квадрат):
где
k – число групп, на которые разбито эмпирическое распределение;
mi – наблюдаемая частота признака в i-й группе;
- теоретическая частота, рассчитанная по предполагаемому распределению.
По указанной выше формуле вычисляется расчётное значение критерия Пирсона. Затем его нужно сравнить с табличным значением, называемым критическим значением критерия согласия. Критическое значение зависит от уровня значимости и числа степеней свободы.
Уровень значимости () - вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. В статистических исследованиях используют три уровня значимости:
= 0,1 (в десяти случаях из ста может быть отвергнута правильная гипотеза);
= 0,05 (в пяти случаях из ста может быть отвергнута правильная гипотеза);
= 0,01 (в одном случае из ста может быть отвергнута правильная гипотеза).
Обычно используется значение 0,05.
Число степеней свободы (v) – разность числа групп в ряду распределения и числа связей:
Число связей (z) – число показателей эмпирического ряда, использованных при вычислении теоретических частот .
При выравнивании по кривой нормального распределения имеется три связи, т.к. три показателя . При выравнивании по кривой Пуассона две связи, т.к. два показателя.
Для распределения Пирсона составлены таблицы, в которых по выбранному уровню значимости и числу степеней свободы определяется критическое значение критерия согласия.
Критическое значения критерия Пирсона
Число степеней свободы v |
Уровни значимости |
|
Число степеней свободы v |
Уровни значимости | |||||||
0,10 |
0,05 |
0,01 |
|
|
0,10 |
0,05 |
0,01 | ||||
1 |
2,71 |
3,84 |
6,63 |
|
21 |
29,62 |
32,67 |
38,93 | |||
2 |
4,61 |
5,99 |
9,21 |
|
22 |
30,81 |
33,92 |
40,29 | |||
3 |
6,25 |
7,81 |
11,34 |
|
23 |
32,01 |
34,17 |
41,64 | |||
4 |
7,78 |
9,49 |
13,28 |
|
24 |
33,20 |
36,42 |
42,98 | |||
5 |
9,24 |
11,07 |
15,09 |
|
25 |
34,38 |
37,65 |
44,31 | |||
6 |
10,64 |
12,59 |
16,81 |
|
26 |
35,56 |
38,89 |
45,64 | |||
7 |
12,02 |
14,07 |
18,48 |
|
27 |
36,74 |
40,11 |
46,96 | |||
8 |
13,36 |
15,51 |
20,09 |
|
28 |
37,92 |
41,34 |
48,28 | |||
9 |
14,68 |
16,92 |
21,67 |
|
29 |
39,09 |
42,56 |
49,59 | |||
10 |
15,99 |
18,31 |
23,21 |
|
30 |
40,26 |
43,77 |
50,89 | |||
11 |
17,28 |
19,68 |
24,72 |
|
40 |
51,80 |
55,76 |
63,69 | |||
12 |
18,55 |
21,03 |
26,22 |
|
50 |
63,17 |
67,50 |
76,15 | |||
13 |
19,81 |
22,36 |
27,69 |
|
60 |
74,40 |
79,08 |
88,38 | |||
14 |
21,06 |
23,68 |
29,14 |
|
70 |
85,53 |
90,53 |
100,42 | |||
15 |
22,31 |
25,00 |
30,58 |
|
80 |
96,58 |
101,88 |
112,33 | |||
16 |
23,54 |
26,30 |
32,00 |
|
90 |
107,56 |
113,14 |
124,12 | |||
17 |
24,77 |
27,59 |
33,41 |
|
100 |
118,50 |
124,34 |
135,81 | |||
18 |
25,99 |
28,87 |
34,81 |
|
|
|
|
| |||
19 |
27,20 |
30,14 |
36,19 |
|
|
|
|
| |||
20 |
28,41 |
31,41 |
37,57 |
|
|
|
|
|
Если , то при заданном уровне значимости и гипотеза о несущественности (случайности) расхождения отклоняется и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
Если , то эмпирический ряд хорошо согласуется с выдвинутой гипотезой, и с вероятностью (1-) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно.
Если в эмпирическом ряду распределение задано частостями, то критерий Пирсона вычисляется по формуле:
где
k – число групп, на которые разбито эмпирическое распределение;
wi – наблюдаемая частость признака в i-й группе;
– теоретическая частость, рассчитанная по предполагаемому распределению.
При использовании критерия Пирсона необходимо, чтобы объём исследуемой совокупности был не меньше 50, а численность каждой группы не менее 5.