Равичев_Л_В_Статистика_Лекции_Задания_Вопросы_2016 / Статистика_2_Описательная_статистика / 0_Равичев_Л_В_Теория_статистики_Описательная_статистика
.pdf
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(19) |
|
где: xМе – |
нижняя граница |
медианного |
|
интервала; Ме – величина |
|
||||||||||||
медианного |
интервала; |
fi – частоты |
|
интервального ряда; SМе-1 – |
сумма |
|
|||||||||||
накопленных частот в интервалах, предшествующих медианному; fМе – |
|
||||||||||||||||
частота медианного интервала. |
|
|
|
|
|
|
|
|
|
|
|||||||
Пример. Ниже даны группы семей по среднемесячному доходу на1 |
|
||||||||||||||||
человека. Требуется для приведенного интервального ряда определить |
|
||||||||||||||||
серединное значение, т.е. медиану. |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Среднемесячный доход на |
|
Число |
|
Накопленная |
|
|
|||||||||||
|
человека, xi, руб. |
|
семей, fi |
|
частота, Si |
|
|
|
|
||||||||
|
до 900 |
|
|
10 |
|
|
10 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
900–1200 |
|
|
20 |
|
|
30 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
1200–1500 |
|
|
40 |
|
|
70 |
|
|
Медианный интервал |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1500–1800 |
|
|
10 |
|
|
80 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
свыше 1800 |
|
|
20 |
|
|
100 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сумма: |
|
|
100 |
|
|
- |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Решение: |
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- 30 |
|
|
|
|
|
|
|
|
|
Mе |
= 1200 + 300 |
2 |
= 1350 руб. |
(20) |
|
|||||||||
|
|
|
|
|
|
||||||||||||
|
|
|
40 |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Следовательно, 50 % семей имеют доход на одного человека <1350 руб. |
|
||||||||||||||||
Свойство |
медианы: |
сумма абсолютных отклонений чисел ряда от |
|||||||||||||||
медианы есть величина наименьшая, то есть: |
|
|
|
|
|||||||||||||
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
å |
|
xi - Me |
|
® min. |
|
|
(21) |
|
|||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
i =1 |
|
|
|
|
|
|
|
|
|
|
||
Дополнительно |
|
к медиане |
|
|
для |
|
характеристики |
структуры |
|||||||||
вариационного ряда исчисляют квартили, децили и процентили, которые |
|
||||||||||||||||
делят его по сумме частот соответственно на четыре, десять и сто равных |
|
||||||||||||||||
частей. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Подводя итог рассмотрению моды и медианы, особо следует отметить, |
|
||||||||||||||||
что |
данные |
два |
|
показателя |
|
часто |
|
используются |
вместо |
средней |
31
арифметической или вместе с ней. Конечно, чаще используют среднюю арифметическую, но для тех случаев, когда в совокупности имеется небольшое число единиц с чрезмерно большим или чрезмерно малым
значением |
исследуемого |
признака, в |
дополнение |
к |
средней |
|
арифметической целесообразно исчислять моду и особенно |
медиану, |
|||||
которые, |
в |
отличие от средней арифметической, не зависят |
от |
этих |
||
крайних, |
не характерных для совокупности значений признаков. |
|
|
|
3.3. Показатели вариации |
|
|
||
Средняя |
величина |
дает |
обобщающую |
характеристику |
вс |
совокупности изучаемого явления. Однако два распределения, имеющие |
|
||||
одинаковую |
среднюю арифметическую, могут значительно отличаться |
|
|||
друг от друга по степени рассеяния(вариации) признака. Для измерения |
|
||||
вариации признака применяются различные абсолютные и относительные |
|
||||
показатели вариации. |
|
|
|
|
Кабсолютным показателям вариации относятся следующие:
·размах вариации, который представляет собой разность между максимальным и минимальным значениями признака в совокупности:
R = xmax - xmin |
(22) |
Недостатком данного показателя является , точто размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов значений признака.
· среднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариант от их средней арифметической. Формулы для расчета среднего линейного отклонения:
для несгруппированных данных:
32
|
|
|
N |
|
|
|
|
N |
|
|||
|
|
|
å| xi - |
|
| |
|
|
|
|
å x i |
|
|
|
|
x |
|
где |
x |
(23) |
||||||
|
|
= ± |
i=1 |
, |
= |
i = 1 |
; |
|||||
|
d |
|||||||||||
|
|
|||||||||||
|
N |
|||||||||||
|
|
|
|
|
|
|
N |
|
для сгруппированных данных (взвешенное среднее линейное отклонение):
|
|
|
N |
|
|
|
|
|
|
|
|
N |
|
|
|
|
|
||||
|
|
|
å| xi - |
|
| fi |
|
|
|
|
å x i × f i |
|
|
|
||||||||
|
|
|
x |
где |
x |
= |
; |
|
(24) |
||||||||||||
|
|
= ± |
i=1 |
|
, |
|
|
i =1 |
|
|
|
||||||||||
|
d |
|
|
|
|
||||||||||||||||
|
|
N |
|
|
|
N |
|
||||||||||||||
|
|
|
|
åfi |
|
|
|
|
|
|
|
|
å f i |
|
|
|
|||||
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
i =1 |
|
|
|
|||||
· среднее квадратическое отклонение представляет собой среднюю |
|||||||||||||||||||||
квадратическую |
|
из отклонений |
отдельных |
|
вариант |
от |
их средней |
||||||||||||||
арифметической. |
|
Формулы |
|
для |
расчета |
среднего |
квадратического |
||||||||||||||
отклонения: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
для несгруппированных данных: |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
å x i |
|
|
|||||
|
|
|
|
å(xi - |
x)2 |
|
|
|
|
|
x |
|
= |
|
; |
|
|||||
σ = ± |
|
i=1 |
|
, |
|
где |
|
|
|
i = 1 |
|
(25) |
|||||||||
|
N |
|
|
|
|
N |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
для сгруппированных данных:
|
N |
|
|
|
|
N |
|
|
|
|
σ=± |
å(xi - |
x)2×fi |
, |
|
|
|
å x i × f i |
|
|
|
i=1 |
|
|
|
|
|
|
|
|||
где |
x = |
i = 1 |
|
. |
(26) |
|||||
N |
|
|||||||||
|
N |
|||||||||
|
åfi |
|
|
|
|
å f i |
|
|
||
|
i=1 |
|
|
|
|
i = 1 |
|
|
||
|
|
|
|
|
|
|
|
|
· дисперсия – квадрат среднего квадратического отклонения (σ2).
Среднее квадратическое отклонение и дисперсия используются в большинстве теорем теории вероятности и математической статистики,
что обусловливает их широкое применение на практике. Основные вычислительные свойства дисперсии:
· дисперсия постоянной величины равна 0;
33
·если все варианты значений признака уменьшить на одно и то же число, то дисперсия не изменится;
·если все варианты значений признака уменьшить в одно и то же число А раз (А – const), то дисперсия уменьшится в А2 раз.
Дисперсия может быть разложена на составные части, что позволяет
оценить |
влияние |
различных |
факторов, обусловливающих |
вариацию |
||||||
признака. |
Так, если |
при |
группировке |
совокупности |
по |
некоторому |
||||
признаку |
было |
образованоm |
однородных |
групп, |
общая |
дисперсия 2σ |
||||
может быть разложена на две составные :частимежгрупповую δ2 и |
||||||||||
остаточную ε2 (среднюю из внутригрупповых) дисперсию: |
|
|
|
|||||||
|
|
|
|
σ 2 |
= δ 2 + ε 2 . |
|
|
|
|
|
Межгрупповая |
дисперсия характеризует |
ту |
часть |
общей |
вариации |
|||||
признака, которая обусловлена делением совокупности на группы. Таким |
||||||||||
образом, |
она |
характеризует |
вариацию |
признака, обусловленную |
факторами, с которыми связано деление совокупности на группы. Поэтому
ее еще называют факторной дисперсией. Межгрупповая дисперсия равна среднему взвешенному квадрату отклонений групповых (частных) средних от общей средней:
m
å ( x j - x ) 2 × N j
|
|
δ 2 = |
|
j = 1 |
|
|
|
, |
|
|
|
|
|
m |
N j |
|
(27) |
||
|
|
|
|
|
|
|
|||
|
|
|
|
|
å |
|
|
|
|
|
|
|
|
|
j = 1 |
|
|
|
|
где Nj – численность единиц в j-й группе. |
|
|
|
|
|||||
Средняя |
из |
внутригрупповых |
дисперсий(или остаточная) |
||||||
характеризует остаточную вариацию, не связанную с группированием. То |
|||||||||
есть она характеризует вариацию признака, обусловленную прочими |
|||||||||
факторами, не |
|
связанными |
с |
делением |
совокупности |
на . группы |
Вычисляется она как средняя взвешенная из внутригрупповых дисперсий:
34
|
|
|
m |
|
|
|
|
|
|
|
å σ 2j |
× N j |
(28) |
||
ε |
2 |
= |
j = |
1 |
|
, |
|
|
|
m |
|
|
å N j
j = 1
где σ2j - дисперсия признака внутри j-й группы.
Очевидно, что чем больше межгрупповая дисперсияδ2 , тем лучше проведена группировка (выделенные при группировке группы сильнее различаются между собой). Поэтому межгрупповая дисперсия является критерием группирования для группировок с одинаковым числом групп.
Лучшей будет та группировка, у которой величина δ2 больше.
Пользуясь правилом сложения дисперсий σ2 = δ2 + ε 2 , можно всегда по двум известным дисперсиям отыскать третью– неизвестную, – а также судить о силе влияния группировочного признака.
Пример. Имеются следующие данные о времени простоя автомобиля под разгрузкой:
№ пункта |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
разгрузки |
|
|
|
|
|
|
|
|
|
|
Число грузчиков |
3 |
4 |
4 |
3 |
3 |
4 |
4 |
4 |
3 |
4 |
|
|
|
|
|
|
|
|
|
|
|
Время простоя, |
12 |
10 |
8 |
15 |
19 |
12 |
8 |
10 |
18 |
8 |
мин |
|
|
|
|
|
|
|
|
|
|
Проверить правило сложения дисперсий.
Решение:
1. Вспомогательная таблица для расчета среднего времени простоя под разгрузкой:
Время простоя под |
Число выполненных |
xi•fi |
|
|
|
|
|
|
|
разгрузкой xi, мин |
разгрузок, fi |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|||
8 |
3 |
24 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
2 |
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
2 |
24 |
|
|
= |
|
120 |
= 12 мин |
|
|
|
|
|
x |
|
||||
|
|
|
|
|
|||||
15 |
1 |
15 |
10 |
||||||
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
18 |
1 |
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19 |
1 |
19 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35
Сумма: |
|
|
10 |
|
|
|
|
120 |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
дисперсии: |
|
|
|
||||
2. Вспомогательная таблица для расчета общей |
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Время |
|
Число |
|
|
|
|
|
|
|
|
|
|
(xi - |
|
|
|
|
|||
простоя под |
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|||||
разгрузкой |
|
выполненных |
xi•fi |
xi - x |
(xi - x ) |
|
|
|
)2•fi |
|
|
|
|
|||||||
|
|
x |
|
|
|
|||||||||||||||
xi, мин |
|
разгрузок, fi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
3 |
|
24 |
-4 |
|
16 |
|
|
|
48 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
10 |
|
2 |
|
20 |
-2 |
|
4 |
|
|
|
8 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
12 |
|
2 |
|
24 |
0 |
|
|
0 |
|
|
|
0 |
σ2 |
= |
150 |
= 15 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
15 |
|
1 |
|
15 |
3 |
|
|
9 |
|
|
|
9 |
|
10 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
18 |
|
1 |
|
18 |
6 |
|
|
36 |
|
|
|
36 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
19 |
|
1 |
|
19 |
7 |
|
|
49 |
|
|
|
49 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Сумма: |
|
10 |
|
120 |
- |
|
|
- |
|
|
|
|
150 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. Расчет внутригрупповых дисперсий:
По первой группе (число грузчиков, участвующих в разгрузке – 3).
Время |
Число |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
простоя под |
|
|
|
|
|
|
|
2 |
|
(xi - |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
выполненных |
xi•fi |
xi - x1 |
(xi - x1 ) |
|
|
|
|
|
|
||||||||||||
разгрузкой |
|
|
|
)2•fi |
|
|
|
|
|
|
|
|
|
||||||||
|
|
x |
|
|
|
|
|
|
|||||||||||||
xi, мин |
разгрузок, fi |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
= |
64 |
|
=16 мин |
||
|
|
|
|
|
|
|
|
|
|
|
|
x |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
12 |
1 |
12 |
-4 |
|
16 |
|
|
16 |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
15 |
1 |
15 |
-1 |
|
1 |
|
|
|
1 |
|
|
|
|
|
|
|
30 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
σ2 |
= |
=7,5 |
||||||
18 |
1 |
18 |
2 |
|
4 |
|
|
|
4 |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
4 |
|
|||
19 |
1 |
19 |
3 |
|
9 |
|
|
|
9 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Сумма: |
4 |
64 |
- |
|
|
- |
|
|
|
30 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
По второй группе (число грузчиков, участвующих в разгрузке – 4).
Время |
Число |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
простоя под |
xi•fi |
xi - |
|
|
|
|
1 )2 |
(xi - |
|
)2•fi |
|
|
|
|
|
|
|
|
||
выполненных |
|
1 |
(xi - |
|
x |
|
|
|
|
|
|
|
|
|||||||
x |
x |
|
|
|
|
56 |
|
|
||||||||||||
разгрузкой |
разгрузок, fi |
|
|
|
|
|
|
|
|
|
|
|
|
2 = |
|
= 9,33 мин |
||||
|
|
|
|
|
|
|
|
|
|
|
x |
|||||||||
xi, мин |
|
|
|
|
|
|
|
|
|
|
|
6 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
8 |
3 |
24 |
-1,33 |
1,77 |
5,31 |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
10 |
2 |
20 |
0,67 |
0,45 |
0,90 |
|
|
|
|
|
13,34 |
|
||||||||
|
|
|
|
|
|
|
s22 |
= |
= 2,22 |
|||||||||||
12 |
1 |
12 |
2,67 |
7,13 |
7,13 |
|||||||||||||||
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
||||
Сумма: |
6 |
56 |
- |
|
|
- |
|
13,34 |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4.Средняя внутригрупповая дисперсия:
ε2 = 7,5 × 4 + 2,22 ×6 = 4,33.
10 |
36 |
5.Межгрупповая дисперсия:
δ2 = (16 -12)2 ×4 + (9,33 -12)2 ×6 =10,67.
10
6. Общая дисперсия: |
|
|
|
|
|
|
|
|
|
|
||
|
σ 2 |
= δ 2 + ε 2 |
= 10,67 |
+ 4,33 |
= 15,00. |
|
|
|||||
Правило сложения дисперсий подтверждено. |
|
|
|
|
||||||||
При сравнении изменяемости различных признаков в одной и той же |
|
|||||||||||
совокупности или же при сравнении изменяемости одного и |
того |
же |
||||||||||
признака в нескольких совокупностях с различной величиной средней |
||||||||||||
арифметической |
используются относительные |
показатели вариации. |
|
|||||||||
Показатель относительной вариации рассчитывается как отношение |
||||||||||||
абсолютного |
показателя |
вариации |
к |
среднему |
значению. Самым |
|
||||||
распространенным |
относительным |
показателем |
вариации |
является |
||||||||
коэффициент вариации. Он представляет собой выраженное в процентах |
|
|||||||||||
отношение |
среднего |
квадратического |
отклонения |
к |
сред |
|||||||
арифметической: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V= |
|
σ |
|
100 % |
|
|
(29) |
|
||
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
x |
|
|
|
|
|
Кроме коэффициента вариации на практике используюткоэффициент осцилляции и относительное линейное отклонение.
Коэффициент осцилляции:
K R |
|
= |
R |
|
100 % |
(30) |
|||||||
|
|
|
|
||||||||||
|
|||||||||||||
|
|
|
|
|
|
|
|
x |
|
||||
Относительное линейное отклонение: |
|
||||||||||||
|
|
|
= |
|
|
|
|
|
|
|
|
100 % |
|
K |
|
|
d |
|
|||||||||
|
|
|
|
|
|
|
|
|
37 |
||||
|
|||||||||||||
d |
|
|
|
|
x |
||||||||
|
|
|
|
|
|
|
|
|
|
|
(31)
3.4. Вариация альтернативного признака
Альтернативный признак – качественный признак, имеющий две взаимоисключающие разновидности. Альтернативный признак принимает всего два значения: 1 – наличие признака; 0 – отсутствие признака. Для альтернативного признака характерно:
|
|
|
|
p + q = 1, |
(32) |
|||
где p - доля единиц, |
обладающих признаком; q – доля |
единиц, не |
||||||
обладающих признаком. |
|
|
|
|
|
|
|
|
Среднее значение альтернативного признака: |
|
|||||||
|
|
|
|
= |
(1 × p) + (0 × q) |
= p. |
(33) |
|
|
|
|
x |
|||||
|
|
|
|
|||||
|
|
|
|
|
p + q |
|
||
Дисперсия альтернативного признака: |
|
|||||||
σ2ап |
= |
(1 - p)2 × p + (0 - p)2 × q |
= p × q. |
(34) |
||||
|
||||||||
|
|
|
|
|
p + q |
Пример. Удельный вес основных рабочих в трех цехах предприятия составил: 80, 75 и 90 % общей численности рабочих. Определить дисперсию и среднее квадратическое отклонение доли основных рабочих по предприятию в целом, если численность всех рабочих трех цехов составила соответственно 100, 200 и 150 человек.
Решение.
1. Общая численность основных рабочих по предприятию:
n
åmoi =100 ×0,8 + 200 ×0,75 +150 ×0,9 = 365 чел.
i=1
2.Доля основных рабочих по предприятию:
|
n |
|
|
|
|
|
|
|
åmoi |
|
365 |
365 |
|
||
p = |
i=n1 = |
= |
= |
|
|
0,811. |
|
450 |
|||||||
|
åmi |
100 + 200 +1500 |
|
||||
|
|
|
|
|
|
i=1 |
38 |
|
3. Дисперсия альтернативного признака:
σ2 |
ап = p ×q =p ×(1- p)= 0,811×(1- 0,811)= |
0,1533. |
4. Среднее квадратическое отклонение:
σ = σ2 |
ап =0,1533 0,3915= |
. |
|
|
3.5. Показатели формы распределения |
|
|
|
|||||||
Из математической статистики известно, что если увеличивать объем |
|
|||||||||||
совокупности и уменьшать интервал группировки, изображая эти данные |
|
|||||||||||
графически, то полигон (гистограмма) распределения все более и более |
|
|||||||||||
будет приближаться к некоторой плавной линии, являющейся для него |
|
|||||||||||
пределом и носящей названиекривой распределения. Таким образом, под |
|
|||||||||||
кривой |
распределения понимается графическое |
изображение в |
виде |
|
||||||||
непрерывной |
линии |
изменения |
|
|
|
частот |
в |
вариационном, |
ря |
|||
функционально связанного с изменением вариант. |
|
|
|
|
||||||||
Выяснение общего характера распределения предполагает оценку его |
|
|||||||||||
однородности, а также вычисление показателей асимметрии и эксцесса. |
|
|
||||||||||
Для |
сравнительного |
анализа |
|
|
|
степени |
асимметрии |
нескольких |
||||
распределений |
рассчитывается относительный показатель |
асимметрии |
|
|||||||||
(коэффициент асимметрии): |
|
|
|
|
- Mo |
|
|
|
|
|
||
|
|
|
Ax |
= |
|
x |
|
(35) |
|
|||
|
|
|
|
|
σ |
б |
|
|||||
|
|
|
|
|
|
|
|
|
|
|||
|
f(x) |
а |
|
|
|
|
f(x) |
|
|
|
||
|
Ax<0 |
|
|
|
|
Ax>0 |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
Рис. 3. Виды асимметрии:
39
а – левосторонняя; б – правосторонняя
Величина коэффициента асимметрии может изменяться от -1 до +1 (для одновершинных распределений). Чем ближе по модулю коэффициент асимметрии к 1, тем асимметрия существеннее.
Наиболее точным и распространенным является расчет, основанный на использовании центрального момента третьего порядка:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M |
|
|
|
å(xi - |
x)3 |
1 |
|
|
|
|
|
(36) |
|
|||||||
|
|
|
|
Ax |
= |
|
3 |
= |
i=1 |
|
|
|
|
× |
|
. |
|
|
|
|
|
||||||||
|
|
|
|
|
σ3 |
|
N |
|
|
σ3 |
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
Показатель |
островершинности эксцесс |
представляет |
собой |
выпад |
|
||||||||||||||||||||||||
вершины |
эмпирического |
распределения |
вверх или вниз от вершины |
||||||||||||||||||||||||||
кривой |
|
нормального |
|
|
|
|
распределения. Он |
|
|
рассчитывается |
|
для |
|||||||||||||||||
симметричных |
распределений. |
|
Наиболее |
точным |
является |
показатель, |
|
||||||||||||||||||||||
использующий центральный момент четвертого порядка: |
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ex |
= |
μ 4 |
|
- 3 = |
å(xi - |
x)4 |
× fi |
× |
1 |
- 3. |
|
|
|
|
||||||||||||
|
|
|
|
i=1 |
|
|
|
|
|
|
(37) |
|
|||||||||||||||||
|
|
|
4 |
|
|
N |
|
|
|
4 |
|
|
|
||||||||||||||||
|
|
|
|
|
σ |
|
|
|
|
|
|
|
|
|
åfi |
|
|
|
|
σ |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
||
Для |
|
нормального |
|
|
|
распределения |
|
|
|
|
отношениеµ4/σ4 |
|
равно 3, |
|
|||||||||||||||
следовательно, эксцесс равен нулю. Наличие положительного эксцесса |
|
||||||||||||||||||||||||||||
означает, что распределение более островершинное, чем нормальное; |
|
||||||||||||||||||||||||||||
отрицательное |
значение |
|
|
эксцесса |
|
означает |
более |
плосковершинный |
|||||||||||||||||||||
характер распределения, чем у нормального. |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
3.6. Нормальное распределение и его свойства |
|
|
|
|
|||||||||||||||||||||||
В |
вариационных |
|
рядах |
|
|
|
существует |
|
|
|
определенная |
связь |
между |
||||||||||||||||
изменениями частот и значений варьирующего признака. Такого рода |
|
||||||||||||||||||||||||||||
изменения |
|
называются закономерностями |
|
|
распределения. |
Для |
|
||||||||||||||||||||||
дискретного признака |
имеет |
место |
зависимость |
частостей |
от |
значения |
40