Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Uchebno-metodicheskoe_posobie_Pravovaya_statistika

.pdf
Скачиваний:
245
Добавлен:
24.07.2017
Размер:
3.45 Mб
Скачать

Благодаря методам статистического анализа вариации массовых явлений работники правоохранительных органов имеют возможность оценить и в отдельных случаях воздействовать на объект наблюдения для управления вариацией наблюдаемого процесса.

3. Необходимость и задачи статистического изучения вариа-

ции

В статистике исследование вариации позволяет оценить меру воздействия на конкретный признак внешних или внутренних факторов, например на количество преступлений и социальноэкономическую ситуацию в стране и т.д.

С целью изучения возможных отклонений признаков от их средних величин используют различные статистические приемы. К числу таких приемов можно отнести:

изучение показателей вариации; построение вариационного ряда распределения; графическое представление; исследование формы распределения и т.д.

В зависимости от целей и задач исследования конкретных распределений в статистике исчисляют разнообразные показатели ва-

риации:

показатели структуры вариационного ряда распределения (мода, медиана, квартили, децили, перцентили);

показатели размера вариации (размах вариации, среднее линейное отклонение, средний квадрат отклонения (дисперсия), среднее квадратическое отклонение, коэффициент вариации);

показатели формы вариационного ряда распределения (асимметрия, эксцесс).

4.2.Показатели вариации

1.Показатели структуры вариационного ряда. 2.Размах.

3.Среднее линейное отклонение.

4.Дисперсия.

5.Коэффициент вариации.

6.Показатели формы вариационного ряда.

1. Показатели структуры вариационного ряда

Модой (М0) в статистике называют наиболее часто встречающуюся величину признака в данной совокупности. В вариационном ряду моду будет представлять варианта, которая обладает наибольшей

71

частотой. Мода применяется в тех случаях, когда необходимо определить наиболее часто встречающуюся величину признака:

M0 x0

n

 

fm fm 1

 

 

 

( fm

fm 1 ) ( fm

fm 1 )

(4.1)

 

 

 

 

где x0

нижняя граница модального интервала (мо-

 

 

дальным является интервал, имеющий

 

 

наибольшую частоту);

 

n

величина модального интервала;

 

fmo

частота модального интервала;

 

fmo–1

частота интервала, предшествующего мо-

 

 

дальному;

 

 

 

fmo+1

частота интервала, следующего за модаль-

 

 

ным.

 

 

 

 

Пример вычисления моды приведен в табл. 4.2.

Таблица 4.2

Расчет среднего возраста лиц, совершивших преступления в 2013 г.

Возраст во время совер-

 

 

Количество лиц, совер-

шения преступления

 

Средний интервал

шивших преступления

(лет)

 

 

(тыс. человек)

14–15

 

14,5

19,7

16–17

 

16,5

41

18–24

 

21

222,5

25–29

 

27

191,5

30–49

 

 

40

440,5

50–60

 

55

97,3

Сумма

 

1012,6

x0

 

30

 

n

 

20

fmo

 

440,5

fmo–1

 

191,5

fmo+1

 

97,3

М0

 

38,4

Моду можно определить по гистограмме (см. рис. 4.1).

72

fi (тыс. человек)

400

200

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

0

14 16 18

25

30

38,4

50

60

xi (лет)

Рис. 4.1. Определение моды по гистограмме

На гистограмме выбирается самый высокий прямоугольник (модальный интервал). Далее правую вершину модального прямоугольника соединяем с правой вершиной предшествующего прямоугольника, а левую вершину модального прямоугольника соединяем с левой вершиной последующего прямоугольника.

Из точки пересечения получившихся линий опускаем перпендикуляр на ось абсцисс. Точка пересечения перпендикуляра и шкалы абсцисс является определяемой модой.

Медианой (Ме), или серединным значением наблюдаемой совокупности, в статистике называют величину варьирующего признака, которая находится в середине ряда, расположенного в порядке возрастания или убывания.

Для определения медианы в дискретном ряду при наличии ча-

n

стот сначала вычисляют полусумму частот fi /2, а затем определяют, какое значение варианта приходится на нее.i 1

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем – значение медианы по формуле:

73

 

 

 

 

n

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

i 1

SMe 1

 

 

Me

x0 n

 

2

(4.2)

 

 

 

 

 

 

 

fMe

 

 

 

 

 

 

где x0

нижняя граница медианного интервала (ме-

 

 

дианным называется первый интервал,

 

 

накопленная частота которого превышает

 

 

половину общей суммы частот);

 

n

величина модального интервала;

 

SMe–1

накопленная частота интервала, предшеству-

 

 

ющего медианному;

 

fMe

частота медианного интервала.

 

Пример вычисления медианы приведен в табл. 4.3.

Графически медиана определяется по кумуляте. На шкале накопленных частот находят точку, соответствующую 50% общей суммы частот (частостей). Из этой точки проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Из найденной точки опускается перпендикуляр на ось абсцисс. Точка их пересечения со шкалой абсцисс позволит определить значение медианы (см. рис. 4.2).

Таблица 4.3

Расчет среднего возраста лиц, совершивших преступления в 2013 г.

Возраст во время со-

 

 

 

 

Количество лиц, со-

 

вершения преступле-

Средний интервал

вершивших преступ-

SMe

ния (лет)

 

 

 

 

ления (тыс. человек)

 

14–15

 

14,5

 

19,7

19,7

16–17

 

16,5

 

41

60,7

18–24

 

21

 

222,5

283,2

25–29

 

27

 

191,5

474,7

30–49

 

40

 

440,5

915,2

50–60

 

55

 

97,3

1012,6

 

 

n

 

 

 

 

 

fi

 

1012,6

 

i 1

 

 

 

 

 

n

 

 

 

 

 

 

fi

/2

 

 

506,3

 

i 1

 

 

 

 

 

 

x0

 

 

 

30

 

 

n

 

 

 

20

 

SMe–1

 

474,7

 

 

fMe

 

440,5

 

 

Ме

 

31,4

 

 

 

74

 

 

 

Накопленные частоты (тыс. человек)

1000

500

 

 

 

 

 

 

250

 

 

 

 

 

 

0

14 16 18

25

30 31,4

50

60

xi (лет)

Рис. 4.2. Определение медианы по гистограмме

2.Размах

Размах вариации представляет собой разность между наибольшим и наименьшим значениями варьирующего признака:

 

 

R xmax xmin

(4.3)

где R

размах вариации;

 

xmax

наибольшее значение признака;

 

xmin

наименьшее значение признака.

 

Пример вычисления размаха вариации приведен в табл. 4.4.

75

Таблица 4.4

Расчет размаха вариации числа зарегистрированных преступлений в Российской Федерации

 

Зарегистрировано

 

 

 

Год

преступлений

xmax

xmin

R

 

(тыс.)

 

 

 

1990

1839,5

 

 

 

2000

2952,4

 

 

 

2005

3554,7

 

 

 

2006

3855,4

 

 

 

2007

3582,5

 

 

 

2008

3209,9

3855,4

1839,5

2015,9

2009

2994,8

 

 

 

2010

2628,8

 

 

 

2011

2404,8

 

 

 

2012

2302,2

 

 

 

2013

2206,2

 

 

 

3. Среднее линейное отклонение

Среднее линейное отклонение ( d ) представляет собой сред-

нюю арифметическую величину из абсолютных значений отклонений вариант признака от их среднего значения.

При вычислении d отклонения вариант от средней арифметической берутся без учета знаков, так как в противном случае сумма отклонений будет равна нулю.

Среднее линейное отклонение может быть простым и взвешен-

ным.

Формула простого среднего линейного отклонения имеет сле-

дующий вид:

где d

xxi

n

n

xi x

 

 

 

 

 

d

i 1

 

(4.4)

 

n

 

 

 

 

среднее линейное отклонение;

значение признака; среднее значение признака;

число вариантов.

Взвешенное среднее линейное отклонение определяется по формуле:

76

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi x

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

d

i 1

 

 

 

(4.5)

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

где d

среднее линейное отклонение;

 

xi

значение признака;

 

x

среднее значение признака;

fi

число вариантов.

 

 

 

Пример вычисления среднего линейного отклонения приведен в табл. 4.5.

Таблица 4.5

Расчет среднего линейного отклонения числа зарегистрированных преступлений в Российской Федерации

Год

Зарегистрировано

x

x x

 

x x

 

 

 

преступлений, (тыс.)

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

 

1990

1839,5

 

 

 

–1026,9

 

1026,9

 

2000

2952,4

 

 

 

85,9

 

85,9

 

2005

3554,7

 

 

 

688,2

 

688,2

 

2006

3855,4

 

 

 

988,9

 

988,9

 

2007

3582,5

 

 

 

716,0

 

716,0

 

2008

3209,9

 

 

2866,47

343,4

 

343,4

 

2009

2994,8

 

 

 

128,3

 

128,3

 

2010

2628,8

 

 

 

–237,6

 

237,6

 

2011

2404,8

 

 

 

–461,6

 

461,6

 

2012

2302,2

 

 

 

–564,3

 

564,3

 

2013

2206,2

 

 

 

–660,3

 

660,3

 

n

 

 

 

 

 

 

 

 

 

31531,2

 

 

 

0

 

5901,4

 

i 1

 

 

 

 

 

 

 

 

 

 

n

 

 

 

11

 

 

 

 

 

 

 

 

536,5

 

 

d

 

 

 

 

Среднее линейное отклонение и размах вариации нельзя считать достаточно точными показателями. Чтобы преодолеть недостатки среднего линейного отклонения и размаха вариации, вычисляют средний квадрат отклонений (дисперсию).

4. Дисперсия

Средний квадрат отклонения (дисперсия) представляет собой среднеарифметическую величину из квадратов отклонений вариант от их средней арифметической и обозначается символом 2 (D).

Формула простого (невзвешенного) квадрата отклонения (невзвешенной дисперсии) имеет вид:

77

n

(xi x)2

2

i 1

 

n

(4.6)

 

 

 

Взвешенное значение квадрата отклонения (взвешенной дисперсии) вычисляется по формуле:

 

n

 

(xi

 

)2 fi

 

x

2

i 1

n

fi (4.7) i 1

Среднее квадратическое отклонение исчисляется путем из-

влечения квадратного корня из среднего квадрата отклонения (дисперсии):

 

 

 

2

(4.8)

Простое (невзвешенное) среднее квадратическое отклонение

определяется по формуле:

 

n

 

 

 

 

 

(xi

 

 

 

 

 

x)2

 

i 1

 

 

 

 

 

 

 

 

 

 

n

(4.9)

 

 

Формула для определения взвешенного среднего квадратиче-

ского отклонения:

 

 

 

 

 

n

(xi x)2 fi

i 1

n

(4.10)

fi

i 1

Пример вычисления среднего квадратического отклонения приведен в табл. 4.6.

78

Таблица 4.6

Расчет среднего квадратического отклонения числа зарегистрированных преступлений в Российской Федерации

 

Зарегистрировано

 

xi x

 

 

 

 

 

x

(xi x)

2

Год

преступлений,

 

 

 

 

(тыс.)

 

 

 

 

 

 

 

 

 

 

1990

1839,5

 

 

–1026,9

1054523,61

2000

2952,4

 

 

85,9

7378,81

2005

3554,7

 

 

688,2

473619,24

2006

3855,4

 

 

988,9

977923,21

2007

3582,5

 

 

716,0

512656

2008

3209,9

 

2866,47

343,4

117923,56

2009

2994,8

 

 

128,3

16460,89

2010

2628,8

 

 

–237,6

56453,76

2011

2404,8

 

 

–461,6

213074,56

2012

2302,2

 

 

–564,3

318434,49

2013

2206,2

 

 

–660,3

435996,09

n

 

 

 

 

 

 

 

 

 

31531,2

 

 

0

4184444,22

i 1

 

 

 

 

 

 

 

 

 

n

 

11

 

 

 

 

 

2

 

 

380404,02

 

 

 

616,8

 

 

5. Коэффициент вариации

Среднее линейное отклонение, дисперсия и среднее квадратическое отклонение выражаются определенными числами, которые дают представление об абсолютной величине колебаний признака.

Для сравнения колебаний разнородных явлений, как правило, используется относительный показатель вариации, так называемый коэффициент вариации.

Коэффициент вариации (V) дает возможность сопоставить вариацию одного и того же признака в разных статистических совокупностях, а также разнородных признаков одной и той же или различных статистических совокупностей:

V

 

100%

 

 

 

(4.11)

 

 

x

 

 

 

По мнению автора рассматриваемого коэффициента К. Пирсона, коэффициент вариации эффективнее абсолютного показателя вариации.

Иногда применяется линейный коэффициент вариации, который определяют как процентное отношение среднего линейного отклонения к средней арифметической величине:

79

V

 

 

d

 

 

100%

 

 

 

 

(4.12)

 

 

 

 

x

 

 

 

 

Коэффициент вариации может быть представлен также в

коэффициентном выражении (без умножения на 100%).

 

Рассчитаем коэффициент вариации для примера, приведенного

выше:

 

 

 

 

 

 

 

 

 

V

 

 

100%

616,8

100% 21,5%

 

 

 

2866, 47

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

d

 

100%

 

536,

5

100% 18, 7%

 

 

 

 

2866,

47

x

 

 

 

 

 

 

 

При помощи коэффициента вариации можно сравнивать между собой вариацию эффективности деятельности органов и организаций.

4.3.Колеблемость признаков совокупности

ивиды выборки

1.Определение колеблемости признаков совокупности.

2.Способы отбора, обеспечивающие репрезентативность выборки: повторная и бесповторная выборка.

1. Определение колеблемости признаков совокупности

Показатели вариации (колеблемость признаков совокупности) проявляются также в формах вариационного ряда.

В практике статистических исследований выделяются следую-

щие основные формы вариационного ряда:

нормальное распределение (переменная величина изменяется непрерывно);

биномиальное распределение (переменная величина может принимать только дискретные значения с двумя возможными состояниями признака, показывающими наличие или отсутствие наблюдаемого события);

распределение Пуассона (рассматриваются очень редкие, маловероятные события).

Нормальное распределение (распределение Гаусса)

Случайной величиной называется переменная, которая может принимать разные значения, заранее неизвестные.

80