Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Равичев_Л_В_Статистика_Лекции_Задания_Вопросы_2016 / Статистика_2_Описательная_статистика / 0_Равичев_Л_В_Теория_статистики_Описательная_статистика

.pdf
Скачиваний:
73
Добавлен:
25.06.2016
Размер:
340.27 Кб
Скачать

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(19)

 

где: xМе

нижняя граница

медианного

 

интервала; Ме – величина

 

медианного

интервала;

fi – частоты

 

интервального ряда; SМе-1

сумма

 

накопленных частот в интервалах, предшествующих медианному; fМе

 

частота медианного интервала.

 

 

 

 

 

 

 

 

 

 

Пример. Ниже даны группы семей по среднемесячному доходу на1

 

человека. Требуется для приведенного интервального ряда определить

 

серединное значение, т.е. медиану.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднемесячный доход на

 

Число

 

Накопленная

 

 

 

человека, xi, руб.

 

семей, fi

 

частота, Si

 

 

 

 

 

до 900

 

 

10

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9001200

 

 

20

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12001500

 

 

40

 

 

70

 

 

Медианный интервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15001800

 

 

10

 

 

80

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свыше 1800

 

 

20

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма:

 

 

100

 

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение:

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- 30

 

 

 

 

 

 

 

 

Mе

= 1200 + 300

2

= 1350 руб.

(20)

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, 50 % семей имеют доход на одного человека <1350 руб.

 

Свойство

медианы:

сумма абсолютных отклонений чисел ряда от

медианы есть величина наименьшая, то есть:

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å

 

xi - Me

 

® min.

 

 

(21)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

Дополнительно

 

к медиане

 

 

для

 

характеристики

структуры

вариационного ряда исчисляют квартили, децили и процентили, которые

 

делят его по сумме частот соответственно на четыре, десять и сто равных

 

частей.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подводя итог рассмотрению моды и медианы, особо следует отметить,

 

что

данные

два

 

показателя

 

часто

 

используются

вместо

средней

31

арифметической или вместе с ней. Конечно, чаще используют среднюю арифметическую, но для тех случаев, когда в совокупности имеется небольшое число единиц с чрезмерно большим или чрезмерно малым

значением

исследуемого

признака, в

дополнение

к

средней

арифметической целесообразно исчислять моду и особенно

медиану,

которые,

в

отличие от средней арифметической, не зависят

от

этих

крайних,

не характерных для совокупности значений признаков.

 

 

 

3.3. Показатели вариации

 

 

Средняя

величина

дает

обобщающую

характеристику

вс

совокупности изучаемого явления. Однако два распределения, имеющие

 

одинаковую

среднюю арифметическую, могут значительно отличаться

 

друг от друга по степени рассеяния(вариации) признака. Для измерения

 

вариации признака применяются различные абсолютные и относительные

 

показатели вариации.

 

 

 

 

Кабсолютным показателям вариации относятся следующие:

·размах вариации, который представляет собой разность между максимальным и минимальным значениями признака в совокупности:

R = xmax - xmin

(22)

Недостатком данного показателя является , точто размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов значений признака.

· среднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариант от их средней арифметической. Формулы для расчета среднего линейного отклонения:

для несгруппированных данных:

32

 

 

 

N

 

 

 

 

N

 

 

 

 

å| xi -

 

|

 

 

 

 

å x i

 

 

 

x

 

где

x

(23)

 

 

= ±

i=1

,

=

i = 1

;

 

d

 

 

 

N

 

 

 

 

 

 

 

N

 

для сгруппированных данных (взвешенное среднее линейное отклонение):

 

 

 

N

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

å| xi -

 

| fi

 

 

 

 

å x i × f i

 

 

 

 

 

 

x

где

x

=

;

 

(24)

 

 

= ±

i=1

 

,

 

 

i =1

 

 

 

 

d

 

 

 

 

 

 

N

 

 

 

N

 

 

 

 

 

åfi

 

 

 

 

 

 

 

 

å f i

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

i =1

 

 

 

· среднее квадратическое отклонение представляет собой среднюю

квадратическую

 

из отклонений

отдельных

 

вариант

от

их средней

арифметической.

 

Формулы

 

для

расчета

среднего

квадратического

отклонения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для несгруппированных данных:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å x i

 

 

 

 

 

 

å(xi -

x)2

 

 

 

 

 

x

 

=

 

;

 

σ = ±

 

i=1

 

,

 

где

 

 

 

i = 1

 

(25)

 

N

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для сгруппированных данных:

 

N

 

 

 

 

N

 

 

 

σ=±

å(xi -

x)2×fi

,

 

 

 

å x i × f i

 

 

i=1

 

 

 

 

 

 

 

где

x =

i = 1

 

.

(26)

N

 

 

N

 

åfi

 

 

 

 

å f i

 

 

 

i=1

 

 

 

 

i = 1

 

 

 

 

 

 

 

 

 

 

 

· дисперсия – квадрат среднего квадратического отклонения (σ2).

Среднее квадратическое отклонение и дисперсия используются в большинстве теорем теории вероятности и математической статистики,

что обусловливает их широкое применение на практике. Основные вычислительные свойства дисперсии:

· дисперсия постоянной величины равна 0;

33

·если все варианты значений признака уменьшить на одно и то же число, то дисперсия не изменится;

·если все варианты значений признака уменьшить в одно и то же число А раз (А – const), то дисперсия уменьшится в А2 раз.

Дисперсия может быть разложена на составные части, что позволяет

оценить

влияние

различных

факторов, обусловливающих

вариацию

признака.

Так, если

при

группировке

совокупности

по

некоторому

признаку

было

образованоm

однородных

групп,

общая

дисперсия 2σ

может быть разложена на две составные :частимежгрупповую δ2 и

остаточную ε2 (среднюю из внутригрупповых) дисперсию:

 

 

 

 

 

 

 

σ 2

= δ 2 + ε 2 .

 

 

 

 

Межгрупповая

дисперсия характеризует

ту

часть

общей

вариации

признака, которая обусловлена делением совокупности на группы. Таким

образом,

она

характеризует

вариацию

признака, обусловленную

факторами, с которыми связано деление совокупности на группы. Поэтому

ее еще называют факторной дисперсией. Межгрупповая дисперсия равна среднему взвешенному квадрату отклонений групповых (частных) средних от общей средней:

m

å ( x j - x ) 2 × N j

 

 

δ 2 =

 

j = 1

 

 

 

,

 

 

 

 

 

m

N j

 

(27)

 

 

 

 

 

 

 

 

 

 

 

 

å

 

 

 

 

 

 

 

 

j = 1

 

 

 

 

где Nj – численность единиц в j-й группе.

 

 

 

 

Средняя

из

внутригрупповых

дисперсий(или остаточная)

характеризует остаточную вариацию, не связанную с группированием. То

есть она характеризует вариацию признака, обусловленную прочими

факторами, не

 

связанными

с

делением

совокупности

на . группы

Вычисляется она как средняя взвешенная из внутригрупповых дисперсий:

34

 

 

 

m

 

 

 

 

 

 

 

å σ 2j

× N j

(28)

ε

2

=

j =

1

 

,

 

 

m

 

 

å N j

j = 1

где σ2j - дисперсия признака внутри j-й группы.

Очевидно, что чем больше межгрупповая дисперсияδ2 , тем лучше проведена группировка (выделенные при группировке группы сильнее различаются между собой). Поэтому межгрупповая дисперсия является критерием группирования для группировок с одинаковым числом групп.

Лучшей будет та группировка, у которой величина δ2 больше.

Пользуясь правилом сложения дисперсий σ2 = δ2 + ε 2 , можно всегда по двум известным дисперсиям отыскать третью– неизвестную, – а также судить о силе влияния группировочного признака.

Пример. Имеются следующие данные о времени простоя автомобиля под разгрузкой:

№ пункта

1

2

3

4

5

6

7

8

9

10

разгрузки

 

 

 

 

 

 

 

 

 

 

Число грузчиков

3

4

4

3

3

4

4

4

3

4

 

 

 

 

 

 

 

 

 

 

 

Время простоя,

12

10

8

15

19

12

8

10

18

8

мин

 

 

 

 

 

 

 

 

 

 

Проверить правило сложения дисперсий.

Решение:

1. Вспомогательная таблица для расчета среднего времени простоя под разгрузкой:

Время простоя под

Число выполненных

xi•fi

 

 

 

 

 

 

разгрузкой xi, мин

разгрузок, fi

 

 

 

 

 

 

 

 

 

 

 

 

 

8

3

24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

2

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

2

24

 

 

=

 

120

= 12 мин

 

 

 

 

x

 

 

 

 

 

 

15

1

15

10

 

 

 

 

 

 

 

 

 

 

 

 

 

18

1

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

1

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

35

Сумма:

 

 

10

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсии:

 

 

 

2. Вспомогательная таблица для расчета общей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Время

 

Число

 

 

 

 

 

 

 

 

 

 

(xi -

 

 

 

 

простоя под

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

разгрузкой

 

выполненных

xi•fi

xi - x

(xi - x )

 

 

 

)2•fi

 

 

 

 

 

 

x

 

 

 

xi, мин

 

разгрузок, fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

3

 

24

-4

 

16

 

 

 

48

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

2

 

20

-2

 

4

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

2

 

24

0

 

 

0

 

 

 

0

σ2

=

150

= 15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

1

 

15

3

 

 

9

 

 

 

9

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

 

1

 

18

6

 

 

36

 

 

 

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

 

1

 

19

7

 

 

49

 

 

 

49

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма:

 

10

 

120

-

 

 

-

 

 

 

 

150

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Расчет внутригрупповых дисперсий:

По первой группе (число грузчиков, участвующих в разгрузке – 3).

Время

Число

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

простоя под

 

 

 

 

 

 

 

2

 

(xi -

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выполненных

xi•fi

xi - x1

(xi - x1 )

 

 

 

 

 

 

разгрузкой

 

 

 

)2•fi

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

xi, мин

разгрузок, fi

 

 

 

 

 

 

 

 

 

 

 

 

 

1

=

64

 

=16 мин

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

12

1

12

-4

 

16

 

 

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

1

15

-1

 

1

 

 

 

1

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

=

=7,5

18

1

18

2

 

4

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

4

 

19

1

19

3

 

9

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма:

4

64

-

 

 

-

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По второй группе (число грузчиков, участвующих в разгрузке – 4).

Время

Число

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

простоя под

xi•fi

xi -

 

 

 

 

1 )2

(xi -

 

)2•fi

 

 

 

 

 

 

 

 

выполненных

 

1

(xi -

 

x

 

 

 

 

 

 

 

 

x

x

 

 

 

 

56

 

 

разгрузкой

разгрузок, fi

 

 

 

 

 

 

 

 

 

 

 

 

2 =

 

= 9,33 мин

 

 

 

 

 

 

 

 

 

 

 

x

xi, мин

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

3

24

-1,33

1,77

5,31

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

2

20

0,67

0,45

0,90

 

 

 

 

 

13,34

 

 

 

 

 

 

 

 

s22

=

= 2,22

12

1

12

2,67

7,13

7,13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

Сумма:

6

56

-

 

 

-

 

13,34

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.Средняя внутригрупповая дисперсия:

ε2 = 7,5 × 4 + 2,22 ×6 = 4,33.

10

36

5.Межгрупповая дисперсия:

δ2 = (16 -12)2 ×4 + (9,33 -12)2 ×6 =10,67.

10

6. Общая дисперсия:

 

 

 

 

 

 

 

 

 

 

 

σ 2

= δ 2 + ε 2

= 10,67

+ 4,33

= 15,00.

 

 

Правило сложения дисперсий подтверждено.

 

 

 

 

При сравнении изменяемости различных признаков в одной и той же

 

совокупности или же при сравнении изменяемости одного и

того

же

признака в нескольких совокупностях с различной величиной средней

арифметической

используются относительные

показатели вариации.

 

Показатель относительной вариации рассчитывается как отношение

абсолютного

показателя

вариации

к

среднему

значению. Самым

 

распространенным

относительным

показателем

вариации

является

коэффициент вариации. Он представляет собой выраженное в процентах

 

отношение

среднего

квадратического

отклонения

к

сред

арифметической:

 

 

 

 

 

 

 

 

 

 

 

 

 

V=

 

σ

 

100 %

 

 

(29)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

Кроме коэффициента вариации на практике используюткоэффициент осцилляции и относительное линейное отклонение.

Коэффициент осцилляции:

K R

 

=

R

 

100 %

(30)

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

Относительное линейное отклонение:

 

 

 

 

=

 

 

 

 

 

 

 

 

100 %

 

K

 

 

d

 

 

 

 

 

 

 

 

 

 

37

 

d

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

(31)

3.4. Вариация альтернативного признака

Альтернативный признак – качественный признак, имеющий две взаимоисключающие разновидности. Альтернативный признак принимает всего два значения: 1 – наличие признака; 0 – отсутствие признака. Для альтернативного признака характерно:

 

 

 

 

p + q = 1,

(32)

где p - доля единиц,

обладающих признаком; q – доля

единиц, не

обладающих признаком.

 

 

 

 

 

 

 

 

Среднее значение альтернативного признака:

 

 

 

 

 

=

(1 × p) + (0 × q)

= p.

(33)

 

 

 

x

 

 

 

 

 

 

 

 

 

p + q

 

Дисперсия альтернативного признака:

 

σ2ап

=

(1 - p)2 × p + (0 - p)2 × q

= p × q.

(34)

 

 

 

 

 

 

p + q

Пример. Удельный вес основных рабочих в трех цехах предприятия составил: 80, 75 и 90 % общей численности рабочих. Определить дисперсию и среднее квадратическое отклонение доли основных рабочих по предприятию в целом, если численность всех рабочих трех цехов составила соответственно 100, 200 и 150 человек.

Решение.

1. Общая численность основных рабочих по предприятию:

n

åmoi =100 ×0,8 + 200 ×0,75 +150 ×0,9 = 365 чел.

i=1

2.Доля основных рабочих по предприятию:

 

n

 

 

 

 

 

 

åmoi

 

365

365

 

p =

i=n1 =

=

=

 

 

0,811.

450

 

åmi

100 + 200 +1500

 

 

 

 

 

 

 

i=1

38

 

3. Дисперсия альтернативного признака:

σ2

ап = p ×q =p ×(1- p)= 0,811×(1- 0,811)=

0,1533.

4. Среднее квадратическое отклонение:

σ = σ2

ап =0,1533 0,3915=

.

 

 

3.5. Показатели формы распределения

 

 

 

Из математической статистики известно, что если увеличивать объем

 

совокупности и уменьшать интервал группировки, изображая эти данные

 

графически, то полигон (гистограмма) распределения все более и более

 

будет приближаться к некоторой плавной линии, являющейся для него

 

пределом и носящей названиекривой распределения. Таким образом, под

 

кривой

распределения понимается графическое

изображение в

виде

 

непрерывной

линии

изменения

 

 

 

частот

в

вариационном,

ря

функционально связанного с изменением вариант.

 

 

 

 

Выяснение общего характера распределения предполагает оценку его

 

однородности, а также вычисление показателей асимметрии и эксцесса.

 

 

Для

сравнительного

анализа

 

 

 

степени

асимметрии

нескольких

распределений

рассчитывается относительный показатель

асимметрии

 

(коэффициент асимметрии):

 

 

 

 

- Mo

 

 

 

 

 

 

 

 

Ax

=

 

x

 

(35)

 

 

 

 

 

 

σ

б

 

 

 

 

 

 

 

 

 

 

 

 

f(x)

а

 

 

 

 

f(x)

 

 

 

 

Ax<0

 

 

 

 

Ax>0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

x

Рис. 3. Виды асимметрии:

39

а – левосторонняя; б – правосторонняя

Величина коэффициента асимметрии может изменяться от -1 до +1 (для одновершинных распределений). Чем ближе по модулю коэффициент асимметрии к 1, тем асимметрия существеннее.

Наиболее точным и распространенным является расчет, основанный на использовании центрального момента третьего порядка:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

 

 

 

å(xi -

x)3

1

 

 

 

 

 

(36)

 

 

 

 

 

Ax

=

 

3

=

i=1

 

 

 

 

×

 

.

 

 

 

 

 

 

 

 

 

 

σ3

 

N

 

 

σ3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель

островершинности эксцесс

представляет

собой

выпад

 

вершины

эмпирического

распределения

вверх или вниз от вершины

кривой

 

нормального

 

 

 

 

распределения. Он

 

 

рассчитывается

 

для

симметричных

распределений.

 

Наиболее

точным

является

показатель,

 

использующий центральный момент четвертого порядка:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ex

=

μ 4

 

- 3 =

å(xi -

x)4

× fi

×

1

- 3.

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

(37)

 

 

 

 

4

 

 

N

 

 

 

4

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

åfi

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

Для

 

нормального

 

 

 

распределения

 

 

 

 

отношениеµ44

 

равно 3,

 

следовательно, эксцесс равен нулю. Наличие положительного эксцесса

 

означает, что распределение более островершинное, чем нормальное;

 

отрицательное

значение

 

 

эксцесса

 

означает

более

плосковершинный

характер распределения, чем у нормального.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.6. Нормальное распределение и его свойства

 

 

 

 

В

вариационных

 

рядах

 

 

 

существует

 

 

 

определенная

связь

между

изменениями частот и значений варьирующего признака. Такого рода

 

изменения

 

называются закономерностями

 

 

распределения.

Для

 

дискретного признака

имеет

место

зависимость

частостей

от

значения

40