Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СТАТИСТИКА (для студентов заочников) / Пособие по статистике (И.В.Шадрина)

.pdf
Скачиваний:
96
Добавлен:
04.06.2015
Размер:
1 Mб
Скачать

33

Для его исчисления каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учетом весом), после чего сумма квадратов делится на число членов ряда и из частного извлекается корень квадратный.

Все эти действия выражает следующая формула

 

 

 

 

 

 

 

 

 

 

 

 

 

( x x)2

– для несгруппированных данных,

(4.5)

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( x x)2

f

 

– для сгруппированных данных.

(4.6)

 

 

f

 

 

 

 

 

 

 

 

 

 

т.е. среднее квадратическое отклонение представляет собой корень квадратный из средней арифметической квадратов отклонений от средней.

Для первой совокупности

 

1

 

(80 160)2

(100 160)2

(120 160)2

(200 160)2

(300 160)

2

 

81.

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для второй совокупности расчет ведется аналогично 2

 

102,25 10,1.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.

Средняя арифметическая из квадратов отклонений вариантов значений признака от средней величины носит название дисперсии ( 2 ), которая рассчитывается по формулам

 

2

 

(x x) 2

– для несгруппированных,

(4.7)

 

 

n

 

 

 

 

 

 

 

 

 

2

 

(x x) 2

f

– для сгруппированных.

(4.8)

 

f

 

 

 

 

 

 

 

 

 

Отличительной особенностью данного показатели является то, что при возведении в квадрат ( x x ) удельный вес малых отклонений уменьшается, а больших увеличивается в общей сумме отклонений.

Дисперсия в первой совокупности равна 12 6560 , во второй совокупности 22 102 .

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить еѐ вычисление:

1. Дисперсия постоянной величины равна 0. Если x a , то и x a .

Тогда

2

 

x x 2

f

 

a a 2

f

0 .

 

f

 

f

 

 

 

 

 

 

 

 

2. Если все варианты значений признака (x) уменьшить на одно и то же число, то дисперсия не уменьшится.

Пусть x x a , но тогда в соответствии со свойствами средней арифметической и x x a .

Дисперсия в новом ряду будет равна

34

 

 

2

 

x x 2 f

 

x a x a 2 f

 

x x 2 f

, т.е. дисперсия в ряду

x

 

f

f

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x равна дисперсии первоначального ряда x .

3. Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

 

 

 

 

 

 

x

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть x

k , тогда и x

k .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия же нового ряда x

будет равна

 

 

 

 

 

 

 

 

 

 

 

x

 

 

x

2

 

 

 

1

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

f

 

 

 

x x f

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k 2

 

 

2

 

x x f

 

k k

 

 

 

 

 

x

x

 

 

f

 

 

f

 

 

 

 

f

k 2

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Дисперсия, рассчитанная по отношению к средней арифметической, является минимальной. Средний квадрат отклонений, рассчитанный относительно произвольного числа a , больше дисперсии, рассчитанной по отношению к средней арифметической, на квадрат разности между средней арифметической и числом a , т.е. (а ) 2 2 x a 2 . Дисперсия от средней имеет

свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин. В этом случае, когда a приравниваем к 0 и , следовательно, не вычисляем отклонения, формула принимает такой вид:

2 x 2 x 2 (4.9)

Выше был рассмотрен расчет показателей вариации для количественных признаков, но в экономических расчетах может ставиться задача оценки вариации качественных признаков. Например, при изучении качества изготовленной продукции, продукцию можно разделить на качественную и бракованную.

В таком случае речь идет об альтернативных признаках. Альтернативными признаками называются такие, которыми одни едини-

цы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. Тогда, если долю единиц, обладающих признаком (в общей численности единиц совокупности), обозначить через р, а долю единиц, не обладающих признаком, через q, дисперсию альтернативного признака можно рассчитать по общему правилу. При этом p + q = 1 и, значит, q = 1– p.

Сначала рассчитываем среднее значение альтернативного признака: Рассчитаем среднее значение альтернативного признака

x 1p 0q p , p q

т.е. среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.

Дисперсия же альтернативного признака будет равна:

 

 

 

 

35

 

 

2

(x x)2 f

 

(1 p)2 p (0 p)2 q

 

q2 p p2 q

q2 p p2 q pq(q p) pq

 

 

p

f

 

p q

 

 

p q

 

 

 

 

Таким образом, дисперсия альтернативного признака равняется произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.

А среднее квадратическое отклонение будет равно р = pq .

Пример. Налоговой инспекцией проверено 100 коммерческих предприя-

тий, и в 47 обнаружены финансовые нарушения. Тогда р

 

47

0,47 ,

100

 

 

q 1 0,47 0,53 .

Следовательно, дисперсия и среднее квадратическое отклонение доли коммерческих предприятий, имеющих финансовые нарушения, во всей сово-

купности обследованных предприятий равны: p

2

0,47 * 0,53 0,249 ,

p 0,249 0,498 .

Показатели относительные. Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, выраженные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане.

Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации:

1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.

K 0

R

 

*100% .

 

(4.10)

x

 

 

 

 

 

 

 

 

 

 

Для первой совокупности

K01

220

*100 137,5 %.

 

 

 

 

 

 

160

 

 

Для второй совокупности K02

 

35

*100 21,9 %.

160

 

 

 

 

 

 

 

 

2. Относительное линейное отклонение характеризует долю усредненно-

го значения абсолютных отношений от средней величины.

K L

L

 

*100% .

 

(4.11)

x

 

 

 

 

 

 

 

 

 

 

Для первой совокупности

K L1

72

 

*100 45,0% .

 

 

 

 

160

 

 

36

Для второй совокупности KL2 1607 *100 4,4 %.

3. Коэффициент вариации оценивает типичность средних величин.

Kv

 

 

*100% .

(4.12)

x

 

 

 

 

 

Для первой совокупности K1v 16081 *100 50,63% .

Для второй совокупности K 2 v 10160,1 *100 6,3% .

Чем меньше Kv , тем однороднее совокупность по изучаемому признаку и типичнее средняя. Если Kv ≤33%, то распределение близко к нормальному,

а совокупность считается однородной. Из приведенного примера вторая совокупность однородна.

Виды дисперсий и правило сложения дисперсий. Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

При этом можно определить три показателя колеблемости признака в совокупности:

1. Общую вариацию совокупности, которая является результатом действия всех причин. Эта вариация может быть измерена общей дисперсией ( о 2 ), характеризующей отклонения индивидуальных значений признака совокупности от общей средней

2 x x0 2 f0 . (4.13)

оf0

2.Вариацию групповых средних, выражающих отклонения групповых средних от общей средней и отражающих влияние того фактора, по которому

произведена группировка. Эта вариация может быть измерена так называемой межгрупповой дисперсией (δ2)

 

2

 

xi

x0 2

fi

,

(4.14)

 

fi

 

 

 

 

 

 

 

 

где xi - групповые средние, а x -общая средняя для всей совокупности, и ni - численность отдельных групп.

3. Остаточную (или внутригрупповую) вариацию, которая выражается в отклонении отдельных значений признака в каждой группе от их групповой средней и, следовательно, отражает влияние всех прочих факторов кроме положенного в основу группировки. Поскольку вариацию в каждой группе отражает групповая дисперсия

37

2

 

xi

xi 2

fi

,

(4.15)

i

f i

 

 

 

 

 

 

 

то для всей совокупности остаточную вариацию будет отражать средняя из групповых дисперсий. Эту дисперсию называют средней из внутригрупповых дисперсий ( i2 ) и рассчитывается она по формуле

 

 

2

 

i

2

fi

 

(

 

 

 

 

 

i

 

 

 

 

.

 

fi

 

4.16)

 

 

 

 

 

 

Общая вариация признака в совокупности должна определяться как сумма вариации групповых средних (за счет одного выделенного фактора) и остаточной вариации (за счет остальных факторов). Это равенство находит свое выражение в сложении дисперсий

2 2

i

2 .

(4.1

 

 

 

7)

Это равенство, имеющее строго математическое доказательство, известно, как правило сложения дисперсий.

Правило сложения дисперсий позволяет находить общую дисперсию по еѐ компонентам, когда индивидуальные значения признака неизвестны, а в распоряжении имеются только групповые показатели.

Рассмотрим правило сложения дисперсий на конкретном примере. Пример. Известны данные о производительности труда в двух брига-

дах. Результаты наблюдения сведены в табл.4.1:

 

 

Таблица 4.1

 

Распределение бригад по выработке

Бригада

Количество

Выработке, шт/час

 

человек

 

1

8

13, 14, 15, 13, 17, 12, 12, 13

2

6

14, 13, 17, 17, 21, 16

Рассчитаем средние величины:

а) общую для двух бригад. Для этого преобразуем исходные данные в следующую табл.4.2:

 

 

 

 

Таблица 4.2

 

Расчетная таблица

 

 

x

f1

 

f2

f0

 

 

 

 

 

12

2

 

 

2

13

3

 

1

4

14

1

 

1

2

15

1

 

 

1

16

 

 

1

1

17

1

 

2

3

38

 

 

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

 

Итого

 

 

 

 

 

 

 

8

 

 

 

6

 

 

14

x0

хf o

 

12 * 2 13* 4 14 * 2 15 *1 16 *1 17 * 3 21*1

 

14,8 шт/час.

 

 

 

 

 

 

 

 

 

 

 

 

 

fo

 

 

 

 

 

 

 

14

 

 

 

 

 

 

 

б) среднюю выработку в первой бригаде

 

 

 

 

 

x

хf1

 

12 * 2 13* 3 14 *1 15 *1 17 *1

 

13,6 шт/час.

 

 

 

 

 

 

 

 

 

 

 

 

1

f1

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в) среднюю выработку во второй бригаде

 

 

 

 

 

x2

хf 2

 

13*1 14 *1 16 *1 17 * 2 21*1

16,3 шт/час.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f2

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

Определим дисперсии в каждой бригаде:

 

 

 

 

 

В первой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(12 14,8)2 2 13 14,8 2 3 14 14,8 21 15 14,8 21 17 14,8 21

2,5

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Во второй

 

 

 

 

 

 

 

 

 

 

 

 

 

2

(xi x2 )2

f2

39,34

6,6

 

 

 

 

 

 

 

 

 

 

 

2

 

 

f2

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитаем среднюю из внутригрупповых дисперсий

 

 

 

 

2

i

2 fi

 

2,5 * 8 6,6 * 6

4,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

fi

8 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитаем межгрупповую дисперсию

 

 

 

 

 

2

xi

x0 2 fi

 

13,6 14,8 2 8 16,3 14,8 2 6

1,78 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

8 6

 

 

 

 

 

Найдем общую дисперсия используя правило сложения дисперсий:

 

о

2 2

2

1,78 4,25 6,03

 

i

 

Коэффициент детерминации. Правило сложения дисперсии позволяет выявить зависимость результатов от определенных факторов при помощи коэффициента детерминации.

2

 

2

,

(4.1

о

2

8)

 

 

 

т.е. 2 1,786,03 0,29 .

Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.

Корень квадратный из коэффициента детерминации носит название корреляционного отношения ( ):

39

 

 

 

 

 

2

(4.1

 

 

9)

 

2

 

 

 

 

 

о

 

 

т.е. 1,786,03 0,54 .

Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Корреляционное отношение изменяется в пределах от 0 до 1. Если 0 , то группировочный признак не оказывает влияния на результативный. Если 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.

Следовательно, 54% в производительности труда рабочих приходится на фактор трудоемкости и 46% на неучтенные факторы.

Показатели асимметрии и эксцесса. В области экономических явле-

ний строго симметричные ряды встречаются крайне редко, чаще приходится иметь дело с асимметричными рядами.

В статистике для характеристики асимметрии пользуются несколькими показателями. Если учесть, что в симметричном ряду средняя арифметическая совпадает по значению с модой и медианой, то наиболее простым показателем асимметрии ( As ) будет разность между средней арифметической и

модой, т.е. As = х 0 .

Если ( х 0 )>0, то на графике такой ряд будет иметь вытянутость

вправо (правосторонняя асимметрия).

Если ( х 0 )<0, то на графике такой ряд будет иметь вытянутость вле-

во (левосторонняя асимметрия).

Для сравнения асимметрии в нескольких рядах используют относительный показатель, полученный путем деления величины ( х 0 ) на сред-

нее квадратическое отклонение, т.е.

 

 

 

Аs =

х 0

.

(4.20)

 

 

 

 

 

Еще один показатель рассчитывается в вариационных рядах для характеристики крутости распределения. Это показатель эксцесса ( Ех ). При одной

и той же средней арифметической эмпирический ряд может быть островершинным или низковершинным по сравнению с кривой нормального распределения.

Величину эксцесса рассчитывают по формуле

х

 

 

4

3 .

(4.21)

 

4

 

 

 

 

 

Центральный момент четвертого порядка рассчитывается по формуле

4

 

( x x)4

f

.

(4.22)

f

 

 

 

 

 

 

 

40

Если х >0, то эксцесс считают положительным (распределение островершинно), если х <0, то эксцесс считается отрицательным (распределение

низковершинно).

Пример. Рассчитаем показатели асимметрии и эксцесса по исходным данным, представленным в табл.4.3:

Таблица 4.3 Распределение фирм по стоимости основных фондов

Группы фирм по стои-

 

Количество фирм

 

 

Середина интервала

мости основных фондов,

 

 

 

 

 

 

 

млн.р.

 

 

 

 

 

 

 

 

 

0,5–1,0

 

 

 

20

 

 

 

0,75

1,0–1,5

 

 

 

40

 

 

 

1,25

1,5–2,0

 

 

 

25

 

 

 

1,75

2,0–2,5

 

 

 

20

 

 

 

2,25

Итого

 

 

 

105

 

 

 

 

 

Для расчета показателя асимметрии необходимо рассчитать среднюю

арифметическую и моду.

 

 

 

 

 

 

xf

 

0,75 * 20 1,25 * 40 1,75 * 25 2,25 * 20

 

 

 

x f

=

 

 

 

 

 

 

1,46

 

 

 

105

 

 

Мода для интервального ряда рассчитывается по формуле

 

 

 

 

f Mo

f Mo 1

 

 

40 20

M o xMo

hMo

 

 

1 0,5

 

1,28

f Mo f Mo 1

f Mo fMo 1

40 20 40 25

Рассчитаем асимметрию по формуле

Аs x Mo 1,46 1,28 0,18

так как показатель асимметрии больше 0, то асимметрия правосторонняя, кривая распределения вытянута вправо.

Рассчитаем показатель эксцесса

 

 

 

(0,75 1,46)4

* 20 (1,25 1,46)4 * 40 (1,75 1,46)4 * 25 (2,25 1,46)

4 20

0,125

4

 

 

 

 

105

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

(0,75 1,46)2

20 (1,25 1,46)2 40 (1,75 1,46)2 25 (2,25 1,46)

2 20

0,252

 

 

 

 

105

 

 

 

 

 

 

 

 

 

 

 

 

х

 

0,125

 

3 1,03

 

 

 

 

 

 

 

 

 

 

 

(0,252)

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель эксцесса меньше 0, следовательно распределение имеет низковершинный вид.

ТЕМА 5. ВЫБОРОЧНЫЙ МЕТОД Понятие о выборочном методе. Выборочное наблюдение – это такое

несплошное наблюдение, при котором отбор подлежащих исследованию

41

единиц совокупности осуществляется случайно, отобранная часть подвергается исследованию, после чего результаты распространяются на всю совокупность.

К использованию выборочного метода прибегают в следующих случаях: когда само наблюдение связано с порчей или уничтожением наблюдаемых единиц (например, пряжа на крепость, электрическая лампочка на продукт горения); большой объем совокупности; значительные затраты (финансовые и трудовые).

Обычно выборочному обследованию подвергается 5–10% всей совокупности, реже 15–25%.

Целью выборочного наблюдения является определение характеристик генеральной средней x и генеральной доли (р).

Характеристиками выборочной совокупности являются – средняя ве-

личина изучаемого признака ~ и доля определенных исследуемых единиц

( х )

(w), которые отличаются от генеральных характеристик на величину предельной ошибки выборки для средней величины ( ) и для доли ( ). По-

~

х

этому необходимо вычислять ошибку выборки или ошибку репрезентативности, которая определяется по формулам, разработанным в теории вероятности для каждого вида выборки и способа отбора.

Существуют следующие способы отбора единиц в выборочную совокупность:

-повторный отбор по схеме возвращенного шара, обычно называемый повторной выборкой.

При повторном отборе вероятность попадания каждой отдельной единицы в выборку остается постоянной, т.к. после отбора какой–то единицы, она снова возвращается в совокупность и снова может быть выбранной.

-бесповторный отбор по схеме невозвращенного шара, называемый бесповторной выборкой. В этом случае каждая отобранная единица не возвращается обратно, и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастет). Примером может служить жеребьевка, таблицы случайных чисел.

Выборочные показатели, как правило, не совпадают с соответствующими показателями генеральной совокупности, а несколько отличаются от них в одну или другую сторону, т.е. при выборочном методе всегда могут возникнуть ошибки, которые можно подразделить на ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации, присущие сплошному и выборочному наблюдению. Причина этих ошибок может быть разная: и по вине того, кто проводит наблюдение, и по вине отвечающего на вопросы, и от способа наблюдения. Ошибки данного вида можно уменьшить, если тщательно провести подготовку кадров и продумать организацию проведения наблюдения.

42

Ошибки репрезентативности имеют место только в выборочном наблюдении, они могут быть как случайными, так и систематическими, которые возникают в результате нарушения случайности отбора. Случайная ошибка возникает в силу того, что исследуется часть, а не вся совокупность.

Главная задача выборочного метода состоит в определении величины случайных ошибок репрезентативности. Их нахождение позволяет судить о точности выборки, о возможности распространения выборочных характеристик на генеральную совокупность.

Ошибка выборки для средней величины будет равна

 

~

х

 

, а для доли

 

 

 

х

 

p . Однако эту разницу определить невозможно, так как х и р неизвест-

ны и для их определения и проводится выборочное наблюдение.

Случайные ошибки выборки определяются по формулам, разработанным на основе теории вероятности, и носят вероятностный характер.

В практике выборочных обследований наибольшее распространение получили следующие выборки: собственно–случайная; механическая; типическая; серийная; комбинированная.

Для каждого вида выборок существует своя методика определения ошибок, рассмотрим каждую из них.

Ошибки собственно-случайной выборки. Собственно – случайная выборка – это такая, при которой отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности.

При этом количество отобранных единиц обычно определяется исходя из принятой доли выборки.

Доля выборки К в есть отношение числа единиц выборочной совокупности (n) к численности единиц генеральной совокупности (N).

 

К

в

n

.

(5.1)

 

N

 

 

 

 

 

 

 

Так при 5% выборке из партии товара в 2000 единиц численность вы-

борки (n) составит 100 единиц (

5 * 2000

), а при 20% выборке она составит 400

 

 

 

100

 

 

 

единиц ( 20 * 2000 ). 100

Важное условие собственно случайной выборки состоит в том, что каждой единице генеральной совокупности предоставляется равная возможность попасть в выборочную совокупность.

При определении точности выборочных показателей различают среднюю ошибку и предельную.

Средняя ошибка выборки (μ) представляет среднее квадратическое отклонение возможных значений выборочной средней от генеральной средней.

Среднюю ошибку выборки находят по формуле