Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

uchebnik10

.pdf
Скачиваний:
35
Добавлен:
21.03.2015
Размер:
8.26 Mб
Скачать

Отсюда можно вывести следующие рабочие формулы, удобные

при вычислении дисперсии непосредственно по значениям

варьирующего признака:

 

 

 

 

 

2_

1

[~2

(~X/)2].

(15)

SX-

n -1

 

~Xl -

n

,

2

 

I

( 2

-2)

;

(16)

SX= n -1

1:xi-nx

 

 

 

 

 

 

 

(17)

или при повторяемости отдельных вариант

Sx

1

[1:/' 2 _ (~f/XI)2)

(15а)"

2

n- 1

'1 Х/

 

,

 

 

n

 

 

2

1

nx2);

 

 

SX= n - l (1: lix7 -

 

(16а)

s~=

1 l~ fiX; _ (~f/x/)2 ].

(17а)

 

n-I

n

n

 

 

Среднее квадратическое

отклонение

sx.

Наряду

с диспер­

сией важнейшей характеристикой варьирования является сред­

нее квадратическое отклонение - показатель, представляющий

~opeHЬ квадратный из дисперсии:

Sx=11 ~(XI-x)2.

(18)

V

n - l

 

Эта величина в ряде случаев оказывается более удобной харак­

теристикой варьирования, чем дисперсия, так как выражается в

Тех же единицах, что и средняя арифметическая величина.

. Дисперсия и среднее квадратическое отклонение наилучшим

рбразом характеризуют не только' величину, но и специфику j3арьирования признаков. Чтобы убедиться в этом, вернемся к

рассмотренным выше рядам распределения, у которых одинако­

вый размах вариации и одинаковые средние показатели, но раз­

личный характер варьирования, и вычислим для них дисперсию

и среднее квадратическое отклонение:

10

15

20

25

30

35

40

45

50

Хt- ЗО

-20

-15

-10

-5

О

+5

+ 10

+15

+20

 

400

225

100

25

О

25

100

225

400

};(Xi -х)2....

 

 

 

 

 

 

 

 

 

... 1500

Отсюда Sz2=1500J(9-1} = 187,5 и sx=V187,5=13,7.

49

10

28

28

30

30

30

32

32

50

-20 -2 -2

О

О

О

+2

+2

+20

400

4

4

О

О

О

4

4

400

Отсюда 8%2=816/8=102 и 8х102=10,1.

Из приведенных вычислений видно, что при одинаковых ли­

митах и размахе вариации дисперсия и среднее квадратическое

отклонение оказались неодинаковыми: на величине этих показа­

телей сказался различный характер варьирования признаков.

Поправка Шеппарда. При превращении интервального ва­

риационного ряда в безынтервальный ряд частоты распределе­ ния относят к средним значениям классовых интервалов без

учета внутриклассового разнообразия. Между тем варианты

внутри классов распределяются неравномерно, накапливаясь

больше у тех границ, которые ближе к средней арифметической

ряда. Отсюда следует, что при ВЫЧИСЛении обобщающих харак­

теристик для непрерывно варьирующих признаков допускают

систематическую погрешность, величина которой зависит от ши­

рины классового интервала: чем шире интервал, тем больше и

погрешность. На величине средней арифметической погрешность отражается слабо, тогда как на величине дисперсии она сказы­ вается более сильно. Учитывая это обстоятельство, В. Шеппард (1898) установил, что разность между расчетной и фактической величиной дисперсии составляет 1/12 квадрата классового интер­ вала. Следовательно, при вычислении дисперсии по формуле

(13) следует вносить поправку Шеппарда, т. е. вычитать эту

величииу (+ 1..2) из 8%2. Так, если взять распределение каль­

ция (мг%) в сыворотке крови обезьян, для которого известны

8,,2= 1,60 и 8,,= 1,26, то, учитывая ширину классового интервала

л=О,8 мг% и внося поправку Шеппарда, получим 8%2= 1,60--

-0,82/12=1,55 и 8х=1Il,55=1,24.

Поправка Шеппарда вносится далеко не всегда. Ее обычно

применяют или при высокой точности расчетов, ИЛИ при нали­

чии большого числа наблюдений (n;;;>-500) , распределяемых в

интервальный вариационный ряд. Для получения обобщающих числовых характеристик небольших и средних по объему (n< <500) совокупностей поправку Шеппарда не вносят.

Коэффициент вариации V, Cv. Дисперсия и среднее квадра­

тическое отклонение применимы и для сравнительной оценки

одноименных средних величин. В практике же довольно часто

приходится сравнивать изменчивость признаков, выраженных

разными единицами. В таких случаях нспользуют не абсолют­

ные, а относительные показатели вариации. Дисперсия и сред­

нее квадратическое отклонение как величины, выражаемые теми

же единицами, что и характеризуемый ими призиак, дли оцеики

50

изменчивости разноименных величин непригодны. Одним из

относительных показателей вариации является коэффициент

вариации. Этот показатель представляет собой среднее квадра­

тическое отклонение, выраженное в процентах от величины

средней арифметической:

CV= S: 100%.

( 19)

х

 

Прuмер 13. Сравнивают два варьирующих признака. Один

характеризуется средней XI=2,4 кг и средним квадратическим

отклонением 81=0,58 кг, другой - величинами Х2=8,3 см и 82= 1,57 см. Следует ли отсюда, что второй признак варьирует

сильнее, чем первый? Нет, не следует, так как среднее квадра­

тическое отклонение определяют по отклонениям от средних, а

они различны по величине. Кроме того, не вполне корректно

сравнивать величины, выраженные разными единицами меры.

Именно поэтому в подобных случаях уместно использовать без­ размерные значения коэффициентов вариации. Сравнивая их в

приводимом примере, находим, что сильнее варьирует не вто­

рой, а первый признак:

CV1 = 100(0,58/2,4)=24,2 % и Cv2=100(1,57/8,3)=18,9 %.

Различные признаки характеризуются различными коэффи­

циентами вариации. Но в отношении одного и того же призна­

ка значение этого показателя Cv остается более или менее

устойчивым и при симметричных распределениях обычно не пре­

вышает 50%. При сильно асимметричных рядах распределения

коэффициент вариации может достигать 100% и даже выше.

Варьирование считается слабым, если не превосходит 10%, средним, когда Cv составляет 11-25%, и значительным при

CV>25%.

Применяя коэффициент вариации в качестве характеристики

варьирования, следует учитывать единицы размерности изучае­

),{ого признака: линейные или весовые (объемные). Акад.

И. И. Шмальгаузен (1936) отмечал, что в таких случаях коэф­

фициент вариации оказывается неодинаковым. Иллюстрацией тому могут служить данные Ю. Г. Артемьева (1939), исследо­

вавшего варьирование величины внутренних органов у малых сусликов в зависимости от того, какими единицами меры выра­

Жены признаки (табл. 10).

Данные, приведенные в табл. 1О, показывают, что при линей­

ном выражении величины признака коэффициент вариации ока­ зывается примерно в три раза меньше, чем при кубическом вы­

ражении того же признака. Причина такого явления - в мате­ ldатических свойствах Cv, которые надо учитывать, чтобы избе­

Жать возможных ошибок.

51

Таблица tr

ко~ффициент вариации при разном

 

 

выражеиии

призиаков

Органы

 

I

 

 

лииейном

кубнческом

 

 

Сердце

3,4

 

10,2

Легкне

9,6

 

29,5

Селезенка

9,8

 

29,8

Почка

3,1

 

9,4

Печень

3,0

 

9,3

Нормированное отклонение t. Отклонение той или иной ва­

рианты от средней арифметической, отнесенное к величин~

среднего квадратического отклонения, называют нормирова1-­

ным отклонением:

(20

Этот показатель позволяет «измерять» отклонения отдельны:

вариант от среднего уровня и сравнивать их для разных при~

наков.

Пример 14. При обследовании группы подростков в возра

сте от 15 до 16 лет установлено, что средний рост юношей Ха

рактеризуется следующими показателями: х= 164,8 см

и sx=-

=5,8 см. В группе оказался

юноша,

рост которого

paBel-

172,4 см. Спрашивается: как

велико

отклонение роста

ЭТОГt

юноши от средней величины данного признака в этой группе

Нормируя рост юноши (_х=172,4), находим '='1724-1648'-

5,8

= + 1,31.

Получая значения нормированных отклонений для разны;­

признаков, можно сравнить места, занимаемые особью, ИНДИВl>

дом и т. п. по каждому из этих признаков в их распределень

ях. Пусть, например, нормированное отклонение у рассмаТрп

ваемого юноши по ширине плеч равно - 0,41. Тогда можно ут­

верждать что у него длина тела отклоняется от средней в сто рону больших величин этого признака, а ширина плеч - в ст(\-

u

рону малых, т. е. характерен относительно узкоплечии тип ТI=

лосложения.

Нормированное отклонение используют также при работе ~

так называемым нормальным распределением.

11.3.СПОСО&Ы ВЫЧИСЛЕНИЯ СТЕПЕННЫХ СРЕДНИХ

ИПОКАЭАТЕЛЕА ВАРИАЦИИ

Моменты распределения. Средние величины и показатели ва­

риации вычисляются как на группированном, так и негруппиро­

ванном в вариационные ряды исходном материале. Известны

три основных способа вычисления обобщающих числовых ха­ рактеристик: способ произведений, способ условной средней и

способ сумм или кумулят. Каждый способ имеет свои конструк­

тивные особенности, но любой из них приводит К одному И

тому же конечному результату.

Чтобы раскрыть сущность каждого способа и облегчить по­

нимание конструктивных особ~ностей других обобщающих по­ казателей, с которыми придется встречаться в дальнейшем, не­

обходимо познакомиться с понятием статистических моментов,

или моментов распределения.

Моментами распределения называют суммы отклонений ва­ риант Х! от какого-либо числа А, возведенные в k-ю степеиь и

отнесенные к общему числу вариант n, составляющих данную

совокупность. Иными словами, это величины, которые можно

выразить в виде следующей общей формулы:

м=-I ~(XI-A)1I.

n

Если отклонения вариант вычисляют по отношению к нуле­ вой точке, то моменты называют начальными (т); если от

средней арифметической, то моменты называют цен.тральн.ыми

И обозначают греческой буквой J..t (ми). Если же отклонения

вариант находят от произвольно выбранного числа А, моменты

называют условными (Ь). В зависимости от степени отклоне­

Ний статистические моменты подразделяют на моменты перво­

го, второго и больших порядков. В области биометрии исполь­

зуют обычно моменты первого, второго, третьего и четвертого

порядков. Формулы для их вычисления приведены в табл. 11.

Центральные моменты ряда распределения связаны с ус-

Jювными моментами следующим образом:

111=b1 1 =О;

IL bZ-sZ'

г2- 2 - 1 - ,

P-з=Ьз- ЗЬ1Ь2+ 2b~;

114 = Ь4 - zЬз+6b~bz - ЗЬi.

Эти формулы используют при вычислении обобщающих ха·

рактеристик вариационного ряда. При замене в этих форму· ilax обозначений условных моментов Ь, на начальные т, можно

53

 

 

 

Таблица С

МОlllенты

 

 

 

рас:преде-

Начальные

Центральные

Условные

лении

 

 

 

Первого по-

ml=

~ f - О)

-

11-1 =

~f(x -х)

Ь1

=

~f(x - А)

рядка

 

n

 

 

n

 

 

n

 

 

 

 

 

 

 

 

~fx

=n

 

 

m2=

~f(x -0)2

-

11-2 =

~ f(x -

х)2

Ь2 =

~f(x _А)2

Второго

по-

 

n

 

n

рядка

 

 

 

 

 

 

 

n

 

 

 

 

 

 

~fx2

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Третьего

по-

mз= ~f(x -

0)3 -

II-з =

~ f(x -

х)3

Ьз =

~f(x-A)3

 

 

п

 

 

 

n

 

 

n

рядка

 

 

 

 

 

 

 

 

 

 

 

 

~fx3

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m4=

~ f -

0)4

=

11-4 =

~! (х -

х)4

Ь4 =

~f(x-A)4

Четвертого

 

n

 

n

 

 

 

 

 

 

 

n

 

 

порядка

 

~fx4

 

=

 

n

 

 

получить выражения для вычисления центральных моментов

Способ произведениЙ. Основу этого способа составляет на­

хождение отклонений вариант от средней величнны, характерн­

зующей данную статнстическую совокупность. Каждое ОТКЛОНt:­

ние возводится в степень, затем эти степени отклонений CYMMh

руются. В простейшем виде эта операция записывается так:

~ (

Х/ -

- )

=

~ 2

(~х)2

D = ~

Х 2

~ Х/ -

N .

1-1

 

 

 

I~1

 

В совокупности варианты обычно повторяются, поэтому СУА..

мы отклонений вариант от средней должны умножаться на и;

веса или частоты (отсюда и название способа), т. е. раССЧИТl:-'

ваться по взвешенным суммам квадратов отклонений (девиат)

k

k

(~flx)2.

D= ~(XI-X)2= ~ f/x7-

1-1

1-1

n

54

Пример 15. По данным Г. Е. Бодренкова (1963), длина тела

у личинок щелкуна, отобранных случайным способом в посеве

озимой ржн и нзмеренных в миллиметрах, варьировала сле­

дующим образом: 7, 10, 14, 12, 15, 16, 12. Средняя длнна лн­

чинок х= (1/1) (7+10+14+ ... +12) =86/7= 12,3

мм. Чтобы

определить показатели вариации, предварительно

находим:

7

10

14

12

15

16

12'

1:Xj=86

49

100

196

Н4

225

256

144

1:xj2 ... 1114

Отсюда значение девиаты D= 1114-862/1=57,43.

.

2

D

5743

 

sx=9,57=3,094

 

вариацин 8х=

n -1

= - ' - =9,57;

 

 

6

 

 

 

ент варнации Cf1= 100 3 '094

=24,2 %.

 

 

 

12,3

 

 

Показатели и коэффицн-

Пример 16. Определить среднее число поросят в пометах 64 свиноматок (см. гл. 1) и вычислить показатели вариации для этого распределения. Предварительно рассчитаем вспомо­

гательные величины 1:Xi2, 1:!iXi И 1:!iXi2. Расчет проводится в

табл. 12.

Таблица 12

K.naccw

I

Частоты

X j 2

\

Х;

';

 

 

I

5

 

4

25

 

6

 

7

36

 

7

 

13

49

 

8

 

15

64

 

9

 

7

81

 

10

 

9

100

 

11

 

6

121

 

12

 

3

144

 

Сумма

 

64

-

 

fjXj

f j X j 2

 

\

20

100

42

252

91

637

120

960

63

567

90

900

66

726

36

432

528

4574

Подставляя найденные велнчины в формулы, имеем х=

.

1 (

5282)=

~=З 46's

=

р28/64=8,25 поросят; s; = 63 4574-

 

 

64

63 "

z

... 1,85 и Cv= 100 1,86

=22,5 %.

 

 

 

8,25

 

 

 

 

Прuмер 17. Годовой удой 80 коров, содержащихся на ферме,

распределился следующи·м образом:

55

Удой, кг

2500--

2600--

2700--

2800--

2900--

3000--

3100--

3200--3300

Число коров

2

5

13

20

16

17

4

3

Вычислить характеристики для этого ряда. Предварительно

превратим интервальный ряд в безынтервальный: 2550 2650 2750 2850 и т. д. Чтобы облегчить вычислительную работу,

уменьшим каждую классовую варианту на А=2500 и разделим

полученную величину на К= 10. По преобразованным значе­

ниям классов: (2550-2500): 10=5; (2650-2500): 10= 15;

(2750-2500): 10=25 и т. д. - рассчитываем вспомогательные

величины (табл. 13).

Подставляя известные величины в формулы с учетом тех поправок, которые внесены в данном случае (см. табл. 9), на·

ходим: х= "l.flX/ К+А= 3250

n

80

10+2500=2906,25 кг;

s;'= 1

[~!x2- (~fiХi)З]К2=_1 (151500--32502)102=

n -- 1

I 1

n

79

80

=(151400-132031,25)/79= 1936875/7'9=24517,40; sx=

=V24517,40=156,58 и Ср= 100 156,58 =5,4%.

 

 

 

2906,25

 

 

 

 

 

Таблица 13

Преобразован,

Частоты

 

 

 

НЫе ЗНачення

 

 

 

';

fjXj

Xjl

fjXjl

Xj*

K.naCCOB

 

 

 

 

5

2

10

25

50

15

5

75

225

1125

25

13

325

625

8125

35

20

700

1225

24500

45

16

720

2025

32400

55

17

935

3025

51425

65

4

260

4225

16900

75

3

225

5625

16875

Сумма

80

3250

-

151400

 

Способ условной средней.

Нельзя

не заметить,

что вычисле­

ние статистических характеристик способом произведений, осо­

бенно при наличии многозначных чисел, представляет собой

трудоемкий процесс. Гораздо легче рассчитать статистические

характеристики упрощенным сnособо'м условной средней, назы­

ваемым также сnособо'м условного нуля. Суть этого способа за­

ключается в следующем.

Одну из вариант условно принимают за среднюю величину,

обозначив ее через А. Обычно в качестве условной средней, илИ

56

нулевой точки отсчета, берут варианту или класс с наиболь­

шей частотой, хотя это и не обязательно: в качестве условной

'средней можно принять любую варианту (при наличии негруп­

пированных данных) или любой класс вариационного ряда. На­

метив величину А, остается найти поправку, которую необхо­

,\имо прибавить или вычесть (смотря по знаку) от условной

..;реднеЙ, чтобы получить значение средней арифметической Х.

Такой поправкой служит условный момент первого порядка

jl= ~fl(Хi-А) (см. табл. 11). Обозначив отклонения вари-

n

ант от условной средней через а, получим b1 = ~fia 'Отсюда

n

:рормула для определения средней арифметической

(21 )

LLисперсия, определяемая этим способом, равна

между условным моментом второго и квадратом

момента первого порядка, умноженной на величину

~оторая называется поправкой Бесселя:

2 _ n

(

Ь2)

sx- n-I

I\

ь2 - l'

~ развернутом виде эта формула выглядит так:

,'

;'

s~=

1 [:l'f.a2_(~f;a)2] или

.

n-I

l

n

'.

s;=

 

[~fia2 _( ~fja )2J.

 

n

 

 

n-I

n

n

разности

условного

n! (n-l),

(22)

(23)

(24)

Ниже приведены конкретные примеры применения этих фор­

!4ул.

, Пример 18. Вычислить способом условной средней основные ~арактеристики ряда распределения кальция (мг%) в сыворот­

~e крови обезьян. Предварительно рассчитываем вспомогатель-

1ые величины Щiа и Щiа2 (табл. 14).

~ В качестве условной средней А взята классовая варианта, равная 11,4. От этой величины находим отклонения классов:

1)0-11,4=-2,4; 9,8-11,4=-1,6 и т. д. (см. третью графу

!lбл. 14). Подставляем найденные величины в формулы:

,

. x=11,4+53,6/l00=11,936:::::: 11,94

мг%;

 

S2=~[187.52_(5з.6)2]= 100 (18752-02873)=160.

х

99 100

100

99'

, ,

57

Кnассы

Частоты

Х!

l!

1

2

9,0

2

9,8

6

10,6

15

11,4

23

12,2

25

13,0

17

13,8

7

14,6

5

Сумма

100

Отсюда

sx=Vl,60=I,26

 

 

 

 

Табnица

a-(xj-A)

l j a

l j a2

 

3

 

-

 

 

 

4

5

-2,4

-4,8

11,52

-1,6

-9,6

15,36

-0,8

-12,0

9,60

О

 

О

О

+о.в

+20,0

16,00

+1,6

+27,2

43,52

+2,4

+16,8

40,32

+3,2

+16,0

51,20

-

 

+53,6

187,52

и С

u

=100

1,26 10,6%.

 

 

 

11,94

 

Вычисление вспомогательных величин можно значитеЛЬНl

упростить, если отклонения классовых вариант от условноf

средней А относить к величине классового интервала, т. е. BMeL то а= (xi-A) брать а= (Хi-А)/Л. Тогда во всех без ИСКЛЮЧt:­

ния случаях (для равноинтервальных рядов) отклонения клаL

совых вариант от условной средней А, где а=О, превращаютс}

в ряд натуральных чисел 1, 2, 3, 4 и т. д., которые, как и в Прt:­

дыдущем случае, рассматриваются в сторону меньших, чем r

значений вариант с отрицательным, а в сторону ббльших, чеl\

А, значений - с положитетельным знаком. При этом в форм', лы (21), (23) и (24) вносятся поправки на величину классовог

интервала:

х=А+л У. f/a ;

(25

n

 

s;=

1.,2

(~f,a2 _

Y.f/ a ]

 

n - l

~ I

n

s~

).2n

[У. f;a'!

_ ( У. fja

 

п-l

n

n

или (26

)2]. (27

Применив эти формулы к рассматриваемому примеру, раССЧI'

тываем 'Щiа и 'Щiа2 (табл. 15).

Подставляя известные величины в формулы (25) и (26

находим:

-х=II,4+0,8 67 =11,4+0,536=11,936::::::::-11,94 мг%;

100

i= 0,82 (293672)= 0,64

(293-4489)

]58,79=160.

х

99

100

99

'

99

58

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]