uchebnik10
.pdfОтсюда можно вывести следующие рабочие формулы, удобные
при вычислении дисперсии непосредственно по значениям
варьирующего признака: |
|
|
|
|
|
|
2_ |
1 |
[~2 |
(~X/)2]. |
(15) |
||
SX- |
n -1 |
|
~Xl - |
n |
, |
|
2 |
|
I |
( 2 |
-2) |
; |
(16) |
SX= n -1 |
1:xi-nx |
|
||||
|
|
|
|
|
|
(17) |
или при повторяемости отдельных вариант
Sx |
1 |
[1:/' 2 _ (~f/XI)2) |
(15а)" |
||
2 |
n- 1 |
'1 Х/ |
|
, |
|
|
n |
|
|||
|
2 |
1 |
nx2); |
|
|
SX= n - l (1: lix7 - |
|
(16а) |
|||
s~= |
1 l~ fiX; _ (~f/x/)2 ]. |
(17а) |
|||
|
n-I |
n |
n |
|
|
Среднее квадратическое |
отклонение |
sx. |
Наряду |
с диспер |
сией важнейшей характеристикой варьирования является сред
нее квадратическое отклонение - показатель, представляющий
~opeHЬ квадратный из дисперсии:
Sx=11 ~(XI-x)2. |
(18) |
|
V |
n - l |
|
Эта величина в ряде случаев оказывается более удобной харак
теристикой варьирования, чем дисперсия, так как выражается в
Тех же единицах, что и средняя арифметическая величина.
. Дисперсия и среднее квадратическое отклонение наилучшим
рбразом характеризуют не только' величину, но и специфику j3арьирования признаков. Чтобы убедиться в этом, вернемся к
рассмотренным выше рядам распределения, у которых одинако
вый размах вариации и одинаковые средние показатели, но раз
личный характер варьирования, и вычислим для них дисперсию
и среднее квадратическое отклонение:
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
50 |
Хt- ЗО |
-20 |
-15 |
-10 |
-5 |
О |
+5 |
+ 10 |
+15 |
+20 |
|
400 |
225 |
100 |
25 |
О |
25 |
100 |
225 |
400 |
};(Xi -х)2.... |
|
|
|
|
|
|
|
|
|
... 1500 |
Отсюда Sz2=1500J(9-1} = 187,5 и sx=V187,5=13,7.
49
10 |
28 |
28 |
30 |
30 |
30 |
32 |
32 |
50 |
-20 -2 -2 |
О |
О |
О |
+2 |
+2 |
+20 |
||
400 |
4 |
4 |
О |
О |
О |
4 |
4 |
400 |
Отсюда 8%2=816/8=102 и 8х=У 102=10,1.
Из приведенных вычислений видно, что при одинаковых ли
митах и размахе вариации дисперсия и среднее квадратическое
отклонение оказались неодинаковыми: на величине этих показа
телей сказался различный характер варьирования признаков.
Поправка Шеппарда. При превращении интервального ва
риационного ряда в безынтервальный ряд частоты распределе ния относят к средним значениям классовых интервалов без
учета внутриклассового разнообразия. Между тем варианты
внутри классов распределяются неравномерно, накапливаясь
больше у тех границ, которые ближе к средней арифметической
ряда. Отсюда следует, что при ВЫЧИСЛении обобщающих харак
теристик для непрерывно варьирующих признаков допускают
систематическую погрешность, величина которой зависит от ши
рины классового интервала: чем шире интервал, тем больше и
погрешность. На величине средней арифметической погрешность отражается слабо, тогда как на величине дисперсии она сказы вается более сильно. Учитывая это обстоятельство, В. Шеппард (1898) установил, что разность между расчетной и фактической величиной дисперсии составляет 1/12 квадрата классового интер вала. Следовательно, при вычислении дисперсии по формуле
(13) следует вносить поправку Шеппарда, т. е. вычитать эту
величииу (+ 1..2) из 8%2. Так, если взять распределение каль
ция (мг%) в сыворотке крови обезьян, для которого известны
8,,2= 1,60 и 8,,= 1,26, то, учитывая ширину классового интервала
л=О,8 мг% и внося поправку Шеппарда, получим 8%2= 1,60--
-0,82/12=1,55 и 8х=1Il,55=1,24.
Поправка Шеппарда вносится далеко не всегда. Ее обычно
применяют или при высокой точности расчетов, ИЛИ при нали
чии большого числа наблюдений (n;;;>-500) , распределяемых в
интервальный вариационный ряд. Для получения обобщающих числовых характеристик небольших и средних по объему (n< <500) совокупностей поправку Шеппарда не вносят.
Коэффициент вариации V, Cv. Дисперсия и среднее квадра
тическое отклонение применимы и для сравнительной оценки
одноименных средних величин. В практике же довольно часто
приходится сравнивать изменчивость признаков, выраженных
разными единицами. В таких случаях нспользуют не абсолют
ные, а относительные показатели вариации. Дисперсия и сред
нее квадратическое отклонение как величины, выражаемые теми
же единицами, что и характеризуемый ими призиак, дли оцеики
50
изменчивости разноименных величин непригодны. Одним из
относительных показателей вариации является коэффициент
вариации. Этот показатель представляет собой среднее квадра
тическое отклонение, выраженное в процентах от величины
средней арифметической:
CV= S: 100%. |
( 19) |
х |
|
Прuмер 13. Сравнивают два варьирующих признака. Один
характеризуется средней XI=2,4 кг и средним квадратическим
отклонением 81=0,58 кг, другой - величинами Х2=8,3 см и 82= 1,57 см. Следует ли отсюда, что второй признак варьирует
сильнее, чем первый? Нет, не следует, так как среднее квадра
тическое отклонение определяют по отклонениям от средних, а
они различны по величине. Кроме того, не вполне корректно
сравнивать величины, выраженные разными единицами меры.
Именно поэтому в подобных случаях уместно использовать без размерные значения коэффициентов вариации. Сравнивая их в
приводимом примере, находим, что сильнее варьирует не вто
рой, а первый признак:
CV1 = 100(0,58/2,4)=24,2 % и Cv2=100(1,57/8,3)=18,9 %.
Различные признаки характеризуются различными коэффи
циентами вариации. Но в отношении одного и того же призна
ка значение этого показателя Cv остается более или менее
устойчивым и при симметричных распределениях обычно не пре
вышает 50%. При сильно асимметричных рядах распределения
коэффициент вариации может достигать 100% и даже выше.
Варьирование считается слабым, если не превосходит 10%, средним, когда Cv составляет 11-25%, и значительным при
CV>25%.
Применяя коэффициент вариации в качестве характеристики
варьирования, следует учитывать единицы размерности изучае
),{ого признака: линейные или весовые (объемные). Акад.
И. И. Шмальгаузен (1936) отмечал, что в таких случаях коэф
фициент вариации оказывается неодинаковым. Иллюстрацией тому могут служить данные Ю. Г. Артемьева (1939), исследо
вавшего варьирование величины внутренних органов у малых сусликов в зависимости от того, какими единицами меры выра
Жены признаки (табл. 10).
Данные, приведенные в табл. 1О, показывают, что при линей
ном выражении величины признака коэффициент вариации ока зывается примерно в три раза меньше, чем при кубическом вы
ражении того же признака. Причина такого явления - в мате ldатических свойствах Cv, которые надо учитывать, чтобы избе
Жать возможных ошибок.
51
Таблица tr
ко~ффициент вариации при разном
|
|
выражеиии |
призиаков |
Органы |
|
I |
|
|
лииейном |
кубнческом |
|
|
|
||
Сердце |
3,4 |
|
10,2 |
Легкне |
9,6 |
|
29,5 |
Селезенка |
9,8 |
|
29,8 |
Почка |
3,1 |
|
9,4 |
Печень |
3,0 |
|
9,3 |
Нормированное отклонение t. Отклонение той или иной ва
рианты от средней арифметической, отнесенное к величин~
среднего квадратического отклонения, называют нормирова1-
ным отклонением:
(20
Этот показатель позволяет «измерять» отклонения отдельны:
вариант от среднего уровня и сравнивать их для разных при~
наков.
Пример 14. При обследовании группы подростков в возра
сте от 15 до 16 лет установлено, что средний рост юношей Ха
рактеризуется следующими показателями: х= 164,8 см |
и sx=- |
||
=5,8 см. В группе оказался |
юноша, |
рост которого |
paBel- |
172,4 см. Спрашивается: как |
велико |
отклонение роста |
ЭТОГt |
юноши от средней величины данного признака в этой группе
Нормируя рост юноши (_х=172,4), находим '='1724-1648'-
5,8
= + 1,31.
Получая значения нормированных отклонений для разны;
признаков, можно сравнить места, занимаемые особью, ИНДИВl>
дом и т. п. по каждому из этих признаков в их распределень
ях. Пусть, например, нормированное отклонение у рассмаТрп
ваемого юноши по ширине плеч равно - 0,41. Тогда можно ут
верждать что у него длина тела отклоняется от средней в сто рону больших величин этого признака, а ширина плеч - в ст(\-
u
рону малых, т. е. характерен относительно узкоплечии тип ТI=
лосложения.
Нормированное отклонение используют также при работе ~
так называемым нормальным распределением.
11.3.СПОСО&Ы ВЫЧИСЛЕНИЯ СТЕПЕННЫХ СРЕДНИХ
ИПОКАЭАТЕЛЕА ВАРИАЦИИ
Моменты распределения. Средние величины и показатели ва
риации вычисляются как на группированном, так и негруппиро
ванном в вариационные ряды исходном материале. Известны
три основных способа вычисления обобщающих числовых ха рактеристик: способ произведений, способ условной средней и
способ сумм или кумулят. Каждый способ имеет свои конструк
тивные особенности, но любой из них приводит К одному И
тому же конечному результату.
Чтобы раскрыть сущность каждого способа и облегчить по
нимание конструктивных особ~ностей других обобщающих по казателей, с которыми придется встречаться в дальнейшем, не
обходимо познакомиться с понятием статистических моментов,
или моментов распределения.
Моментами распределения называют суммы отклонений ва риант Х! от какого-либо числа А, возведенные в k-ю степеиь и
отнесенные к общему числу вариант n, составляющих данную
совокупность. Иными словами, это величины, которые можно
выразить в виде следующей общей формулы:
м=-I ~(XI-A)1I.
n
Если отклонения вариант вычисляют по отношению к нуле вой точке, то моменты называют начальными (т); если от
средней арифметической, то моменты называют цен.тральн.ыми
И обозначают греческой буквой J..t (ми). Если же отклонения
вариант находят от произвольно выбранного числа А, моменты
называют условными (Ь). В зависимости от степени отклоне
Ний статистические моменты подразделяют на моменты перво
го, второго и больших порядков. В области биометрии исполь
зуют обычно моменты первого, второго, третьего и четвертого
порядков. Формулы для их вычисления приведены в табл. 11.
Центральные моменты ряда распределения связаны с ус-
Jювными моментами следующим образом:
111=b1 -Ь1 =О;
IL -Ь bZ-sZ'
г2- 2 - 1 - ,
P-з=Ьз- ЗЬ1Ь2+ 2b~;
114 = Ь4 - 4ЬzЬз+6b~bz - ЗЬi.
Эти формулы используют при вычислении обобщающих ха·
рактеристик вариационного ряда. При замене в этих форму· ilax обозначений условных моментов Ь, на начальные т, можно
53
|
|
|
Таблица С |
МОlllенты |
|
|
|
рас:преде- |
Начальные |
Центральные |
Условные |
лении |
|
|
|
Первого по- |
ml= |
~ f (х - О) |
- |
11-1 = |
~f(x -х) |
Ь1 |
= |
~f(x - А) |
рядка |
|
n |
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|
~fx
=n
|
|
m2= |
~f(x -0)2 |
- |
11-2 = |
~ f(x - |
х)2 |
Ь2 = |
~f(x _А)2 |
||
Второго |
по- |
|
n |
|
n |
||||||
рядка |
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
~fx2 |
|
|
|
|
|
|
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Третьего |
по- |
mз= ~f(x - |
0)3 - |
II-з = |
~ f(x - |
х)3 |
Ьз = |
~f(x-A)3 |
|||
|
|
п |
|
|
|
n |
|
|
n |
||
рядка |
|
|
|
|
|
|
|
|
|
||
|
|
|
~fx3 |
|
|
|
|
|
|
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m4= |
~ f (х - |
0)4 |
= |
11-4 = |
~! (х - |
х)4 |
Ь4 = |
~f(x-A)4 |
|
Четвертого |
|
n |
|
n |
|||||||
|
|
|
|
|
|
|
n |
|
|
порядка |
|
~fx4 |
|
= |
|
|
n |
|
|
|
получить выражения для вычисления центральных моментов
Способ произведениЙ. Основу этого способа составляет на
хождение отклонений вариант от средней величнны, характерн
зующей данную статнстическую совокупность. Каждое ОТКЛОНt:
ние возводится в степень, затем эти степени отклонений CYMMh
руются. В простейшем виде эта операция записывается так:
~ ( |
Х/ - |
- ) |
= |
~ 2 |
(~х)2 |
D = ~ |
Х 2 |
~ Х/ - |
N . |
||
1-1 |
|
|
|
I~1 |
|
В совокупности варианты обычно повторяются, поэтому СУА..
мы отклонений вариант от средней должны умножаться на и;
веса или частоты (отсюда и название способа), т. е. раССЧИТl:-'
ваться по взвешенным суммам квадратов отклонений (девиат)
k |
k |
(~flx)2. |
D= ~(XI-X)2= ~ f/x7- |
||
1-1 |
1-1 |
n |
54
Пример 15. По данным Г. Е. Бодренкова (1963), длина тела
у личинок щелкуна, отобранных случайным способом в посеве
озимой ржн и нзмеренных в миллиметрах, варьировала сле
дующим образом: 7, 10, 14, 12, 15, 16, 12. Средняя длнна лн
чинок х= (1/1) (7+10+14+ ... +12) =86/7= 12,3 |
мм. Чтобы |
||||||
определить показатели вариации, предварительно |
находим: |
||||||
7 |
10 |
14 |
12 |
15 |
16 |
12' |
1:Xj=86 |
49 |
100 |
196 |
Н4 |
225 |
256 |
144 |
1:xj2 ... 1114 |
Отсюда значение девиаты D= 1114-862/1=57,43.
. |
2 |
D |
5743 |
|
sx=9,57=3,094 |
|
вариацин 8х= |
n -1 |
= - ' - =9,57; |
||
|
|
6 |
|
|
|
|
ент варнации Cf1= 100 3 '094 |
=24,2 %. |
|||
|
|
|
12,3 |
|
|
Показатели и коэффицн-
Пример 16. Определить среднее число поросят в пометах 64 свиноматок (см. гл. 1) и вычислить показатели вариации для этого распределения. Предварительно рассчитаем вспомо
гательные величины 1:Xi2, 1:!iXi И 1:!iXi2. Расчет проводится в
табл. 12.
Таблица 12
K.naccw |
I |
Частоты |
X j 2 |
\ |
Х; |
'; |
|
||
|
I |
|||
5 |
|
4 |
25 |
|
6 |
|
7 |
36 |
|
7 |
|
13 |
49 |
|
8 |
|
15 |
64 |
|
9 |
|
7 |
81 |
|
10 |
|
9 |
100 |
|
11 |
|
6 |
121 |
|
12 |
|
3 |
144 |
|
Сумма |
|
64 |
- |
|
fjXj |
f j X j 2 |
|
\ |
20 |
100 |
42 |
252 |
91 |
637 |
120 |
960 |
63 |
567 |
90 |
900 |
66 |
726 |
36 |
432 |
528 |
4574 |
Подставляя найденные велнчины в формулы, имеем х=
. |
1 ( |
5282)= |
~=З 46's |
= |
р28/64=8,25 поросят; s; = 63 4574- |
||||
|
|
64 |
63 " |
z |
... 1,85 и Cv= 100 1,86 |
=22,5 %. |
|
|
|
8,25 |
|
|
|
|
Прuмер 17. Годовой удой 80 коров, содержащихся на ферме,
распределился следующи·м образом:
55
Удой, кг |
2500-- |
2600-- |
2700-- |
2800-- |
2900-- |
3000-- |
3100-- |
3200--3300 |
Число коров |
2 |
5 |
13 |
20 |
16 |
17 |
4 |
3 |
Вычислить характеристики для этого ряда. Предварительно
превратим интервальный ряд в безынтервальный: 2550 2650 2750 2850 и т. д. Чтобы облегчить вычислительную работу,
уменьшим каждую классовую варианту на А=2500 и разделим
полученную величину на К= 10. По преобразованным значе
ниям классов: (2550-2500): 10=5; (2650-2500): 10= 15;
(2750-2500): 10=25 и т. д. - рассчитываем вспомогательные
величины (табл. 13).
Подставляя известные величины в формулы с учетом тех поправок, которые внесены в данном случае (см. табл. 9), на·
ходим: х= "l.flX/ К+А= 3250
n |
80 |
10+2500=2906,25 кг;
s;'= 1 |
[~!x2- (~fiХi)З]К2=_1 (151500--32502)102= |
|||
n -- 1 |
I 1 |
n |
79 |
80 |
=(151400-132031,25)/79= 1936875/7'9=24517,40; sx=
=V24517,40=156,58 и Ср= 100 156,58 =5,4%. |
|||||
|
|
|
2906,25 |
|
|
|
|
|
|
Таблица 13 |
|
Преобразован, |
Частоты |
|
|
|
|
НЫе ЗНачення |
|
|
|
||
'; |
fjXj |
Xjl |
fjXjl |
||
Xj* |
|||||
K.naCCOB |
|
|
|
|
|
5 |
2 |
10 |
25 |
50 |
|
15 |
5 |
75 |
225 |
1125 |
|
25 |
13 |
325 |
625 |
8125 |
|
35 |
20 |
700 |
1225 |
24500 |
|
45 |
16 |
720 |
2025 |
32400 |
|
55 |
17 |
935 |
3025 |
51425 |
|
65 |
4 |
260 |
4225 |
16900 |
|
75 |
3 |
225 |
5625 |
16875 |
|
Сумма |
80 |
3250 |
- |
151400 |
|
|
|||||
Способ условной средней. |
Нельзя |
не заметить, |
что вычисле |
ние статистических характеристик способом произведений, осо
бенно при наличии многозначных чисел, представляет собой
трудоемкий процесс. Гораздо легче рассчитать статистические
характеристики упрощенным сnособо'м условной средней, назы
ваемым также сnособо'м условного нуля. Суть этого способа за
ключается в следующем.
Одну из вариант условно принимают за среднюю величину,
обозначив ее через А. Обычно в качестве условной средней, илИ
56
нулевой точки отсчета, берут варианту или класс с наиболь
шей частотой, хотя это и не обязательно: в качестве условной
'средней можно принять любую варианту (при наличии негруп
пированных данных) или любой класс вариационного ряда. На
метив величину А, остается найти поправку, которую необхо
,\имо прибавить или вычесть (смотря по знаку) от условной
..;реднеЙ, чтобы получить значение средней арифметической Х.
Такой поправкой служит условный момент первого порядка
jl= ~fl(Хi-А) (см. табл. 11). Обозначив отклонения вари-
n
ант от условной средней через а, получим b1 = ~fia 'Отсюда
n
:рормула для определения средней арифметической
(21 )
LLисперсия, определяемая этим способом, равна
между условным моментом второго и квадратом
момента первого порядка, умноженной на величину
~оторая называется поправкой Бесселя:
2 _ n |
( |
Ь2) |
sx- n-I |
I\ |
ь2 - l' |
~ развернутом виде эта формула выглядит так:
,'
;' |
s~= |
1 [:l'f.a2_(~f;a)2] или |
||
. |
n-I |
l |
n |
|
'. |
s;= |
|
[~fia2 _( ~fja )2J. |
|
|
n |
|||
|
|
n-I |
n |
n |
разности
условного
n! (n-l),
(22)
(23)
(24)
Ниже приведены конкретные примеры применения этих фор
!4ул.
, Пример 18. Вычислить способом условной средней основные ~арактеристики ряда распределения кальция (мг%) в сыворот
~e крови обезьян. Предварительно рассчитываем вспомогатель-
1ые величины Щiа и Щiа2 (табл. 14).
~ В качестве условной средней А взята классовая варианта, равная 11,4. От этой величины находим отклонения классов:
1)0-11,4=-2,4; 9,8-11,4=-1,6 и т. д. (см. третью графу
!lбл. 14). Подставляем найденные величины в формулы:
, |
. x=11,4+53,6/l00=11,936:::::: 11,94 |
мг%; |
|
||
S2=~[187.52_(5з.6)2]= 100 (18752-02873)=160. |
|||||
х |
99 100 |
100 |
99' |
• |
, , |
57
Кnассы |
Частоты |
Х! |
l! |
1 |
2 |
9,0 |
2 |
9,8 |
6 |
10,6 |
15 |
11,4 |
23 |
12,2 |
25 |
13,0 |
17 |
13,8 |
7 |
14,6 |
5 |
Сумма |
100 |
Отсюда |
sx=Vl,60=I,26 |
|
|
|
|
Табnица 1· |
a-(xj-A) |
l j a |
l j a2 |
||
|
3 |
|
- |
|
|
|
4 |
5 |
|
-2,4 |
-4,8 |
11,52 |
||
-1,6 |
-9,6 |
15,36 |
||
-0,8 |
-12,0 |
9,60 |
||
О |
|
О |
О |
|
+о.в |
+20,0 |
16,00 |
||
+1,6 |
+27,2 |
43,52 |
||
+2,4 |
+16,8 |
40,32 |
||
+3,2 |
+16,0 |
51,20 |
||
- |
|
+53,6 |
187,52 |
|
и С |
u |
=100 |
1,26 10,6%. |
|
|
|
11,94 |
|
Вычисление вспомогательных величин можно значитеЛЬНl
упростить, если отклонения классовых вариант от условноf
средней А относить к величине классового интервала, т. е. BMeL то а= (xi-A) брать а= (Хi-А)/Л. Тогда во всех без ИСКЛЮЧt:
ния случаях (для равноинтервальных рядов) отклонения клаL
совых вариант от условной средней А, где а=О, превращаютс}
в ряд натуральных чисел 1, 2, 3, 4 и т. д., которые, как и в Прt:
дыдущем случае, рассматриваются в сторону меньших, чем r
значений вариант с отрицательным, а в сторону ббльших, чеl\
А, значений - с положитетельным знаком. При этом в форм', лы (21), (23) и (24) вносятся поправки на величину классовог
интервала:
х=А+л У. f/a ; |
(25 |
n |
|
s;= |
1.,2 |
(~f,a2 _ |
Y.f/ a ] |
|
n - l |
~ I |
n |
s~ |
).2n |
[У. f;a'! |
_ ( У. fja |
|
п-l |
n |
n |
или (26
)2]. (27
Применив эти формулы к рассматриваемому примеру, раССЧI'
тываем 'Щiа и 'Щiа2 (табл. 15).
Подставляя известные величины в формулы (25) и (26
находим:
-х=II,4+0,8 67 =11,4+0,536=11,936::::::::-11,94 мг%;
100
i= 0,82 (293672)= 0,64 |
(293-4489) |
]58,79=160. |
||||
х |
99 |
100 |
99 |
' |
99 |
• |
58