- •Биометрическая обработка данных на основе компьютерной программы statistica
- •Предисловие
- •Раздел 1. Характеристика программы statistica
- •Организация системы statistica
- •1.2. Статистические методы программы statistica
- •Раздел 2. Параметрические критерии
- •2.1. Описательная статистика Методы описательной статистики (Descriptive statistics) и характеристика статистических совокупностей
- •2.2. Статистические оценки генеральных параметров Оценка ошибок репрезентативности
- •Оценка ошибок репрезентативности
- •Показатель точности оценок
- •Оценка доверительного интервала средней арифметической –
- •Оценка доверительного интервала дисперсии –
- •2.3. Проверка нормальности эмпирического распределения Функции нормального распределения и методы оценки нормальности эмпирического распределения
- •Проверка нормальности эмпирического распределения
- •2.4. Параметрические критерии сравнения средних
- •Раздел 3. Непараметрические критерии
- •3.1. Сравнение независимых выборок
- •Сравнение зависимых групп
- •3.3. Сравнение номинальных (категориальных) переменных
- •Раздел 4. Корреляционный анализ
- •4.1. Параметрические показатели связи
- •4.2. Непараметрические показатели связи
- •Методика расчета коэффициент ранговой корреляции Спирмена ( )
- •Методика расчета коэффициента корреляции Спирмена ( )
- •4.3. Оценка связи между номинальными величинами
- •Раздел 5. Дисперсионный анализ
- •5.1. Однофакторный дисперсионный анализ
- •5.2. Двухфакторный дисперсионный анализ
- •Раздел 6. Регрессионный анализ
- •Раздел 7. Кластерный анализ
- •Раздел 8. Дискриминатный анализ
- •Оглавление
- •625003, Г. Тюмень, Семакова,10
2.3. Проверка нормальности эмпирического распределения Функции нормального распределения и методы оценки нормальности эмпирического распределения
В многочисленной группе особей, отобранной для изучения определенного признака, отдельные значения данного признака встречаются неодинаковое число раз. Совокупность всех возможных значений признака (хi) и соответствующих им значений частоты (рi) составляет распределение признака.
К числу наиболее распространенных типов распределения относится нормальное распределение, которое отражает характер варьирования количественных (непрерывно меняющихся) признаков. Нормальное распределение является частным случаем биномиального распределения, в котором p=q (р – вероятность наступления события А;
q – вероятность наступления противоположного события ) и n→∞. Графически нормальное распределение изображается в виде симметричной кривой, имеющей форму колокола.
Кривую нормального распределения характеризуют следующие закономерности:
– основное варьирование признака ограничивается лимитом, составляющим ±3 Sx от среднего значения признака ( ). В эти границы входит 99,7% всех особей совокупности. За пределами ±3 Sx встречается только 0,3% особей с величиной признака выше +3 Sx или меньше -3 Sх ;
– варьирование величины признака в границах ±3 Sx имеет особенность, которая заключается в том, что для каждой величины хi можно установить теоретическую частоту (у i) встречаемости особей с таким же значением. Для этих целей используют уравнение нормальной кривой:
уi =
где уi – теоретическое число наблюдений для данной величины хi;
Sx – среднее квадратическое отклонение;
– постоянное число равное 3,1416;
е – основание натуральных логарифмов, равное 2,71828;
(хi - ) – отклонение величины хi от средней арифметической ;
(хi - ): Sx = t – нормированное отклонение; (хi - )2:2 = t2 : 2.
Зная n и Sx совокупности, выражая отклонение хi от в нормированном отклонении t= (хi - ): Sx, можно определить величины теоретических частот и построить вариационный ряд. Теоретическая частота для любого значения х может быть определена по таблице значений ординат нормальной кривой (табл.5).
Вторая функция нормального распределения (ţ) показывает % особей совокупности, находящихся между значениями ординат. Существуют стандартные таблицы, в которых приведены величины (ţ) для любых значений t=(хi- ): Sx, от 0 до 4 Sx (табл. 6).
Третья функция нормального распределения F(ţ) показывает какова средняя величина признака в отобранной группе; вычисляют по формуле
F(ţ)= f(t ) : 0,5 ± (ţ).
Закономерности и три функции нормального распределения варьирующего признака используют при планировании селекционного процесса. Это позволяет определить: теоретическую величину Sx; теоретические частоты, т.е. распределение особей в совокупности по данному признаку; количество особей, которое может быть выбрано для использования, если заданы уровни отбора; среднюю величину признака особей отобранной группы.
Таблица 5
Значения функции f(t)= (координаты нормальной кривой)
T |
Сотые доли t |
|||||||||
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
0,0 |
3989 |
3989 |
3989 |
3988 |
3986 |
3984 |
3982 |
3980 |
3977 |
3973 |
0,1 |
3970 |
3965 |
3961 |
3956 |
3951 |
3945 |
3939 |
3932 |
3925 |
3918 |
0,2 |
3910 |
3902 |
3894 |
3885 |
3876 |
3867 |
3857 |
3847 |
3836 |
3825 |
0,3 |
3814 |
3802 |
3790 |
3778 |
3765 |
3752 |
3739 |
3726 |
3712 |
3697 |
0,4 |
3683 |
3668 |
3653 |
3637 |
3621 |
3605 |
3589 |
3572 |
3555 |
3538 |
0,5 |
3521 |
3503 |
3485 |
3467 |
3448 |
3429 |
3410 |
3391 |
3372 |
3352 |
0,6 |
3332 |
3312 |
3292 |
3271 |
3251 |
3230 |
3209 |
3187 |
3166 |
3144 |
0,7 |
3123 |
3101 |
3079 |
3056 |
3034 |
3011 |
2989 |
2966 |
2943 |
2920 |
0,8 |
2897 |
2874 |
2850 |
2827 |
2803 |
2780 |
2756 |
2732 |
2709 |
2685 |
0,9 |
2661 |
2637 |
2613 |
2589 |
2565 |
2541 |
2516 |
2492 |
2468 |
2444 |
1,0 |
2420 |
2396 |
2371 |
2347 |
2323 |
2299 |
2275 |
2251 |
2227 |
2203 |
1,1 |
2179 |
2155 |
2131 |
2107 |
2083 |
2059 |
2036 |
2012 |
1989 |
1965 |
1,2 |
1942 |
1919 |
1895 |
1872 |
1849 |
1826 |
1804 |
1781 |
1758 |
1736 |
1,3 |
1714 |
1691 |
1669 |
1647 |
1626 |
1604 |
1582 |
1561 |
1539 |
1518 |
1,4 |
1497 |
1476 |
1456 |
1435 |
1415 |
1394 |
1374 |
1354 |
1334 |
1315 |
1,5 |
1295 |
1276 |
1257 |
1238 |
1219 |
1200 |
1182 |
1163 |
1145 |
1127 |
1,6 |
1109 |
1092 |
1074 |
1057 |
1040 |
1023 |
1006 |
0989 |
0973 |
0957 |
1,7 |
0940 |
0925 |
0909 |
0893 |
0878 |
0863 |
0848 |
0833 |
0818 |
0804 |
1,8 |
0790 |
0775 |
0761 |
0748 |
0734 |
0721 |
0707 |
0694 |
0681 |
0669 |
1,9 |
0656 |
0644 |
0632 |
0620 |
0608 |
0596 |
0584 |
0573 |
0562 |
0551 |
2,0 |
0540 |
0529 |
0519 |
0508 |
0498 |
0488 |
0478 |
0468 |
0459 |
0449 |
2,1 |
0440 |
0431 |
0422 |
0413 |
0404 |
0396 |
0387 |
0379 |
0371 |
0363 |
2,2 |
0356 |
0347 |
0339 |
0332 |
0325 |
0317 |
0310 |
0303 |
0297 |
0290 |
2,3 |
0283 |
0277 |
0270 |
0264 |
0258 |
0252 |
0246 |
0241 |
0235 |
0229 |
2,4 |
0224 |
0219 |
0213 |
0208 |
0203 |
0198 |
0194 |
0189 |
0184 |
0180 |
2,5 |
0175 |
0171 |
0167 |
0163 |
0158 |
0154 |
0151 |
0147 |
0143 |
0139 |
2,6 |
0136 |
0132 |
0129 |
0126 |
0122 |
0119 |
0116 |
0113 |
0110 |
0107 |
2,7 |
0104 |
0101 |
0099 |
0096 |
0093 |
0091 |
0088 |
0086 |
0084 |
0081 |
2,8 |
0079 |
0077 |
0075 |
0073 |
0071 |
0069 |
0067 |
0065 |
0063 |
0061 |
2,9 |
0060 |
0058 |
0056 |
0055 |
0053 |
0051 |
0050 |
0048 |
0047 |
0046 |
3,0 |
0044 |
0043 |
0042 |
0041 |
0039 |
0038 |
0037 |
0036 |
0035 |
0034 |
3,1 |
0033 |
0032 |
0031 |
0030 |
0029 |
0028 |
0027 |
0026 |
0025 |
0025 |
3,2 |
0024 |
0023 |
0022 |
0022 |
0021 |
0020 |
0020 |
0019 |
0018 |
0018 |
3,3 |
0017 |
0017 |
0016 |
0016 |
0015 |
0015 |
0014 |
0014 |
0013 |
0013 |
3,4 |
0012 |
0012 |
0012 |
0011 |
0011 |
0010 |
0010 |
0010 |
0009 |
0009 |
3,5 |
0009 |
0008 |
0008 |
0008 |
0008 |
0007 |
0007 |
0007 |
0007 |
0006 |
3,6 |
0006 |
0006 |
0006 |
0005 |
0005 |
0005 |
0005 |
0005 |
0005 |
0004 |
3,7 |
0004 |
0004 |
0004 |
0004 |
0004 |
0004 |
0004 |
0003 |
0003 |
0003 |
3,8 |
0003 |
0003 |
0003 |
0003 |
0003 |
0002 |
0002 |
0002 |
0002 |
0002 |
3,9 |
0002 |
0002 |
0002 |
0002 |
0002 |
0002 |
0002 |
0002 |
0001 |
0001 |
4,0 |
0001 |
0001 |
0001 |
0001 |
0001 |
0001 |
0001 |
0001 |
0001 |
0001 |
Таблица 6
Площади нормальной кривой распределения,
определяемые во второй функции (в сокращенном виде)
Норм. отк. (t)в долях от Sx |
Вторая функция (ţ) |
Норм отк. (t)в долях от Sx |
Вторая функция (ţ) |
Норм. отк. (t)в долях от Sx |
Вторая функция (ţ) |
Норм. отк. (t)в долях от Sx |
Вторая функция (ţ) |
0,0 |
0,00000 |
0,8 |
0,28814 |
1,6 |
0,44520 |
2,4 |
0,49180 |
0,1 |
0,03983 |
0,9 |
0,31594 |
1,7 |
0,45543 |
2,5 |
0,43979 |
0,2 |
0,07926 |
1,0 |
0,34134 |
1,8 |
0,46407 |
2,6 |
0,49534 |
0,3 |
0,11791 |
1,1 |
0,36433 |
1,9 |
0,47128 |
2,7 |
0,49653 |
0,4 |
0,15542 |
1,2 |
0,38493 |
2,0 |
0,47725 |
2,8 |
0,49744 |
0,5 |
0,19146 |
1,3 |
0,40320 |
2,1 |
0,48214 |
2,9 |
0,49813 |
0,6 |
0,22575 |
1,4 |
0,41924 |
2,2 |
0,48610 |
3,0 |
0,49865 |
0,7 |
0,25804 |
1,5 |
0,43319 |
2,3 |
0,48928 |
3,99 |
0,49997 |
Пример 1. В популяции кур породы корниш (n = 5000) средний показатель массы тела составляет Х=4,05 кг; min =3,7 кг, max=4,5 кг. Нужно выделить селекционную группу при показателе отбора +0,2 Sx.
Расчеты. Лимит массы тела: max – min=4,5-3,7=0,8 приходится на ±3Sx. 1Sx =0,8 : 6 = 0,13%. На основе этого значения находятся показатели нормированного отклонения для вариационного ряда (табл. 7), значения первой функции f(t) по таблице 5, рассчитываются теоретические частоты по формуле: у = n·k: Sx f(t ).
По второй функции (ţ) определяют, сколько кур можно отобрать из данной группы при границе отбора +0,2Sx и выше. +0,2Sx=4,05+0,2·0,13=4,08 кг. В таблице 6 площади нормальной кривой распределения, определяемые по второй функции при t=0,2Sx (ţ)=0,07926. Пятьдесят процентов или 0,5 части находится в правой половине от = 0,5-0,07926=0,42074 или 42,1% кур имеют значение массы тела превышающей +0,2Sx=4,08%. Вся популяция 5000 кур, 2105 (42,1%) с массой тела выше 4,08 кг.
Таблица 7
Вычисление теоретического вариационного ряда по массе кур (n=5000)
Класс по массе тела |
Отк. хi - = хi - 4.05 |
Нор.отк., t (хi - 4.05):0,13 |
Значения f(t) по табл.4 |
Теорет. частоты у=n·k:Sx· f(t)=5000 ·0,1:0,13· f(t)=3846 f(t) |
Округленные знач. теор. частоты |
3,7 |
3,7-4,05=-0,35 |
-0,35:0,13=-2,69 |
0,0107 |
41,2 |
41 |
3,8 |
3,8-4.05= -0,25 |
-0,25:0,13= -1,92 |
0,0632 |
243,1 |
243 |
3,9 |
3,9-4,05= -0,15 |
-0,15:0,13= -1,15 |
0,2059 |
791,8 |
792 |
4,0 |
4,0-4,05= -0,05 |
-0,05:0,13= -0,38 |
0,3712 |
1427 |
1427 |
4,1 |
4,1-4,05= 0,05 |
+0,05:0,13=0,38 |
0,3712 |
1427 |
1427 |
4,2 |
4,2-4,05=0,15 |
0,15:0,13=1,15 |
0,2059 |
791,9 |
792 |
4,3 |
4,3-4,05=0,25 |
0,25:0,13=1,92 |
0,0632 |
243 |
243 |
4,4 |
4,4-4,05=0,35 |
0,35:0,13=2,69 |
0,0107 |
41,1 |
41 |
4,5 |
4,5-4,05=0,45 |
0,45:0,13=3,46 |
0,0010 |
3,85 |
4 |
Для определения средней массы тела кур отобранной группы расчеты ведут по формуле:
F(ţ)= f(t ): (0,5 - (ţ))=0,39104:(0,5-0,07926)=0,93.
Средняя величина признака отобранной группы
+ F(ţ)· =4,05+0,93·0,13=4,2 кг.