Лекция 5 Теоретические законы распределения случайных величин
Постановка задачи
В процессе статистического анализа лесоводственной информации, относящейся к некоторой случайной величине, теорию распределений применяют в двух основных направлениях:
-
как основу статистических выводов, в частности, оценки параметров и проверки статистических гипотез;
-
как средство и метод представления выборочных распределений.
В первом случае основополагающую роль играет нормальный закон распределения, во втором - в качестве модели можно применять самые различные типы распределения.
При этом в сходных практических ситуациях при рассмотрении одного и того же признака (показателя) возможно использование разных теоретических схем.
Объем выборки предопределяет приближенный характер решения задачи и необходимость статистической оценки ее результатов в виде «аппроксимации распределений», или «подгонки» эмпирических распределений теоретическим моделям.
Конкретными практическими целями аппроксимации являются использование законов распределения случайной величины в процессе свертки информации.
Обычно используют один из трех взаимосвязанных подходов:
-
предполагаемый закон распределения выбирают на основе оценки теоретических предпосылок, предварительного анализа гистограмм, статистик распределения и т. д.;
-
для ряда распределения вычисляют аналитические характеристики, и по ним определяют тип распределения в пределах некоторого семейства кривых;
-
эмпирическое распределение преобразуют в известный, «более сглаженный» тип распределения.
Аппроксимация (сглаживание) включает определение параметров, входящих в заданный закон распределения (на основе выборочных статистик), вычисление теоретических или «выравнивающих» частот по полученной формуле и определение соответствия («согласия») между экспериментальными и теоретическими частотами при помощи критериев согласия.
Нормальное распределение
Этот тип непрерывного распределения, открытый в 1733 г. Муавром, имеет плотность распределения:
(1)
и функцию распределения (т. е. функцию накопленной вероятности):
, (2)
где
M - среднее значение;
- среднее квадратическое отклонение.
Этими двумя параметрами нормальное распределение определяется однозначно, так как =3,142… и е=2,718... - общеизвестные константы.
Графически плотность распределения f(x) представляет собой симметричную относительно точки х = M колоколообразную кривую, форма которой зависит от величины среднего квадратического отклонения , являющегося параметром масштаба, а положение определяется величиной M (рис. 3.1).
Равенство нулю показателей косости и крутости - необходимое и достаточное условие, чтобы распределение было нормальным.
Закон нормального распределения играет особую роль как в теории статистического анализа, так и в его приложениях.
Для непосредственного вычисление вероятностей по (3.1) и (3.2) применяются таблицы значений f(x) и F(x), составленные для так называемого нормированного распределения.
Конкретное распределение «нормируют» путем замены переменных
z = (x-M)/σ , (3.3)
Расчет теоретических частот эмпирического ряда производят следующим образом:
-
Находят значения функции плотности вероятности нормального распределения (Приложение 2) для соответствующих величин нормирован-ного отклонения (3.3);
-
Вычисляют теоретические частоты ряда распределения ni' по соответствующим данным объема выборки N, σ при величине классового промежутка i по формуле:
ni' = . (4)
Наряду с вычислением теоретических частот необходимо определить меру соответствия теоретически полученной кривой эмпирическому распределению по критерию χ2 Пирсона (Приложение 3).
Xi |
ni |
z |
f(z) |
n’i |
ni - n’i |
(ni - n’i)2 |
|
|||
Факт. |
Округ. |
|||||||||
8 |
2 |
2,07 |
0,04682 |
2,07 |
2 |
0 |
0 |
0 |
||
12 |
6 |
1,63 |
0,10567 |
4,66 |
5 |
1 |
1 |
0,2 |
||
16 |
10 |
1,18 |
0,19886 |
8,78 |
9 |
1 |
1 |
0,11 |
||
20 |
14 |
0,74 |
0,30339 |
13,39 |
13 |
1 |
1 |
0,08 |
||
24 |
16 |
0,30 |
0,39876 |
17,61 |
18 |
-2 |
4 |
0,22 |
||
28 |
18 |
0,14 |
0,39505 |
17,44 |
17 |
1 |
1 |
0,06 |
||
32 |
14 |
0,58 |
0,33530 |
14,81 |
15 |
-1 |
1 |
0,07 |
||
36 |
9 |
1,02 |
0,23713 |
10,47 |
10 |
-1 |
1 |
0,1 |
||
40 |
6 |
1,46 |
0,13542 |
5,98 |
6 |
0 |
0 |
0 |
||
44 |
3 |
1,91 |
0,06438 |
2,84 |
3 |
0 |
0 |
0 |
||
48 |
2 |
2,35 |
0,02522 |
1,11 |
1 |
1 |
1 |
1 |
||
Σ |
100 |
|
|
|
99 |
|
|
χ2 = 1,84 |
см
Cумма всех значений частного дает величину χ2 = 1,84 при (11-3) = 8 степенях свободы вариации. Табличное значение =2,73 (по табл. Приложения 3). Так как =1,84 меньше =2,73, то делаем заключение о подчинении распределения эмпирических частот закону нормального распределения.
В целом предположение о том, что эмпирическое распределение строго соответствует нормальному закону, подтверждается относительно редко. Например, если в условиях, близких к требуемым по центральной предельной теореме, некоторые факторы влияют сильнее, чем другие, то распределение случайной величины становится несимметричным, хотя кривые распределения напоминают общие контуры нормальной кривой. Такие распределения (близкие к нормальным) обычны для лесного опытного дела. Далее рассмотрим одно из такого рода распределений – логарифмически нормальное.