Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Малинин_2.doc
Скачиваний:
20
Добавлен:
06.11.2018
Размер:
209.92 Кб
Скачать

2.3. Характеристики рассеяния случайной величины

Простейшей мерой рассеяния (изменчивости) статистического ряда является размах (амплитуда) колебаний, определяемый как

R = xmaxxmin,

где xmax, xmin – соответственно максимальный и минимальный члены ряда. Размах колебаний дает лишь самое общее представление об изменчивости, так как показывает, насколько отличаются друг от друга крайние значения, но не указывает, насколько велики отклонения отдельных значений внутри ряда.

Поэтому наиболее распространенными показателями изменчивости статистического ряда являются дисперсия, среднеквадратическое (стандартное) отклонение, коэффициент вариации, которые взаимосвязаны друг с другом.

Истинная оценка, т.е. полученная по генеральной совокупности, дисперсии дискретной случайной величины определяется по следующей формуле:

(2.11)

и имеет размерность квадрата случайной величины. Выборочная оценка дисперсии иногда обозначается как s2.

Среднеквадратическое отклонение случайной величины представляет собой корень квадратный из дисперсии и поэтому сохраняет размерность исходного ряда.

Коэффициент вариации С=/mx является безразмерной величиной, поэтому он очень удобен для анализа рядов с различной размерностью.

Свойства дисперсии:

Свойство 1. Дисперсия постоянной величины равна нулю .

Свойство 2. Дисперсия остается постоянной, если все члены ряда увеличить или уменьшить на одно и то же число σ2(a + x) = σx2.

Свойство 3. Постоянную величину можно выносить за знак дисперсии, возведя ее в квадрат σ2(ax) = a2σx2.

Свойство 4. Дисперсия алгебраической суммы независимых случайных величин равна сумме их дисперсий:

.

Свойство 5. Дисперсия суммы двух связанных между собой корреляционной зависимостью случайных величин определяется как

σ2(х + y) = σx2 + σy2 + 2σxσyrxy, (2.12)

где rxy – коэффициент корреляции между переменными х и у, определяемый по формуле (6.1).

Свойство 6. Дисперсия относительно среднего арифметического значения меньше, чем средний квадрат отклонений от любого значения в ряду xi, на величину .

Свойство 7. Если некоторая величина yi связана с xi линейным уравнением

yi = axi + b, то .

Перечисленные выше свойства дисперсии, так же как и свойства средней арифметической, широко используются в выводах математической статистики и при решении многих практических задач.

В некоторых случаях в качестве меры рассеяния используется среднее линейное отклонение, которое представляет собой среднюю арифмети­ческую абсолютных значений отклонений отдельных вариантов от их выборочной средней. Для несгруппированных данных она вычисляется как d = |xi X| /n, а для сгруппированных данных – по формуле d = |xi X|fi / fi. Применение ве­личины d оправданно в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл.

2.4. Характеристики формы кривой распределения случайной величины

Рассмотренные в предыдущих разделах характеристики положения и рассеяния случайной величины не дают представления о форме ее кривой распределения. Так, две случайные величины, имея одинаковые средние арифметические значения и дисперсии, могут обладать совершенно различными распределениями вероятностей. Это обстоятельство обусловливает необходимость введения для описания случайных величин характеристик, позволяющих оценить степень асимметрии и крутости распределения.

Характеристикой асимметрии (скошенности) распределения случайной величины X является коэффициент асимметрии

. (2.13)

Нетрудно видеть, что коэффициент асимметрии – величина безразмерная. Если члены ряда располагаются симметрично относительно среднего значения, то разные по величине положительные и отрицательные отклонения от среднего повторяются одинаково часто. В этом случае As = 0 их = Mo = Me (рис. 2.1, а).

При положительной асимметрии (As > 0) ряд будет включать немногочисленные, но большие по величине положительные отклонения, и более многочисленные, но менее значительные по величине отрицательные отклонения. В результате х > Mo их > Me.

(рис. 2.1, б). При отрицательной асимметрии (As < 0) ряд будет включать немногочисленные, но большие по величине отрицательные отклонения от среднего, и более многочисленные, но малые по величине положительные отклонения. Поэтомух < Mo и х < Me (рис. 2.1, в).

Характеристикой крутости (островершинности или плосковершинности) кривой распределения является безразмерный коэффициент эксцесса:

. (2.14)

Величина коэффициента эксцесса характеризует отклонение крутости эмпирической кривой от нормальной кривой распределения, так как в последнем случае принимается Ex=0.

Если эмпирическая кривая распределения является более островершинной по сравнению с нормальной кривой, то Ex > 0 (рис. 2.2). В результате мода эмпирического распределения должна быть больше моды нормального распределения (Mo > MoN).

Если эмпирическая кривая распределения является более плосковершинной по сравнению с нормальной кривой, то Ех < 0 (рис. 2.2). В этом случае Mo < MoN.

Пример 2.1. Оценим числовые характеристики среднемесячных значений температуры поверхности океана (ТПО) в районе судна погоды «М» (66о с.ш. и 2о в.д.) за период 1951-2000 гг., которое расположено практически в центре Норвежского моря. Отметим, что непрерывные наблюдения за комплексом гидрологических и метеорологических характеристик в течение более полувека на судне погоды «М», безусловно, носят уникальный характер. Причем не только со статистической, но и с физической точки зрения. Действительно, акватория Норвежского моря рассматривается как одна из важнейших энергоактивных зон океана, имеющая исключительно важное значение в формировании и колебаниях гидрометеорологического режима сопредельных территорий, в том числе Европейской территории России. Основные статистические характеристики ТПО для отдельных месяцев и года в целом представлены в табл. 2.1, а ее межгодовой ход дан на рис. 2.3.

Представленные в табл. 2.1 статистические характеристики позволяют анализировать одновременно внутригодовую и межгодовую изменчивость ТПО. Нетрудно видеть, что температура воды имеет довольно хорошо выраженный годовой ход, обусловленный годовым притоком солнечной радиации и запаздывающий от него на два месяца. Максимальные значения ее наблюдаются в августе, а минимальные – в феврале и марте.

Таблица 2.1

Первичные статистические оценки среднемесячных значений температуры поверхности океана в районе судна погоды «М» за период 1951-2000 гг.

Месяц

Среднее, оС

Ме, oC

, оС

С

хmax, оС

хmin, оС

R, оС

As

Ex

I

6,7

6,7

0,4

0,06

7,4

5,8

1,6

-0,21

-0,86

II

6,4

6,3

0,4

0,06

7,4

5,6

1,8

0,26

-0,49

III

6,4

6,4

0,4

0,06

7,3

5,5

1,8

-0,10

1,04

IV

6,5

6,5

0,4

0,06

7,2

5,6

1,6

-0,29

-0,45

V

7,4

7,4

0,4

0,05

8,2

6,6

1,6

0,03

-0,24

VI

9,1

8,9

0,7

0,08

10,9

7,9

3,0

0,68

0,04

VII

10,8

10,6

0,8

0,07

12,6

9,5

3,1

0,43

-0,73

VIII

11,7

11,5

0,8

0,07

13,6

10,2

3,4

0,54

-0,24

IX

10,7

10,8

0,7

0,07

11,9

9,0

2,9

-0,27

-0,58

X

9,0

8,9

0,6

0,07

10,3

8,1

2,2

0,46

-0,52

XI

7,8

7,7

0,5

0,06

9,1

6,9

2,2

0,72

0,29

XII

7,1

7,1

0,4

0,06

8,2

6,2

2,0

0,05

-0,48

Год

8,3

8,2

0,4

0,05

9,1

7,3

1,8

0,11

-0,19

Годовой ход размаха колебаний ТПО в общем повторяет годовой ход средней арифметической, но внутригодовая амплитуда его более чем в три раза меньше (соответственно 1,5 и 5,3 оС.). Годовой ход среднеквадратического отклонения ТПО почти повторяет годовой ход величины R. Аналогичный характер годового хода вХ и  обусловливает почти постоянство коэффициента вариации в течение всего года.

Межгодовая изменчивость ТПО невелика и практически одинакова для всех месяцев года. Действительно, различие между максимальным (июнь) и минимальным (май) коэффициентом вариации составляет лишь 0,03. Особенности распределения коэффициентов асимметрии и эксцесса и расхождение между средней и медианой позволяют выяснить особенности «поведения» эмпирической кривой плотности вероятности. Прежде всего отметим, что только средние годовые значения ТПО имеют оценки As и Ex сравнительно мало отличающиеся от нуля, т.е. распределение средних годовых значений ТПО является близким к нормальному закону (см. гл. 3). Этого нельзя сказать в отношении всех месяцев года. Даже когда As мал, то Ex весьма велик (например, март) и наоборот (например, июнь).

В распределении As преобладают положительные значения As. Это означает, что в течение каждого из восьми месяцев временной ряд включает немногочисленные, но большие по величине положительные отклонения, и более многочисленные, но менее значительные по величине отрицательные отклонения. Отсюда следует, что должно выполняться неравенство. Из табл. 2.1 видно, что при больших значениях As оценки среднего превышают оценки медианы на 0,1-0,2 оС. При As < 0 значенияХ должны быть меньше медианы. Но поскольку отрицательные оценки As невелики, то данное условие из четырех месяцев отмечается только в сентябре.

В распределении оценок Ех преобладают отрицательные значения. Это означает, что эмпирическая кривая распределения является более плосковершинной по сравнению с нормальной кривой. Только для трех месяцев выполняется условие Ех > 0, когда кривая распределения является более островершинной по сравнению с нормальной кривой.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]