Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТВиМС.Малярец.Егоршин 22.12.12

.pdf
Скачиваний:
10
Добавлен:
11.06.2015
Размер:
6.76 Mб
Скачать

3. M i2 2 ; наблюдения равноточные (гомоскедастичность – одинаковый разброс).

4.M( i j) = 0; наблюдения некоррелированные (независимые).

5.i ~ N(0; ); ошибки распределены нормально (самая несущественная предпосылка).

По исходным данным (xi , yi) вычислены некоторые числовые характеристики:

x, sx2 , y, b0 , b1, yр b0 b1x .

Первые две из этих характеристик считаются измеренными точно, поскольку все случайные ошибки относятся только к переменной y.

Остальные же характеристики содержат случайную ошибку, поэтому они сами являются случайными величинами с известным законом распределения (такие характеристики называются статистиками).

Рассмотрим первую статистику из вышеприведенного списка:

y

1

yi

1

i

 

1

i .

 

 

 

 

 

n

n

 

 

n

 

i

i

 

 

i

Поскольку все M i 0 (вторая гипотеза), то M ( y) .

Вычисляем дисперсию

2

M y

 

 

 

2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

1

 

 

 

 

 

 

1

 

 

2 n 2

2

 

 

2

M

 

 

 

M

 

 

 

 

M

.

 

y

 

i

 

 

 

i j

 

 

 

i

 

 

 

 

 

 

n2 i

 

n2 i

n2

 

 

 

n

 

 

 

 

 

n

 

 

 

i

 

j

 

 

 

 

 

 

 

Здесь использовано:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

i )2

 

 

i j

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

i j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свойства математического ожидания;

 

 

 

 

 

 

 

 

 

M

i j

0 для i

j (четвертая гипотеза);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

2

2 (третья гипотеза).

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Получили известный факт – случайная дисперсия среднего арифметического в n раз меньше случайной дисперсии отдельных наблюдений.

181

Теперь рассмотрим коэффициент регрессии b1 :

b1

 

sxy

 

 

1

 

 

yi (xi

x)

 

1

 

 

 

 

 

 

 

i (xi

 

 

x)

 

1

 

 

i (xi

 

x)

 

sx2

 

 

nsx2

 

 

 

 

nsx2 i

 

 

 

 

nsx2

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

i (xi

 

 

x).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nsx2

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь 1=M(b1) получается по той же формуле, что и b1 с заменой yi

на i.

Вычисляем дисперсию

2

 

M b

 

 

 

2

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

M b1

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

 

 

 

i (xi

x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

x x j

 

x M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

j

 

 

nsx2

 

 

 

 

 

n2 sx4

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

i

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

1

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

x x 2 M

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x x 2

 

 

 

 

 

y

.

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n2 s4

 

 

 

 

i

 

 

 

 

 

 

 

 

 

ns4

 

 

n i

 

 

i

 

 

 

 

ns2

s2

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

x

Покажем, что ковариация

 

yb1

M y

 

 

 

 

b1

1

равна нулю:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yb 1

 

M ( y )(b1

 

 

1)

 

 

 

 

 

 

 

 

 

 

 

 

M

 

1

 

 

 

 

 

1

 

x j

 

 

x

 

 

 

 

 

1

 

 

 

 

 

x j

x M i j

 

 

 

 

 

 

 

n i

i

 

ns2 j

 

 

j

 

 

 

 

 

ns2

 

i

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

x M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

x

 

0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nsx2

 

 

i

 

 

 

 

nsx2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

так как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

x

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчетное значение yp для каждого x оказывается комбинацией двух случайных величин y и b1:

y p (x) y b1(x x) .

182

Вычисляем его дисперсию по известному свойству дисперсии суммы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

2

2(x x)

 

 

 

x x

2

 

2

 

2

 

 

y

x x

2

y

 

( x)

y

yb

 

 

 

b

y

 

 

sx2

 

 

p

 

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

y2

1

x

x 2

2

1

 

 

x x

2

.

 

 

 

 

 

 

 

 

sx2

 

 

n

 

 

sx2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Осталось заменить дисперсию случайной ошибки на несмещенную

дисперсию остатка модели:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

2

 

 

ˆe2

 

x x 2

 

 

 

 

 

 

 

 

 

 

 

 

y p ( x)

 

 

 

1

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sx2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Вопросы для самопроверки

1.Что такое стандартизованные переменные? Каковы их свойства?

2.Что такое -коэффициенты? Как они связаны с коэффициентами регрессии? Чему равно 0 ?

3.Какой вид имеет система нормальных уравнений в стандартизованных переменных?

4.Как в стандартизованных переменных записывается выражение для коэффициента детерминации?

5.Как оценивается значимость модели в целом и значимость ее отдельных членов?

6.Как записать интервальные оценки для коэффициентов регрессии?

7.Как строится доверительная полоса на расчетные значения? Что она показывает?

8.Как составляется многофакторная регрессионная модель?

9.Что такое коэффициенты частной корреляции?

10.Каков общепринятый критерий качества регрессионной модели?

183

17. Случайные функции

Случайной функцией называют функцию неслучайного аргумента t, которая при каждом фиксированном значении аргумента является случайной величиной. Например, если U – случайная величина, то X(t) = U sin( t) – случайная функция. Действительно, при каждом значении t эта функция является случайной величиной: при t1 = 1 / 3 получаем случайную величину X1 = 0,5 U; при t1 = 1 / 2 – случайную величину X2 = U; при t3 = 1 – случайную величину X3 = –U и т. д.

Сечением случайной функции называют случайную величину, соответству-

ющую фиксированному значению аргумента t. Выше для случайной функции X(t) = U sin( t) получили сечения Х1 , Х2 , Х3 , соответствующие t = 1 / 3 , 1 / 2 , 1.

Реализацией (траекторией) случайной функции называют неслучай-

ную функцию аргумента t, равной которой может оказаться случайная функция в результате испытаний.

Например, если для случайной функции X(t) = U sin( t) при первом испытании случайная величина U приняла значение u1 = 3, при втором – u1 = –2, то реализациями X(t) являются, соответственно, x1(t) = 3 sin( t) и x2(t) = –2 sin( t).

Случайную функцию можно рассматривать или как совокупность случайных величин {X(t)}, зависящих от параметра t, или как совокупность ее возможных реализаций. На рис. 17.1 изображен пример графика случайной функции X(t), более толстой линией выделен график одной ее реализации x8(t), маркерами выделены два сечения Х4 , Х10 при t = 4 и t = 10.

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

 

Рис. 17.1. График случайной функции по параметру t

 

 

184

Случайным (стохастическим) процессом называют случайную функ-

цию аргумента t, который истолковывается как время. Если аргумент такой функции изменяется дискретно, реализацию случайного процесса называют временным рядом.

Аргументом случайной функции может быть не только время. Например, диаметр ткацкой нити под воздействием случайных факторов непрерывно изменяется по длине нити.

Характеристики случайных функций

Как уже было сказано выше, при фиксированных значениях параметра t1 , t2 , … , tm случайная функция представляет собой систему случайных величин X(t1), X(t2), … , X(tm), и поэтому ее распределение описывается многомерным законом распределения. Однако многомерные распределения практически не изучены; более того, даже если бы они были известны, пользоваться такими громоздкими выражениями было бы крайне неудобно.

Вкорреляционной теории случайных функций (имеется еще спектральная теория случайных функций) ограничиваются изучением моментов первого и второго порядков: математических ожиданий, дисперсий, ковариаций. Этого иногда достаточно для решения многих практических задач.

Вотличие от числовых характеристик случайных величин, представляющих собой определенные числа, характеристики случайных функций в общем случае представляют собой не числа, а функции.

Математическим ожиданием случайной функции X(t) называют не-

случайную функцию mx(t), которая при каждом фиксированном значении аргумента t равна математическому ожиданию соответствующего сечения:

mx(t) = M[X(t)].

Геометрически математическое ожидание случайной функции можно трактовать как «среднюю кривую», около которой расположены реализации данной случайной функции; при фиксированном значении аргумента математическое ожидание есть «среднее значение» сечения («средняя ордината»), вокруг которого расположены его возможные значения (ординаты).

На рис. 17.2 изображены 11 реализаций случайной функции. Для каждого сечения t = 1, 2, … , 20 вычислены средние (оценки математических ожиданий); график средних на рис. 17.2 выделен более толстой линией. Любые закономерные изменения случайной функции по времени (аргументу t) называются трендом. Здесь явно имеется линейный тренд, график которого на рис. 17.2 изобра-

185

жен пунктиром, а уравнение тренда, полученное методом наименьших квадратов, приведено в заголовке рисунка.

Рис. 17.2. Линейный тренд

Используя свойства математического ожидания случайной величины, несложно получить аналогичные свойства математического ожидания случайной функции:

1. Математическое ожидание неслучайной функции (t) равно самой неслучайной функции:

M[ (t)] = (t).

2. Неслучайный множитель (t) можно выносить за знак математического ожидания:

M[ (t) X(t)] = (t) M[X(t)] = (t) mx(t).

3. Математическое ожидание суммы случайных функций равно сумме их математических ожиданий:

M[X(t) + Y(t)] = mx(t) + my(t).

Следствие 1. Для того чтобы найти математическое ожидание суммы случайной и неслучайной функций, достаточно к математическому ожиданию случайной функции добавить эту неслучайную функцию:

M[X(t) + (t)] = mx(t) + (t).

Следствие 2. Математическое ожидание суммы случайной функции X(t) и случайной величины Y равно сумме их математических ожиданий:

M[X(t) + Y] = mx(t) + my .

186

Дисперсией случайной функции X(t) называют неслучайную функцию

Dx(t), которая при каждом фиксированном значении аргумента t равна дисперсии соответствующего сечения:

Dx(t) = D[X(t)] = М[X(t) – mx(t)] 2.

Средним квадратичным отклонением случайной функции называют корень квадратный из ее дисперсии:

x t Dx t .

Дисперсия и среднее квадратичное отклонение характеризуют степень рассеяния возможных реализаций вокруг математического ожидания случайной функции («средней кривой»).

При фиксированном значении аргумента дисперсия и среднее квадратичное отклонение характеризуют степень рассеяния возможных значений (ординат) сечения вокруг его математического ожидания (центра группировки).

Используя свойства дисперсии случайной величины, несложно получить аналогичные свойства дисперсии случайной функции:

1. Дисперсия неслучайной функции (t) равна нулю:

D[ (t)] = 0.

2. Дисперсия произведения случайной функции X(t) на неслучайный множитель (t) равна произведению квадрата неслучайного множителя на дисперсию случайной величины:

D[ (t) X(t)] = 2(t) Dx(t).

3. Дисперсия суммы случайной функции X(t) и неслучайной функции (t) равна дисперсии случайной функции:

D[X(t) + (t)] = Dx(t).

Корреляционной функцией случайной функции X(t) называют неслу-

чайную функцию Kx(t1 , t2) двух независимых аргументов t1 , t2 , значение которой при каждой паре фиксированных аргументов равно ковариации (смешанному центральному моменту) сечений, соответствующих этим значениям аргументов:

Kx(t1 , t2) = M{[X(t1) – mx(t1)] [X(t2) – mx(t2)]}.

При равных между собой значениях аргументов t1 = t2 = t корреляционная функция случайной функции равна дисперсии этой функции:

Kx(t, t) = М[X(t) – mx(t)] 2 = Dx(t).

Используя свойства математического ожидания случайной величины, несложно получить свойства корреляционной функции случайной функции:

187

1. При перестановке аргументов корреляционная функция не изменяется (свойство симметрии):

Kx(t2 , t1) = Kx(t1 , t2).

2. Добавление к случайной функции X(t) неслучайного слагаемого (t) не изменяет ее корреляционной функции:

Ky(t1 , t2) = Kx(t1 , t2),

где Y(t) =X(t) + (t).

3. При умножении случайной функции X(t) на неслучайный сомножитель (t) ее корреляционная функция умножается на произведение (t1) (t2):

Ky(t1 , t2) = Kx(t1 , t2) (t1) (t2),

где Y(t) =X(t) (t).

Нормированной корреляционной функцией случайной функции X(t)

называют неслучайную функцию x(t1 , t2) двух независимых аргументов t1 , t2 , значение которой при каждой паре фиксированных аргументов равно коэффициенту корреляции сечений, соответствующих этим фиксированным значениям аргументов:

x t1, t2

K x t1, t2

 

 

 

K x

t1, t2

 

.

 

t1

 

t1

 

 

 

 

 

 

x

x

 

 

K x t1, t1

 

K x t2 , t2

 

 

 

 

 

 

Абсолютная величина нормированной корреляционной функции не превышает единицы:

| x(t1 , t2) | 1.

Взаимной корреляционной функцией двух случайных функций X(t),

Y(t) называют неслучайную функцию Rxy(t1 , t2) двух независимых аргументов t1 , t2 , значение которой при каждой паре фиксированных аргументов равно ковариации (смешанному центральному моменту) сечений обеих функций, соответствующих этим фиксированным значениям аргументов:

Rxy(t1 , t2) = M{[X(t1) – mx(t1)] [Y(t2) – my(t2)]}.

Две случайные функции называют некоррелированными, если их взаимная корреляционная функция тождественно равна нулю.

Несложно доказать свойства взаимной корреляционной функции:

1. При одновременной перестановке индексов и аргументов взаимная корреляционная функция не изменяется:

Rxy(t1 , t2) = Ryx(t2 , t2).

188

2. Прибавление к случайным функциям X(t), Y(t) неслучайных слагаемых,

соответственно

(t) и

(t), не изменяет их взаимной корреляционной функции:

 

 

Ruv(t1 , t2) = Rxy(t1 , t2),

где U(t) = X(t) +

(t),

V(t) = Y(t) + (t).

3. При умножении случайных функций X(t), Y(t) на неслучайные множи-

тели, соответственно

(t) и (t), взаимная корреляционная функция умножается

на произведение

(t)

(t):

Ruv(t1 , t2) = Rxy(t1 , t2) (t) (t), где U(t) = X(t) (t), V(t) = Y(t) (t).

4. Несложно получить следующее обобщение правила вычисления дисперсии суммы случайных величин для вычисления корреляционной функции суммы двух случайных функций.

Корреляционная функция суммы двух случайных функций равна сумме корреляционных функций слагаемых и взаимной корреляционной функцией, которая прибавляется дважды (с разным порядком следования аргументов:

Kz(t1 , t2) = Kx(t1 , t2) + Ky(t1 , t2) + Rxy(t1 , t2) + Rxy(t2 , t1), где Z(t) = X(t) + Y(t).

Следствие 1. Корреляционная функция суммы двух некоррелируемых случайных функций равна сумме корреляционных функций слагаемых:

Kz(t1 , t2) = Kx(t1 , t2) + Ky(t1 , t2),

где Rxy(t1 , t2) 0.

Следствие 2. Корреляционная функция суммы случайной функции X(t) и не коррелируемой с ней случайной величины Y равна сумме корреляционной функции случайной функции и дисперсии случайной величины:

Kz(t1 , t2) = Kx(t1 , t2) + Dy ,

где Z(t) = X(t) + Y.

Стационарные случайные функции

На практике очень часто встречаются случайные процессы, протекающие во времени приблизительно однородно и имеющие вид непрерывных случайных колебаний вокруг некоторого среднего значения, причем ни средняя амплитуда, ни характер этих колебаний не обнаруживают существенных изменений с течением времени. Такие случайные процессы называются стационарными. На рис. 17.1 изображен график такого явно стационарного процесса.

189

Случайная функция X(t) называется стационарной, если все ее вероятностные характеристики не зависят от t. Поскольку изменение стационарной случайной функции должно протекать однородно во времени, естественно потребовать, чтобы для стационарной случайной функции математическое ожидание было постоянным: mx(t) = mx = Const.

Однако это требование не является существенным, так как от случайной функции X(t) всегда можно перейти к центрированной функции Y(t) = X(t) –

mx(t),

для которой математическое ожидание тождественно равно нулю:

my(t)

0 = Const.

Таким образом, если случайный процесс нестационарен только за счет

переменного математического ожидания, это не помешает изучать процесс как стационарный.

На рис. 17.2 изображен график стационарного процесса с добавленной неслучайной функцией (t) = 1 – 0,1 t (линейный тренд).

Второе условие, которому, очевидно, должна удовлетворять стационарная случайная функция, – это условие постоянства дисперсии:

Dx(t) = Dx = Const.

Установим, какому условию должна удовлетворять корреляционная функция стационарной случайной функции.

Рассмотрим ковариацию Kx(t, t + ) двух сечений случайной функции X(t), разделенных интервалом времени .

Очевидно, если случайный процесс действительно стационарен, то эта ковариация не должна зависеть от того, где именно на оси времени взяли участок , а зависеть только от длины этого участка:

Kx(t, t + ) = kx( ).

Следовательно, корреляционная функция стационарного случайного процесса есть функция не двух, а всего одного аргумента. Это обстоятельство в ряде случаев существенно облегчает операции над стационарными случайными функциями.

Заметим, что при = 0 Kx(t, t) = Dx(t) = kx(0) = Const, то есть требование

Kx(t, t + ) = kx( ) как частный случай включает Dx(t) = Dx = Const.

Именно это свойство принято за определение стационарности процесса: случайная функция является стационарной, если ее корреляционная функция Kx(t1 , t2) = kx( ) зависит только от разности аргументов = t2 t1 .

190