Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Загребаев Методы обработки статистической информации в задачах контроля 2008

.pdf
Скачиваний:
92
Добавлен:
16.08.2013
Размер:
7.77 Mб
Скачать

3.1. Виды и формы моделей информационных процессов

3.1.1. Основные математические модели объектов

При решении задач идентификации создается математическая модель реального объекта. Отметим, что структура модели, как правило, определяется физической природой объекта и строится на основе априорных теоретических исследований. Однако, в зависимости от вида решаемой задачи одна и та же реальная система может представляться различными априорными математическими моделями. При этом процесс идентификации может заключается как в определении параметров априорной математической модели, так и корректировки ее структуры. Наиболее распространенные априорные математические модели имеют вид, показанный ниже.

1. Статическая модель «вход-выход» [14]:

y(t) = ψ(

u

(t),t, c, η(t)) .

(3.1.1)

Данная модель является вероятностной, причем вектор c и случайная вектор-функция η(t) входят в эту модель (в общем случае)

в виде мультипликативных составляющих. Часто используется более простая нелинейная форма

y(t) = ψ(u (t), c ) + η(t) ,

где y(t) – вектор выходов объекта, c – параметры объекта. Для объектов с одним выходом

y(t) = ψ(

u

(t), c ) + η(t) .

(3.1.2)

Частными случаями такой модели являются детерминированные линейные модели «вход-выход»

y(t) =

 

 

 

 

 

(3.1.3)

b0 (t) + B1(t)

u

(t) ,

и вероятностные

 

y(t) =

 

 

 

 

(3.1.4)

b0 (t) + B1(t)

u

(t) + η(t) .

Здесь b0 (t) – столбец свободных членов; B1(t) – матрица коэффициентов модели.

171

Если перейти от непрерывного времени к дискретным его моментам t1, ..., tN , то уравнение (3.1.4) для этих моментов времени будет иметь вид:

y(ti ) = b0 (ti ) + B1(ti )u (ti ) + η(ti ) .

В дальнейшем для простоты вместо аргумента ti будем писать

просто i . Тогда, например, статическая линейная модель с постоянными коэффициентами и одним выходом имеет вид:

y(i) = b0 + b1u1(i) +... + bmum (i) + η(i)

(3.1.5)

или то же самое в векторной форме

 

y(i) =

 

т(i)

 

+ η(i) ,

(3.1.5а)

u

b

где u т(i) – вектор входа в i-й момент времени ( i =1, ..., N ); b – вектор параметров.

b т = (b0 , b1, ..., bm ) , u т(i) = (1, u1(i), ..., um (i)) .

В дальнейшем изложении будет широко использоваться также

векторно-матричная форма записи уравнения (3.1.5):

 

 

 

 

 

 

+ η,

(3.1.6)

 

 

 

y =Ub

где

 

 

 

 

 

 

т = (b , b , ..., b ) ; y т = ( y(1), ..., y(N )) ;

 

b

 

0 1

m

 

1 u1(1)

.

.

U =

.

.

1 u1(N)

...

um (1)

 

 

 

 

 

 

 

 

 

 

 

; ηт = (η(1), ..., η(N)) .

 

 

 

 

 

 

 

 

...

u

 

 

m

(N )

 

 

 

2.Динамическая модель «вход-выход».

Внепрерывной форме динамическая модель может быть записана в виде:

d n y(t)

+ a*

d n1 y(t)

+... + a* y(t) = b*

d mu(t)

+... +

dtn

 

 

n1 dtn1

0

m dtm

 

172

*

*

d mη(t)

 

*

η(t) , m < n ,

 

+b u(t) + d

 

 

+... + d

 

(3.1.7)

m dtm

 

0

 

0

 

 

или в дискретно-разностной форме

 

 

 

 

 

n

 

 

 

 

 

 

 

y(i) + a j y(i

 

 

 

 

 

j=1

 

 

 

 

 

 

 

a*j

 

 

b*

 

 

 

 

где a

j

=

 

; b

=

r

;

d

l

=

a*

a*

 

 

r

 

 

 

 

 

 

 

0

 

0

 

 

 

 

m

m

j) = bru(i r) + dl η(i l) , (3.1.8)

r=0

l=0

dl* .

a0*

Очевидно, форма (3.1.5) является частным случаем (3.1.8) при a j = 0 , j =1, n ; dl = 0 , l =1, m .

Объекты, для которых справедливо последнее условие, называются регрессионными (Р-объекты):

m

y(i) = bru(i r) + η(i) .

r=0

Объекты называются авторегрессионными (АР-объекты), если

выполняется условие: br = 0 ,

r =

1, m

.

n

 

 

m

y(i) + a j y(i j) = dl η(i l) .

j=1

 

 

l=0

Вобщем случае, когда справедливо описание (3.1.8), объекты называются регрессионными-авторегрессионными (РАР-объекты).

Вслучае нелинейного динамического объекта описывающее его уравнение «вход-выход» в общем случае может быть записано в виде:

y(i) = ψ(z(i), c) + η(i) ,

(3.1.9)

где вектор z(i) включает в себя предысторию входов и выходов.

3. Линейная модель, представленная в пространстве состояний, имеет вид:

x(t) = A(t)x(t) + B(t)u (t) + G(t)

 

(t) ;

(3.1.10)

ξ

y(t) = H (t)x(t) + w(t) .

(3.1.11)

173

Здесь x(t) – n-мерный вектор состояния, u (t) – m-мерный вектор управления, ξ(t) – p-мерный вектор возмущений, y(t) – r-мерный вектор измерений, w(t) –— r-мерный сектор шумов измерений, A(t) , B(t) , G(t) , H (t) – матрицы соответствующих размерностей.

Уравнение (3.1.10) называется уравнением состояния, а уравнение (3.1.11) – уравнением измерений.

Типы математических моделей, приведенные выше, являются вероятностными. Они, как правило, используются для имитациионного моделирования работы объекта. В дальнейшем эти уравнения будем называть уравнениями объекта.

3.1.2. Оптимальная настраиваемая модель

При решении задачи идентификации в первую очередь возникает вопрос о выборе модели объекта. Очевидно, модель должна формироваться на основе той априорной информации, которая нам известна об объекте. К этой информации относятся порядок уравнений объекта, точка приложения помехи и т.д.

Для целей идентификации используются детерминированные модели, которые не включают в себя случайных факторов. Будем использовать следующие обозначения [12]:

a j , b j , dr – истинные значения параметров объекта; x(k) – истинные значения параметров состояния;

y(k) – истинные значения параметров измерений;

~

~

~

~

~

– оценки соответствующих параметров;

a j , b j ,

dr ,

x(k) ,

y(k)

ˆ

ˆ

ˆ

ˆ

aˆ j , bj ,

dr ,

x(k) ,

y(k) – оптимальные в некотором смысле

оценки параметров.

Предположим, что имеется объект под воздействием случайных факторов η(i) – шумов и входов – управлений u(i) , описываемый

в конечно-разностной форме линейным уравнением (3.1.8), но в несколько измененной форме:

n

m

m

y(i) + a j y(i j) = bju(i j) + d jη(i j) ; (3.1.12)

j=1

j=1

j=1

174

M{η(i)} = 0 , cov{η(i)η( j)} = ση2 δк(i j) ,

δк – символ Кронекера.

Данному объекту (3.1.12), выходом которого является истинное измеренное значение y(i) , можно сопоставить несколько детерми-

нированных моделей, отражающих структуру данного объекта. Отметим, что модели при этом будут давать некоторую оценку ~y(i) истинного значения. Казалось бы разумно использовать, на-

пример, следующую модель:

~

n

~ ~

m

~

y(i) + a j y(i j) = bju(i j) .

 

j=1

 

j=1

 

Данная модель отличается от уравнения объекта только отсутствием шумов.

Можно показать, что использование данной модели для идентификации коэффициентов a j и bj приведет к систематической

погрешности оценки этих параметров [4]. Дело заключается в том, что решение уравнения (3.1.12), по сути, интегрирует шумы, благодаря чему оно систематически будет отличаться от решения уравнения

~

n

~ ~

m

~

y(i) + a j y(i j) = bju(i j) .

 

j=1

 

j=1

 

Иначе говоря, математическая модель, построенная на использовании результатов измерений выходов реального объекта (3.1.12) должна отличаться от исходной модели объекта без шумов.

Близость настраиваемой модели к объекту будем характеризовать математическим ожиданием квадрата невязки:

M{ε

2

~

2

}.

(3.1.13))

 

(i)} = M{[ y(i) y(i)]

 

Под оптимальной настраиваемой моделью будем понимать такую, для которой M{ε2} − минимально возможное.

Пусть корреляционная функция помехи

ση2

,

j = 0;

M{η(i)η(i j)} =

 

j 0.

0,

 

 

 

 

175

Тогда оптимальная настраиваемая модель будет иметь вид:

n

m ˆ

 

yˆ(i) = −aˆ j y(i j) + bru(i r) +

 

j=1

r =0

 

m ˆ ˆ

[ y(i l) yˆ(i l)] .

(3.1.14)

+ dl / d0

l =1

Отсюда следует, что дисперсия невязки при наилучших оценках равна произведению дисперсии помехи ση2 на d02 .

Для удобства дальнейшего изложения запишем полученную оптимальную настраиваемую модель в общепринятом виде. Для этого введем вектор наблюдений

z т(i) = (y(i 1), ..., y(i n),u(i), ..., u(i m),

y(i 1) yˆ(i 1), ..., y(i m) yˆ(i m))

(3.1.15)

и вектор параметров

т

 

 

 

 

 

 

 

d

 

d

 

 

 

 

 

 

 

1

 

m

 

 

c

= a

, ..., a

n

, b

, ..., b

,

 

, ...,

 

.

(3.1.16)

 

 

 

 

1

 

0

m

 

 

 

 

 

 

 

 

 

 

 

d0

 

d0

 

Тогда уравнение (3.1.14)) можно переписать в векторном виде:

y

 

т

 

(3.1.17)

(i) = ψ(z (i), c ) = z

 

(i)c .

Очевидно, для регрессионных объектов модель (3.1.17) примет

вид

 

 

~

 

 

~

 

т

 

 

 

 

(i)b .

(3.1.18)

 

y(i) = u

 

~ =

При c c невязка между выходом настраиваемой модели и вы-

ходом объекта равна произведению помехи η(i) на d0 [13]:

ε(i) = y(i) yˆ(i) = d0η(i) .

(3.1.19)

Отсюда следует, что дисперсия невязки между выходом настраиваемой модели и выходом объекта, вызванная только структурой настраиваемой модели равна произведению дисперсии помехи ση2 и d02 .

σε2 = d02 ση2 .

176

Очевидно, что при d0 =1 и

~

= c

невязка между настраиваемой

c

моделью и объектом в каждый i-й момент времени равна помехе

η(i) .

3.2. Свойства оценок и критерии качества в задачах статистической обработки информации

3.2.1. Свойства оценок

Выше неоднократно использовались такие термины, как оценка, алгоритм вычисления оценки.

Под оценкой будем понимать некоторое правило, согласно ко-

~

торому вычисляются частные значения c , соответствующие частным выборкам вектора наблюдений z = α . Другими словами,

оценка есть некоторая случайная величина, которая характеризует-

ся плотностью распределения вероятностей

~

или

~

p(c , t) *

p(c , k) ,

где t и k характеризуют момент наблюдения. (Чтобы упростить запись (здесь и далее) не делаем различия в обозначениях случайных величин или процессов и принимаемых ими конкретных значений. Условимся также не вводить специальных обозначений для различных плотностей распределения; плотности распределения при различных аргументах различны, если не оговорено обратное. Такое соглашение в последнее время становится общеупотребитель-

ным.)

~ ~

Плотность распределения p(c , k) или p(c , t) является наиболее

полной характеристикой оценки. Однако, учитывая большие труд-

ности нахождения

~

~

p(c , k) или

p(c , t) , используют математическое

ожидание оценки

~

 

M{c} и ковариационную матрицу оценки.

Из желаемых свойств оценок можно выделить следующие пять

[14]:

1)линейность оценки;

2)несмещенность оценки;

3)минимум дисперсии в классе несмещенных оценок;

4)состоятельность или сходимость оценки (состоятельность и сходимость в среднем квадратичном);

177

5) эффективность, асимптотическая эффективность, оптимальность в классе асимптотически нормальных оценок.

Рассмотрим подробно эти желаемые свойства оценок.

1. Определение. Оценка называется линейной, если она является

линейной формой выхода:

 

 

 

~

 

 

или

~

(3.2.1)

 

 

сL = QY + γ

cL = Ay(i) + γ ,

где Q – некоторая матрица,

y – вектор выходных параметров по N

измерениям.

 

 

 

 

y т = ( y(1),..., y(N)) .

(3.2.2)

2.

Определение. Оценка называется несмещенной, если выпол-

няется условие

 

 

~

(3.2.3)

 

M{c} = M{c}.

3.

Определение. Оценка называется условно несмещенной, если

 

~

(3.2.4)

 

M{c / c} = c .

Покажем, что необходимым условием несмещенности (условной несмещенности) линейной оценки для объекта вида (3.1.6) является условие

QU = I ,

(3.2.5)

где U – матрица выходов.

Подставим в формулу для линейной оценки (3.2.1) значение вы-

хода объекта, определяемое формулой (3.1.6)

 

~

(3.2.6)

cL = Q(Uc + η) ,

и применим операцию нахождения математического ожидания к

обеим частям полученного выражения

 

 

~

 

 

M{cL} = M{Q(Uc + η)} .

(3.2.7)

Так как U и Q детерминированные матрицы входных воздейст-

вий и коэффициентов усиления, то можно записать:

 

~

 

 

(3.2.8)

M{cL } = QUM{c} + QM{η} .

Очевидно, будем иметь несмещенную оценку только в том слу-

чае, если:

 

 

1) QU = I;

2) M{η} = 0 ,

(3.2.9)

что и требовалось показать, т.е. условие (3.2.4) является необходимым условием несмещенности линейной оценки.

178

4. Определение. Оценка cMV называется несмещенной оценкой

минимальной дисперсии, если она не смещена, и, кроме того, для нее справедливо соотношение:

 

 

ˆ

 

~

 

 

 

 

 

 

 

c} var{c

c},

(3.2.10)

 

~

var{cMV

где

– любая другая несмещенная оценка.

 

c

 

5. Определение. Говорят, что оценка сходится к оцениваемой величине, если ее точность ~возрастает с увеличением объема вы-

борки. Введем обозначение c (N) для оценки параметра по выбор-

ке объема N. Оценка называется состоятельной, если для любого

δ > 0

lim P(

 

~

 

< δ) =1 .

(3.2.11)

 

 

 

c (N) c

 

N→∞

 

 

 

 

 

В этом случае говорят, что оценка сходится по вероятности.

6. Определение. Оценка называется состоятельной в среднем

квадратичном (сходится в среднем квадратичном), если

 

~

(3.2.12)

lim var(c (N) c) = 0 .

N→∞

 

Согласно (3.2.9), для того чтобы оценка была состоятельной, необходимо и достаточно выполнения двух условий: оценка долж-

на быть несмещенной и

~

lim

var(c (N) c) = 0 .

N→∞

~

7. Определение. Оценка

cэ(N) , состоятельная в среднем квад-

ратичном, называется эффективной, если справедливо соотношение:

~

~

~

~

M{(cэ(N) c)(cэ(N) c) т} M{(c (N) c)(c(N) c)т} , (3.2.13)

~

— любая другая состоятельная оценка, причем равенство

где c (N)

 

~

~

 

достигается при c (N) = cэ(N) .

 

3.2.2.Критерии качества, функции потерь и штрафа

взадачах оценки

Как уже отмечалось, критерий качества оценки наряду с математической моделью является основой при построении оценок параметров. До недавнего времени не существовало каких-либо тео-

179

ретически обоснованных методов выбора функций качества. Предпочтение того или иного критерия другим определялось простотой решения задачи, доступной априорной информацией и практической целесообразностью.

~

Критерий качества оценки J (c ) в общем случае представляет собой математическое ожидание некоторой функции потерь F(ε) или штрафа ϕ(c c ) , которые являются положительными четными функциями своих аргументов, т.е.

 

 

 

 

 

 

 

 

J (c ) = M{F(ε(i,c ))}

 

 

 

(3.2.13)

или

 

 

 

 

~

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

(3.2.14)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J (c ) = M ϕ(c c )

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

y=α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– невязка между выходами объекта и модели;

 

где ε(i, c )

 

 

 

 

 

 

 

 

 

ε(i,c ) = y(i) − ψ(i,c )

 

 

 

i – момент времени,

 

α – конкретная реализация выхода y . Опти-

мальным значением оценки параметра c

является решение урав-

нения:

 

J (c )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= M {F(ε(i,c ))}

 

 

ˆ

= 0

(3.2.15а)

 

 

 

 

 

 

 

 

c

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

c =c

 

 

или

~

 

 

 

c

=c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J (c )

 

 

 

 

 

 

~

 

 

 

 

 

= 0 .

(3.2.15б)

 

~

 

 

 

 

= M ϕ(c c )

 

y=α

 

~

 

c

 

~

 

 

ˆ

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

=c

 

 

 

 

 

c =c

 

 

 

 

 

 

 

 

 

~

Во многих литературных источниках функция ϕ(c c ) также

называется функцией потерь, но во избежание недоразумений будем называть ее функцией штрафа.

Оценки, которые обеспечивают минимум функции (3.2.14), называются байесовскими оценками, а функция (3.2.14) – байесовской функцией риска.

На практике, как правило, не представляется возможным определить критерий (3.2.13). Однако для эргодических процессов

оценка ε ~ может быть заменена эмпирическими усред-

M{F( (i, c ))}

ненными по времени потерями, вычисленными по одной реализа-

180