Загребаев Методы обработки статистической информации в задачах контроля 2008
.pdfции, т.е. как среднее арифметическое функций потерь по N измерениям:
~ |
|
~ |
|
1 |
N |
~ |
~ |
|
|
J (c ) = M{F(ε(i, c ))} |
|
|
|
∑F(ε(i, c )) |
= J N (c ) . |
(3.2.16) |
|||
|
N |
||||||||
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
ˆ |
|
|
|
Оптимальной |
выборочной |
|
оценкой |
является |
решение |
||||
|
c(N ) |
||||||||
уравнения: |
|
~ |
|
|
|
|
|
|
|
|
∂J |
|
|
|
|
|
|
|
|
|
(c ) |
|
|
|
|
|
|
=0 . (3.2.17)
∂~=ˆ
c c (N )
Вдальнейшем, если этого не требует решение задачи, будем опускать индекс N при написании выборочной оценки.N~c
3.2.3.Инвариантность оптимального решения относительно четных функций потерь (для линейного объекта)
Естественно принять допущение, что оптимальным решением уравнения (3.2.15а) является истинное значение параметра c . Тогда условие минимума (3.2.15а) средних потерь (3.2.13), опреде-
|
|
|
|
ˆ |
|
|
|
|
||
ляющее оптимальное решение c = c , можно записать в виде равен- |
||||||||||
ства нулю градиента средних потерь: |
|
|
|
|
||||||
~ |
|
|
|
~ |
|
|
|
|
||
|
|
|
|
|
|
|
||||
J (c ) |
|
~ |
|
= M{ F[ε(i, c )]} |
~ |
= |
|
|||
|
|
c =c |
|
|
|
|
c =c |
|
|
|
|
|
|
|
|
|
|
||||
|
|
′ |
|
|
|
= 0 |
. |
(3.2.18) |
||
= M{F [ε(i,c )] ε(i,c )} |
|
|
||||||||
|
|
|
|
|
|
c |
=c |
|
|
|
|
|
|
|
|
|
|
|
|
и положительной определенности матрицы Гессе – матрицы вторых производных:
|
2 |
|
2 |
|
|
> 0 . |
(3.2.19) |
|
J (c ) = M{ |
|
F[ε(i,c )]} |
||||
|
|
|
|
|
c |
=c |
|
|
|
|
|
|
|
~ |
|
невязка ε(i, c) |
между выходом объек- |
||||||||||
Учитывая, что при c = c |
|||||||||||||
та y(i) и выходом оптимальной настраиваемой модели |
~ |
||||||||||||
y(i) в i-й |
|||||||||||||
момент времени равна возмущению η(i) , можно записать |
|
||||||||||||
|
|
|
= M |
′ |
|
|
|
|
|
}= 0 . |
(3.2.20) |
||
|
|
|
|||||||||||
J (c ) |
|
{F [η(i)] ε(i,c ) |
|
|
|||||||||
|
|
c =c |
что η(i) |
~ |
|
|
|
c |
=c |
статистически неза- |
|||
Обратим внимание, |
|
~ |
|
|
|||||||||
и ε(i, c ) |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
c |
= |
c |
|
|
|
|
|
|
|
|
|
|
|
|
|
висимы.
181
Тогда
J (c ) |
|
|
= M{F′ [η(i)] ε(i,c )} = |
|
|
|
|||
|
|
c =c |
|
|
= M{F′ [η(i)]}M{ ε(i,c )} = 0 . |
(3.2.21) |
|||
Тривиальное решение уравнения (3.2.21) будет при условии |
||||
|
|
|
M{F′ [η(i)]} = 0 , |
|
или |
|
|
||
|
|
∞ |
F′ [η]p(η)dη = 0 . |
|
|
|
∫ |
(3.2.22) |
|
|
|
−∞ |
|
|
Так как p(η) , как правило, четная функция η, то для выполне-
ния тождества (3.2.22) необходимо и достаточно, чтобы |
|
′ |
бы- |
F (η) |
|||
ла нечетной функцией η или F(η) – четной функцией η. |
|
|
|
Таким образом, условие оптимальности (3.2.21) при |
~ |
= c |
вы- |
c |
полняется для любой четной функции потерь. Иначе говоря, оптимальное решение инвариантно относительно четных функций потерь, причем оптимальное решение совпадает с истинным значением оцениваемого параметра.
Однако на практике, как уже отмечалось, вместо математических ожиданий используются эмпирические средние, вычисляемые по наблюдаемым данным. В результате можно находить лишь те или
иные оценки cˆ(N) истинного параметра c . Причем даже если по-
лученные оценки состоятельны, то их асимптотические свойства (скорость стремления оценки к истинному значению) существенно зависят от вида используемой функции потерь. В результате выше-
изложенного возникает задача нахождения такой функции потерь |
||
~ |
ˆ |
обладает максимально воз- |
F * (ε(c )) , при которой оценка |
c(N ) |
можной скоростью сходимости к истинномузначению параметра c . Особенно большое значение приобретает этот вопрос при разработке робастных (стабильных, гарантирующих) методов оценивания параметров. Вопросы, связанные с определением оптимальных функций потерь, рассматриваются в последующих разделах
настоящего пособия.
Рассмотрим наиболее часто используемые в настоящее время в теории оценивания функции потерь и штрафа:
1) квадратичные:
182
|
|
т |
|
|
|
|
|
|
|
(3.2.23) |
||||
ϕ(c − c ) = (c − c ) |
|
R(c − c ) ; |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
2 |
; |
(3.2.24) |
F(ε(i,c )) = r(i)( y(i) − y |
(i,c )) |
|
||||||||||||
где R – положительно-определенная симметричная матрица весо- |
||||||||||||||
вых коэффициентов; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2) модульные: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ϕ(c − c ) = |
|
|
|
c − c |
|
|
|
; |
|
|
(3.2.25) |
|||
|
|
|
|
|
|
F(ε(i,c )) = r(i) y(i) − y(i,c ) ;
3) простые: |
i = 0, 1, 2, … ; |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
< δ / 2; |
|||||
|
|
|
|
|
|
||||||||||||
|
|
0, |
|
|
|
|
|
|
c − c |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
ϕ(с − с) = |
|
|
|
|
|
|
|
c − c |
|
|
|
≥ δ / 2; |
|||||
|
|
1 / δ, |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y(i) − y(i) |
|
|
|
< δ / 2; |
|||||||||
|
0, |
|
|
|
|
|
|||||||||||
|
|
|
|||||||||||||||
F(ε(i,c )) |
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y(i) − y(i) |
|
|
≥ δ / 2. |
|||||||||||
|
1 / δ, |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(3.2.26)
(3.2.27)
(3.2.28)
Можно предложить и другие функции потерь и штрафа.
3.3. Статистические методы обработки данных при использовании полного объема информации
3.3.1. Метод наименьших квадратов
Метод наименьших квадратов нашел наиболее широкое распространение в практике оценивания, так как для реализации этого метода требуется только знание структуры модели.
Функция потерь, критерий качества оценки
Как уже отмечалось, методу наименьших квадратов соответствует квадратичная функция потерь. Для объекта с одним выходом эта функция имеет вид:
|
|
|
2 |
. |
(3.3.1) |
|
F(ε(i,c )) = r(i)( y(i) − ψ(i,c )) |
|
|
||||
Критерий качества имеет вид: |
|
|
|
|
|
|
|
|
2 |
}. |
|
||
J (c ) = M{r(i)( y(i) − ψ(i,c )) |
|
|
|
183
Для эргодических процессов в качестве критерия качества используются средние потери:
J (c ) = 1 ∑N r(i)( y(i) − ψ(i,c ))2 .
N i=1
Так как N представляет собой некоторое число, показывающее
количество используемых для оценки значений выходов объекта и |
|||||||||
модели и независящее от оценки |
~ |
|
|
|
~ |
можно пе- |
|||
c , то функцию |
J (c ) |
||||||||
реписать в виде: |
|
2 |
|
|
|
||||
|
|
N |
|
|
|
||||
|
|
J (c ) = ∑r(i)( y(i) − ψ(i,c )) |
, |
|
(3.3.2) |
||||
|
|
i=1 |
|
|
|
|
|
|
|
или в векторной форме: |
|
|
|
|
|
|
|||
Оценка |
ˆ |
J (c ) = ( y − ψ(c))т R( y − |
ψ |
(c)) . |
|
(3.3.2а) |
|||
обеспечивает минимальное |
значение |
критерия |
|||||||
cis |
(3.3.2), т.е.
ˆ |
N |
|
2 |
|
||
cls = arg min ∑( y(i) − ψ(i,c )) |
|
r(i) |
||||
c |
i=1 |
|
|
|
||
и является решением уравнения: |
|
|
|
|||
|
∂J (c ) |
|
|
= 0 . |
|
|
|
|
|
|
|||
|
∂c |
|
|
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
c |
=cls |
|
|
(3.3.3)
(3.3.4)
В общем случае, когда правая часть модели представляет собой
нелинейную функцию ψ ~ , задача минимизации критерия
(u(i), c )
(3.3.2) как правило, не может быть решена в явном виде и требует использования методов нелинейного программирования. В случае линейной модели вида (3.1.18) получены явные формулы оценки.
3.3.2. Метод наименьших квадратов для линейных регрессионных объектов
Как уже отмечалось в разд. 3.1.1, регрессионный объект и соответствующая ему модель имеют вид:
y(i) = b1u1(i) + b2u2 (i) +... + bmum (i) + η(i) ; |
(3.3.5) |
||||||
y(i) = b u (i) + b |
u |
2 |
(i) +... + b u |
m |
(i) . |
(3.3.6) |
|
1 1 |
2 |
|
m |
|
|
184