книги / Основы теории оценивания с приложениями к задачам обработки навигационной информации. Ч. 1 Введение в теорию оценивания
.pdfНа качественном уровне можно дать следующее объяснение та-
о
кого отличия. Замечаем, что при выполнении условия а « Ь т алгоритм вычисления оптимальной линейной оценки фактически сведется к нахождению среднего арифметического по всем значе ниям У'-а/2, /= Г й, принадлежащим отрезку [-vmin —ûr / 2 ,ymax - а / 2]. В то же время в оптимальном нелинейном алгоритме апостериорная область значений [с\,С2 \ определяется пересечением априорной области [0 ,6 ] и отрезка [утах - я ,у т т]-
Рис. 2.5.13. Формирование апостериорной области для оптимальной нелинейной оценки
Очевидно, что при увеличении числа измерений повышается вероятность появления измерения с минимальным (близким к ну
лю) и максимальным (близким к а) значениями |
ошибки, т. е. |
|
уmin - > х , a ymax —►а- + а . Отсюда |
следует, что |
длина отрезка |
у max ~ ymin > определяющего область |
значений всех измерений, |
которые используются при вычислении среднего арифметическо го, стремится к величие а , задающей размер априорной области. В то же время длина отрезка ymin + а - у,ш х, определяющего размер апостериорной области для оптимальной нелинейной оценки, будет стремиться к нулю (рис. 2.5.13).
Завершая рассмотрение байесовского подхода при решении за дач оценивания, целесообразно еще раз акцентировать внимание на некоторых его особенностях по сравнению с небайесовским подходом. Основное отличие здесь заключается в том, что в рам ках байесовского подхода предполагается случайным вектор х и
считается заданной совместная функция плотности распределения /(x,v), располагая которой с учетом соотношения (2 .1 .2 1 ) и пра вил преобразования случайных векторов может быть получена функция f{x,y). Именно эта функция фигурирует при вычисле
нии математического ожидания в минимизируемом критерии, причем естественно, что фиксации вектора х не требуется. В от
личие от этого при небайесовском подходе только после фиксации искомого вектора можно ввести ф.п.р.в. / (у / х ), которая фигури рует при вычислении критерия.
Следует также заметить, что поскольку вектор х не фиксирует ся, то при байесовском подходе понятие состоятельности не вво дится. Весьма важно подчеркнуть, что при байесовском подходе удается получить общее правило вычисления несмещенной оценки с минимальной дисперсией в виде (2.5.2). Для небайесовского подхода такого правила не существует. Все отмеченные особенно сти обоих подходов представлены в табл. 2.5.4.
Следует еще раз обратить внимание на тот факт, что понятие несмещенности в разных подходах вводится по-разному. Для не байесовского подхода оценка является несмещенной, если матема
тическое |
ожидание для оценки, соответствующее плотности |
f ( y /x ) , |
совпадает с фиксированным значением х, т. е. |
м г/, Ш |
) = * |
В байесовском подходе ошибка считается несмещенной, если математическое ожидание от оценки совпадет с априорным мате матическим ожиданием х, т. е. M v(x(y)) = Л/Дх). Из сказанного
следует, что одна и та же оценка, являясь несмещенной в одном смысле, может оказаться смещенной в другом смысле.
Ранее уже подчеркивалось, что оптимальная в среднеквадрати ческом смысле байесовская оценка, представляющая собой услов ное математическое ожидание (2.5.2), является несмещенной в байесовском смысле. Для линейной задачи это очевидно, так как
М ух(у) = М у(;с + К Щ у - Нх)) = х .
Определяя смещение оценки х(у) = х +КН(у - Нх) с позиций небайесовского подхода, т. е., вычисляя его как
М у/Хх(у) = ( Е - КН)х + КНх,
замечаем, что эта величина отлична от нуля, причем согласно (2.5.20), (2.5.21) величина такого смещения тем меньше, чем выше апостериорная точность оценивания.
Для простейшего примера оценивания скалярной величины по
измерениям при ;*• = г |
, i = 1 .т и |
л' = 0 полученное выражение |
||
принимает следующий вид: |
|
|
|
|
МУ/.Xх{х-х)J = Му/х Х-- |
fil |
|
/иа„ |
АТ |
|
|
|
||
+ а > 5 > , |
1 - - |
та" + г" |
ша0 + г |
Как нетрудно заметить, коэффициент, стоящий перед х, пред ставляет собой отношение апостериорной дисперсии к ее априор ному значению. Таким образом, чем меньше это отношение, тем меньше смещение.
Проиллюстрируем сказанное на примере анализа смещения оценок в линейной гауссовской задаче. Ранее было введено поня тие инвариантности ошибки оценивания, определяемое как функ циональная независимость ее значений от оцениваемого вектора, т.е. выражение для оценки не содержит слагаемых, связанных с х .
Представляется уместным обсудить взаимосвязь понятий не смещенности и инвариантности. Сопоставляя эти понятия в рам ках небайесовского подхода, можно констатировать, что для ли нейной задачи эти два понятия совпадают. В этом нетрудно убе диться, полагая для простоты ошибки измерения центрированны ми и представляя выражение для ошибки в виде
х - х(у) = {Е - КН)х + K v , |
(2.5.44) |
где К - некоторая произвольная матрица.
х(у) = х + |
<7Q~ |
^ т |
|
^ |
|
|
(3) |
||
г2 +су*т |
|
|
||
|
-•=1 |
|
) |
|
|
Tl |
2 |
2 |
|
I т |
|
|||
о~о |
г |
|
||
р = ~л~1г~л |
г2 +<7~т |
( 4 ) |
||
|
|
|
Легко убедиться, что выражения для оценок (1), (3) совпадают с приведенными в табл. 2.2.3 выражениями, соответствующими
ММНК при d =— и q( = — , а выражения для дисперсий (2), (4) -
°о rf
с аналогичными выражениями для ММНК, полученными в приме рах 2.2.2, 2.2.4.
Задача 2 .5 .2 . Найдите такие ф.п.р.в. для ошибок измерения и оцениваемого скаляра х в условиях примера 2.4.1, при которых полученный там алгоритм будет оптимальным байесовским алго ритмом.
Решение. Полученный в этой задаче алгоритм будет оптималь
ным, если оцениваемая величина х |
и ошибки V,- будут центриро- |
||
|
1 |
1 |
1 |
ванными гауссовскими с дисперсиями а о = г |
=Ь~ / 1 2 . |
||
Задача 2.5.3. Конкретизируйте |
выражения для / Х,у(х,у) и |
fy(y) в задаче оценивания центрированной гауссовской случай
ной величины с дисперсией Стд по измерениям |
|
)’i =si(x) + Ei, |
(1) |
в которых ошибки е,- независимы от х и, как в задаче 2.3.1, пред
ставляются в виде |
|
t;= d+ Vf |
(2 ) |
суммы центрированной гауссовской случайной величины с дис персией ajy и независимых между собой и от d центрированных гауссовских случайных величин с одинаковыми дисперсиями rf - г2, i = 1.т. Упростите полученные выражения при условии
_I |
__1 |
Полагая в критерии (2.2.6) Q = R |
, D = (P ) , ясно, что при |
решении гауссовской задачи при независимых (некоррелирован ных) х и V оценки, соответствующие ММНК, будут совпадать с оптимальными байесовскими оценками, если условное среднее апостериорной плотности совпадет с ее глобальным экстремумом.
Задача 2.5.6. Покажите, что в сформулированной в подразделе 2.5.3 задаче оценивания центрированного п-мерного вектора х с
заданной матрицей ковариаций Р х по m-мерным измерениям
y= Hx +v,
вкоторых у - независящий от х центрированный вектор с матри
цей ковариаций R, |
матрица ковариаций |
для вектора невязки |
ц (у) = у —Нх(у) |
определяется в виде |
Рц =м{р (у)рт(у)}= |
= R-HPxHr , где х(у) = К у , а К = PHrR~' |
|
|
Решение. Действительно, представляя невязку как |
||
Ц ОО = У ~ У = Нх + V - Нх(у) = |
Н(х - х(у)) + V, |
|
имеем |
|
|
м (ц М |!т (.v)| = |
м \ н ( х - х(у)) + у][я(х - х(у)) + v]TJ = |
|
= НРХН Т + М{Н(х - х ( у ) У + v(x - х(у))тн т} + R |
||
Поскольку |
|
|
м{х(Уу j = М {К(Нх + v)vT} = KHR = P H 7R - lR = P H т |
получаем
м{[1 (у)рт(у)}= Н Р Н Т - 2Н РН Т +R = R - Н Р Н Т
Задача 2.5.7. Покажите, что для оптимальной байесовской оценки (2.5.2) центрированного вектора х справедливо следующее соотношение:
M , J ( y ) x T(y) = Р ' - Р ,
где Рх и Р - априорная и апостериорная безусловная матрицы ковариаций.
Решение. Это соотношение вытекает из следующей цепочки ра венств:
р = = МуМх/у{ххт- х(у)хт - хх(у)т+ х(у)л(у)т} =
= МУМ,/УI**' - х(у)х(уУ} = М х,у { ^ т} - Мх,ух(у)х(уУ
Задача 2.5.8. Покажите, что матрица
в которой н э - J — (х1 f(x)dx »представляет собой оценку сверху
для матрицы нижней границы в задаче оценивания х по измере
ниям у = s(jt) + V, |
в которых |
х и |
V |
независимы, |
а |
||
f (x) = N(x;x,Px) и / |
(v) = N(x;0,г2Е,„) |
|
|
|
|||
Решение. Введем матрицу |
|
ds(x) |
|
|
|
||
Н э{х) - —— , тогда нетрудно убе- |
|||||||
|
|
|
|
dxr |
|
|
|
диться в справедливости представления |
|
|
|
||||
М | ( я э(х))Т( я э(дг))| = М | ( я э(х) - |
Н э)Т( я э(х) - |
Н э)| + (Я э)т Я э , |
|||||
с учетом которого можем записать |
|
|
|
|
|||
и * - ( и * |
^ | ( я э(х ) - Я 9)Т( я э( х ) - Я э)| + (Я э)тЯ э^ |
|
|||||
Поскольку |
м j ( я э(х) - Я |
э )т ( я э (х) - Н э)} > 0, то легко |
по |
||||
нять, что |
|
|
|
|
|
|
|
( |
, 1 |
_ |
__ у |
1 |
|
|
|
= (Ят)-] + 4 ( Я э)тЯ э |
> |
|
|
|
|||
\ |
г |
|
J |
|
|
|
|
|
(м [ н э(х) - |
Н 3) т(н э(х) - |
Я э)}+ ( Я э)т |
|