Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Teoria_otsenivania.pdf
Скачиваний:
152
Добавлен:
02.04.2015
Размер:
2.66 Mб
Скачать

ГОСУДАРСТВЕННЫЙ НАУЧНЫЙ ЦЕНТР РОССИЙСКОЙ ФЕДЕРАЦИИ ЦНИИ «ЭЛЕКТРОПРИБОР»

О.А. Степанов

Основы теории оценивания и дискретной фильтрации с приложениями к обработке навигационной информации и примерами на Мatlab

ТЕКСТ ЛЕКЦИЙ

ГЛАВА 2. Основы теории статистического оценивания.

Санкт-Петербург

2005

Содержание главы 2. ……………………...............................................................................

2

Введение ………….……………………………………………………………………………

4

2.1 Примеры и постановки задач оценивания постоянных параметров

 

при обработке навигационной информации…………………………...............................

7

2.1.1 Оценивание коэффициентов полинома……………………………………………...

7

2.1.2 Задача выставки инерциальной навигационной системы, простейший случай

9

2.1.3Постановка линейной задачи оценивания………………………………………….. 10

2.1.4Определение временного запаздывания реализаций …………………………….. 11

2.1.5 Определение координат по измерениям дальностей до точечных ориентиров .

13

2.1.6 Определение координат и скорости по спутниковым данным ………………….

14

2.1.7 Постановка нелинейной задачи оценивания и ее линеаризация………………...

16

2.1.8 Задача комплексной обработки избыточных измерений…………………………

19

2.1.9Задачи к разделу 2.1……………………………………………………………………. 21

2.1.10Вопросы к разделу 2.1………………………………………………………………... 23

2.2 Алгоритмы оценивания на основе минимизации наблюдаемых критериев.

 

Метод наименьших квадратов...............................................................................................

24

2.2.1 Основные положения и постановка задачи метода наименьших квадратов…..

24

2.2.2Общее решение линейной задачи……………………………………………………. 26

2.2.3Точность оценивания метода наименьших квадратов…………………………... 30

2.2.4 Сопоставление различных алгоритмов метода наименьших квадратов ……… 33

2.2.5Задачи к разделу 2.2……………………………………………………………………. 36

2.2.6Вопросы к разделу 2.2…………………………………………………………………. 43

2.3 Оптимальные в среднеквадратическом смысле линейные алгоритмы оценивания..

44

2.3.1 Постановка задачи получения оптимальных линейных оценок………………...

44

2.3.2Решение задачи нахождения оптимальных линейных оценок…………………... 46

2.3.3Решение линейной задачи…………………………………………………………….. 48

2.3.4 Свойство ортогональности оптимальных линейных оценок……………………. 51

2.3.5Задачи к разделу 2.3……………………………………………………………………. 52

2.3.6Вопросы к разделу 2.3…………………………………………………………………. 55

2.4Небайесовский метод оценивания……………………………………………………......... 56

2.4.1 Основные положения и постановка задачи………………………………………… 56

2.4.2 Свойства небайесовских оценок……………………………………………………... 57

2.4.3 Метод максимума правдоподобия…………………………………………………… 59

2.4.4Решение нелинейной гауссовской задачи ………………………………………….. 60

2.4.5Решение линейной гауссовской задачи……………………………………………... 62

2.4.6

Задачи к разделу 2.4.........................................................................................................

63

2.4.7

Вопросы к разделу 2.4………………………………………………………………….

67

2

2.5. Байесовский метод оценивания……………………………………………………….........

68

2.5.1.Основные положения и постановка задачи…………………………………………

68

2.5.2Свойства оптимальных оценок……………………………………………………..... 69

2.5.3Решение нелинейной гауссовской задачи…………………………………………... 72

2.5.4Решение линейной гауссовской задачи……………………………………………... 75

2.5.5

Повышение точности при использовании нелинейных алгоритмов……………

78

2.5.6

Сопоставление байесовского и небайесовского подходов………………………...

83

2.5.7Задачи к разделу 2.5……………………………………………………………………. 85

2.5.8Вопросы к разделу 2.5…………………………………………………………………. 88

2.6 Реализация алгоритмов комплексной обработки избыточных измерений……….......

89

2.6.1 Инвариантная схема обработки………………………………………………………

89

2.6.2Неинвариантная схема обработка………………………………………………….... 91

2.6.3Централизованная и децентрализованная схемы обработки……………………. 94

2.6.4. Рекуррентная схема обработки………………………………………………………

96

2.6.5 Разностная схема обработки…………………………………………………………..

98

2.6.6 Итерационная схема обработки………………………………………………………

105

2.6.7Задачи к разделу 2.6……………………………………………………………………. 107

2.6.8Вопросы к разделу 2.6…………………………………………………………………. 112

2.7Заключение…………………………………………………………………………................. 113

2.8Задачи для моделирования с использованием Matlab………………………………....... 114

2.9Литература……………………………………………………………………………….......... 119

2.10Предметный указатель…………………………………………………………………....... 120

2.11Английские термины………………………………………………………………….......... 122

2.12Аббревиатуры……………………………………………………………………………...... 122

3

Введение к главе 2.

Внастоящей главе на примере важной задачи оценивания постоянных параметров, часто возникающей при обработке навигационной информации, излагаются основные подходы и методы теории статистического оценивания.

Вразделе 2.1 приводятся примеры задач обработки навигационной информации, в которых возникает необходимость оценивания вектора постоянных параметров. Рассматриваются как линейные задачи (оценивание коэффициентов полинома, выставка инерциальной навигационной системы в ее простейшем варианте), так и нелинейные задачи, в частности: определение временного запаздывания между реализациями, определение координат по измерениям дальностей до точечных ориентиров, определение координат и скорости по спутниковым данным, слежения за подвижным объектом. Обсуждается процедура линеаризации, с помощью которой нелинейные задачи сводятся к линейным. В общем виде формулируется постановка задачи оценивания, включающая все рассмотренные частные случаи, а также задачу комплексной обработки избыточных измерений.

Вразделе 2.2 рассматриваются методы синтеза алгоритмов оценивания в которых не требуется введения предположений о случайном характере ошибок измерения и оцениваемых параметров - метод наименьших квадратов (МНК), и его модификации: обобщенный метод наименьших квадратов (ОМНК) и модифицированный метод наименьших квадратов (ММНК). Эти методы основаны на минимизации так называемых наблюдаемых критериев, т.е. таких, которые могут быть непосредственно найдены с использованием измеряемых величин и вычисляемых их значений. Вводятся понятия системы нормальных уравнений и невязки измерений. Подробно рассматриваются и сопоставляются между собой алгоритмы метода наименьших квадратов и его модификаций в задаче линейного оценивания. Выводятся соотношения для ошибок оценивания и при введении дополнительных предположений о случайном характере ошибок измерения и вектора оцениваемых параметров и задании для них первых двух моментов вычисляются матрицы ковариаций этих ошибок.

Вразделе 2.3. формулируется постановка задачи получения оптимальной в среднеквадратическом смысле оценки. Отмечается особенность такой постановки, заключающаяся в том, что задача оценивания решается с позиций обеспечения минимального значения критерия, непосредственно связанного с ошибкой оценивания и представляющего собой сумму дисперсий компонент вектора ошибок оценивания. Обращается внимание, что такой подход возможен благодаря тому, что предположение о случайном характере ошибок измерения и оцениваемого вектора вводится уже на этапе постановки задачи оценивания. В целях упрощения решения задачи в рамках сформулированной постановки оценка отыскивается в классе линейных оценок, что позволяет при минимизации выбранного критерия ограничиться информацией только

опервых двух моментах случайных векторов. Доказываются необходимые и достаточные условия оптимальности линейных оценок и выводятся выражение для матрицы ковариаций их ошибок.

4

Устанавливается связь полученных алгоритмов с алгоритмами МНК. Вводится и обсуждается свойство ортогональности ошибок линейных оценок. Отмечается, что линейная оптимальная оценка может быть получена из условия ортогональности ее ошибок.

Вразделе 2.4. рассматриваются основные положения небайесовского подхода и соответствующая ему постановка задачи, особенность которой заключается в том, что предположение о случайном характере вводится только для ошибок измерения, причем их статистические свойства считаются полностью известными, т.е. полагается заданной ф.п.р.в. Сам оцениваемый параметр, как и в МНК, предполагается неизвестным детерминированным вектором. Вводятся такие понятия, как функция правдоподобия, несмещенность оценок их состоятельность

иэффективность. Отмечается, что в рамках небайесовского подхода наибольшее применение получили алгоритмы, основанные на методе максимума функции правдоподобия (МФП). Подробно рассматриваются нелинейная и линейная задачи с гауссовскими ошибками измерений. Для линейной гауссовской задачи доказывается совпадение несмещенной эффективной оценки с оценкой, соответствующей МФП, и устанавливается ее связь с оценками ОМНК.

Вразделе 2.5. формулируются основные положения байесовского подхода и соответствующая ему постановка задачи. Отмечается, что эта постановка совпадает с рассмотренной в разделе 2.3. постановкой задачи получения оптимальной в среднеквадратическом смысле оценки, особенность которой заключается в предположении о случайном характере, как оцениваемого вектора, так и ошибок измерения. Обращается внимание на то, что, в отличие от раздела 2.3. считаются полностью известными их статистические свойства, заданные совместной ф.п.р.в., а при нахождении оценок не вводится каких-либо ограничений на класс используемых функций. Приводится алгоритм получения оптимальной оценки в виде условного математического ожидания и анализируются свойства оптимальной оценки. Подробно рассматриваются нелинейная

илинейная задачи с гауссовскими ошибками измерений. На простейшем примере иллюстрируется возможность повышения точности оценивания при использовании оптимальных нелинейных алгоритмов по сравнению с точностью, достигаемой с помощью оптимальных линейных алгоритмов. Для линейной задачи устанавливается связь оптимальной оценки и оценки, соответствующей МФП. В сравнительном плане обсуждаются особенности байесовского и небайесовкого подходов.

Вразделе 2.6 рассматриваются различные схемы построения процедур обработки избыточных измерений, реализующие полученные в предыдущих разделах алгоритмы оценивания. В частности, обсуждаются и сопоставляются инвариантная и неинвариантная схемы обработки. На примере задачи обработки данных от двух измерителей устанавливается связь инвариантного алгоритма с алгоритмами ОМНК и МФП. Вводятся централизованная и децентрализованная схемы обработки данных от нескольких измерителей. Рассматриваются рекуррентные алгоритмы оценивания. Подробно обсуждаются особенности решения задачи оценивания в условиях, когда в составе ошибок измерения имеется систематическая составляющая, представляющая собой постоянную для всех измерений неизвестную величину. Анализируются разностные схемы

5

обработки, суть которых заключается в преобразовании исходных измерений с целью исключения из них систематической составляющей ошибки. Устанавливается связь традиционно используемых разностных алгоритмов и оптимальных в том или ином смысле алгоритмов.

По ходу изложения теоретического материала получаемые результаты иллюстрируются на примерах решения задач обработки навигационной информации, рассмотренных в подразделе 2.1. В конце каждого подраздела приводятся задачи и перечень контрольных вопросов, которые представляют собой дополнительный материал, позволяющий лучше понять наиболее важные положения соответствующего подраздела и иллюстрирующий возможности применения полученных алгоритмов.

В конце главы приведены задания по моделированию с использованием Matlab. Нумерация формул, задач, рисунков и таблиц приводится по каждому разделу.

Материал главы может быть использован как для углубленного изучения основ теории оценивания, так и для чтения лекций аспирантам, студентам и магистрам.

Для студентов рекомендуются материалы разделов 2.1, 2.2, 2.3, 2.6. Примерный объем лекции по каждому разделу – от двух до четырех академических часов в зависимости от подробности изучения и подготовленности аудитории. На практические занятия, включающие обсуждение порядка выполнения задания по моделированию и решение задач, дополнительно необходимо 8 часов. Всего – (16-24) часа.

Для магистров и аспирантов дополнительно рекомендуются разделы 2.4, 2.5 и практические занятия по решению задач в объеме – (12-16) часов.

6

2.1 Примеры и постановки задач оценивания постоянных параметров при обработке навигационной информации.

Рассмотрим примеры типичных линейных и нелинейных задач оценивания постоянных параметров, с которыми приходится сталкиваться при обработке навигационной информации.

2.1.1. Оценивание коэффициентов полинома.

Предположим, что в моменты времени ti , i =1.m , с использованием имеющегося на борту летательного аппарата датчика проведены измерения высоты, и при этом можно полагать, что в течение интервала проведения измерений эта высота не меняется. Тогда, вводя обозначение h = x ,

и полагая, что измерения содержат ошибки vi , i =1.m , задачу определения h можно свести к оцениванию неизвестной константы x по набору зашумленных измерений вида

 

 

yi = x + vi , i =

1.m

.

 

(2.1.1)

Вводя составленный из единичек столбец H , H т =[1,1....1] , m-мерные векторы

y = ( y

,...y

m

)т и

 

 

 

 

 

1

 

 

v = (v ,...v

m

)т , измерения (2.1.1) можно записать как

 

 

 

 

1

 

 

 

 

 

 

 

 

 

y = Hx +v .

 

(2.1.2)

Отличительная особенность этого выражения заключается в том, что зависимость измерений от оцениваемого параметра – линейная. В этой связи можно говорить о линейном характере измерений.

Можно ввести более сложную модель для описания изменения высоты за время проведения измерений. В частности, если считать, что высота меняется по линейному закону, то тогда

измерения, проводимые с интервалом t , можно представить в виде

 

 

yi = x0 +Vti + vi , i =

 

,

(2.1.3)

 

1.m

где x0 , V

- неизвестные начальная высота и вертикальная скорость, полагаемые постоянными,

ti = (i 1)t

- моменты времени от начала наблюдения.

 

Измерения (2.1.3) и в этом случае могут быть представлены с помощью соотношения (2.1.2).

Для этого достаточно ввести оцениваемый вектор и матрицу H как

 

 

 

 

x = (x

, x

2

)т = (x

0

,V )т ,

H т =

1

1

1

. (2.1.4)

1

 

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

t1

tm

 

Можно получить представление в виде (2.1.2) и для более общего случая, когда изменение высоты описывается полиномом n 1 -первого порядка, и тогда задача в математическом плане может быть сведена к оцениванию коэффициентов x = (x1, x2 ,..xn )T этого полинома по измерениям

y

 

= x

+ x

 

t

 

+ x

 

t 2

+.. + x

t n1

+ v

 

, i =

 

.

(2.1.5)

i

2

i

3

i

1.m

 

1

 

 

 

i

 

n i

 

 

 

 

 

7

К такой постановке нередко сводится задача предварительной обработки измерений используемых датчиков с целью снижения уровня их шумов.

С необходимостью оценивания коэффициентов полинома приходится также сталкиваться и при решении так называемой задачи калибровки приборов. Ее суть заключается в том, что показания прибора сравниваются либо с эталонным значением измеряемого параметра, либо с показаниями другого, более точного измерителя. При этом требуется построить модель изменения ошибок во времени с тем, чтобы в дальнейшем при отсутствии эталона учесть эти изменения и тем самым повысить точность измерения в штатном режиме. Пример реализаций ошибок измерений, явно содержащих постоянную составляющую в одном случае и квадратичный тренд (полином второго порядка) - в другом, приведены на (рис.2.1.1, 2.1.2).

25

 

 

 

 

 

 

 

 

 

 

 

 

 

измеренные значения

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

неизвестная величиина x

 

 

 

 

 

-5

1

2

3

4

5

6

7

8

9

10

0

 

 

 

 

номер измерения

 

 

 

 

 

Рис.2.1.1 Пример реализации ошибок измерений, содержащих постоянную величину.

8

140

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

80

 

 

 

 

измеренные значения

 

 

 

 

 

 

 

 

 

 

 

 

 

60

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

-20

 

 

квадратичный тренд

 

 

 

 

 

-40

1

2

3

4

5

6

7

8

9

10

0

 

 

 

 

номер измерения

 

 

 

 

 

Рис. 2.1.2 Пример реализации ошибок измерений, содержащих квадратичный тренд, t =10c , t = 0.1c .

В качестве аргумента в выражении (2.1.5) не обязательно должно фигурировать время. Это могут быть и другие физические величины, например, температура. Известно, что ошибки высокоточных измерителей существенным образом зависят от температуры. Для снижения этих ошибок предусматривается специальная система термостабилизации. Если предварительно описать зависимость изменения погрешностей прибора от температуры, например, с помощью полиномиальной модели, то в ряде случаев удается заметно снизить требования к дорогостоящей системе термостабилизации.

2.1.2. Задача выставки инерциальной навигационной системы, простейший случай.

Рассмотрим еще один пример линейной задачи оценивания. Известно, что, если пренебречь ошибками чувствительных элементов инерциальной навигационной системы (ИНС), погрешность выработки скорости для одного из каналов ИНС в простейшем случае может быть приближенно описана с помощью следующего выражения [2.12]

VE (t) = −α(0) gR sin ωшt + ∆VE (0) cos ωшt , i =

1.m

,

(2.1.6)

где α(0) , VE (0) - начальная ошибка определения построения вертикали (угла

между

истинной и вырабатываемой в ИНС плоскостями горизонта) и начальная ошибка скорости; g -

ускорение силы тяжести, R - радиус Земли; ωш = Rg - частота, соответствующая периоду

9

Шулера - Tш = 2π Rg 84 мин. Предположим, что объект, на котором установлена ИНС

неподвижен, т.е известно, что скорость нулевая. В этом случае вырабатываемые инерциальной системой показания скорости фактически будут представлять собой ошибку ИНС. Снимая эти показания в дискретные моменты времени, можем записать

y(ti ) = −α(0) gR sin ωшti + ∆VE (0) cos ωшti + vi ,

(2.1.7)

где vi - ошибки съема показаний. Используя набор измерений, можно оценить начальную ошибку построения вертикали и ошибку выработки скорости. По сути, это есть задача выставки ИНС в ее простейшем рассмотрении.

Вводя вектор оцениваемых параметров и матрицу H как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x = (α(0), VE

(0) ),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.1.8)

 

gR sin ω

ш

t ,

gR sin ω

ш

t

2

, . .

gR sin ω

ш

t

 

,(2.1.9)

H т =

cos ω

t

1

cos ω

 

t

 

. .

cos ω

 

t

 

m

 

 

,

 

ш

2

,

 

ш

m

 

 

 

 

 

ш 1

 

 

 

 

 

 

 

 

 

 

 

 

 

нетрудно и эти измерения представить в виде, аналогичном (2.1.2).

Если предположить, что задача решается на малом по сравнению с периодом Шулера

интервале времени, то,

раскладывая в ряд значения функций sin ωшti и cos ωшti , эту задачу легко

свести

 

в

задаче

оценивания

коэффициентов полинома. В частности, если считать, что

sin ω

t

i

2π

t

i

,

cos ω

t

i

1, при t

i

<<T , то измерения могут быть приближенно записаны с

 

 

ш

 

Tш

 

 

ш

 

 

ш

 

 

 

 

 

 

 

 

 

 

 

 

 

помощью полинома 1-ого порядка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y(ti ) ≈ −α(0) gR 2π ti + ∆VE (0) + νi = ∆VE (0) gα(0)ti + νi .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tш

Соцениванием коэффициентов полиномов второго и третьего порядка приходится иметь дело

ив задаче выработки так называемых динамических параметров, при решении которой погрешности ИНС по составляющим скорости и перемещения на интервале времени T приближенно описываются с помощью полиномиальных моделей [2.12, стр.255].

2.1.3 Постановка линейной задачи оценивания.

Все перечисленные выше задачи могут быть сведены к следующей общей постановке линейной задачи оценивания.

Задан постоянный n - мерный вектор x = (x1,...xn )т

 

x = 0

 

 

 

 

(2.1.10)

 

&

 

 

 

 

 

и имеется m -мерный вектор измерений y = ( y

1

,...y

m

)т , записываемый как

 

 

 

 

 

 

y = Hx + v ,

 

 

 

 

(2.1.11)

где H

- m × n - мерная матрица, а v = (v ,...v

m

)т m-мерный вектор, характеризующий ошибки

 

1

 

 

 

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]