Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дегтярёв Оптимальное управление

.pdf
Скачиваний:
63
Добавлен:
22.03.2016
Размер:
1.68 Mб
Скачать

1

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Казанский национальный исследовательский технический университет им. А.Н.Туполева-КАИ»

(КНИТУ-КАИ)

Г.Л.Дегтярёв

Оптимальное управление

(Учебное пособие)

Казань 2014

2

Теория оптимального управления

Литература

1.Эльсгольц «Вариационное исчисление».

2.Сиразетдинов Т.К. «Оптимизационные задачи авиационной техники».

3.Сиразетдинов Т.К. «Основы теории оптимальных процессов».

4.Дегтярев Г.Л., Семенов П.К. «Оптимальное управление стохастическими системами при неполной информации».

5.Брайсон, Хо-Ю-ШИ «Прикладная теория оптимального управления».

6.Дегтярев Г.Л., Ризаев И.С. «Синтез локально-оптимальных алгоритмов управления ЛА».

7.Ройтенберг Я.И. Автоматическое управление.

1.Математическая постановка задач оптимального управления.

Предположим, что управляемый процесс описывается совокупностью

дифференциальных уравнений

 

 

dy

f ( y, u, t)

(1.1)

 

 

 

 

 

dt

 

 

с начальными условиями

 

 

 

 

y (t0 ) y0

(1.2)

Здесь: f ( )

- n - мерная функция своих аргументов,

 

y (t)

- n- мерный вектор, характеризующий

состояние

управляемого процесса в момент времени t ,

 

u (t)

- r - мерный вектор управляющих воздействий (из некоторого

заданного класса функций), t

- время,

 

y0 - начальное состояние.

 

Если управление u (t)

на отрезке [t0 , t1] , где t1 - конечное время

управления, задано (u (t) u1(t)) , можно построить соответствующее ему решение системы (1.1), (1.2) y1 (t) .

 

 

3

u(t)

 

y(t)

 

u2(t)

y2(t)

 

 

 

 

u1(t)

 

 

 

y1(t)

 

 

 

 

 

 

 

 

 

 

t0

 

t0

t1

 

t1

 

 

 

 

Рис. 1

 

Другому управлению u u2 (t) будет соответствовать другая траектория y2 (t) .

Как известно, задача синтеза управления заключается в построении таких управляющих воздействий, при которых выполняется совокупность ограничений на состояние процесса, например, по времени переходного процесса, по величине максимального перерегулирования и т.п.

Задача же оптимального управления заключается в отыскании таких управляющих воздействий, при которых управляемый процесс будет наилучшим в некотором смысле. При этом для оценки качества управляемого движения вводится функционал J[ y, u] .

Понятие функционала

Известно, что если каждому значению переменной t соответствует определенное значение переменной y , то говорят, что задана функция y(t) .

Если каждой функции y(t) можно поставить в соответствие некоторое числовое значение переменной J , то говорят, что задан функционал J [ y(t)] на множестве реализаций функции y(t) . Таким образом, областью определения функционала является множество функций.

Примерами функционала может быть длина кривой y(t) , соединяющей две точки A( y0 t0 ) и B( y1 t1) на плоскости

 

4

 

 

 

y

 

 

 

 

y1

B(y1t1)

 

 

 

 

 

A(y0t0)

 

 

 

 

y0

 

 

 

 

t0

t1

 

 

 

Рис. 2

 

 

 

 

t1

dy

 

2

 

 

 

dt J [ y(t)],

1

 

 

tq

dt

 

 

 

 

 

 

 

или площадь S , ограниченная кривой y(t)

 

 

 

t1

S y (t) dt J [ y(t)].

t0

Вкачестве функционала может быть расход топлива, необходимый для перелета самолета из пункта A в пункт B . Величина этого расхода будет зависеть от выбранной траектории полета.

Вкачестве функционала может рассматриваться значение функции в

некоторой точке t* , т.е.

J [ y(t)] y (t* ) .

В качестве такой точки t* может быть конечная точка t1 , т.е.

J [ y(t)] y (t1) или некоторая функция G конечного состояния, т.е.

J [ y(t)] G( y (t1)) .

Различают следующие виды функционалов.

1) Функционал Лагранжа

t1

 

J [ y(t),u(t)] F (y (t),u(t),t) dt ,

(1.3)

t0

 

где F - некоторая достаточно-гладкая функция своих аргументов,

свойства

которой оговариваются в конкретном случае.

 

5

2)

Функционал Майера

 

 

J [ y(t),u(t)] G( y (t1))

(1.4)

3)

Функционал Больца

 

 

t1

 

 

J [ y(t)] F (y (t),u(t) dt G ( y(t1))

(1.5)

t0

Всмысловом плане эти функционалы различаются, но с точки зрения математической принципиальной разницы нет, т.к. от одной формы представления функционала можно перейти к другой.

Например, путем введения переменной

 

t

 

 

 

 

y1(t) F (y (t'),u(t),t') dt'

t0 t' t

 

 

t0

 

 

 

 

функционал Лагранжа

 

 

 

 

 

 

t1

 

 

 

J [ y] F (y (t),u(t),t) dt

 

 

 

 

 

t0

 

 

можно представить в форме Майера

 

 

 

 

J [ y(t)] y1 (t1) ,

 

 

где y(t) и y1(t) связаны уравнением

 

 

 

d y1(t)

F ( y(t),u(t),t), y1

(t0 ) 0 .

 

 

dt

 

 

 

 

 

 

4) Локальный

функционал.

Рассмотренные

функционалы

характеризуют качество управляемого процесса на конечном (или бесконечном) интервале времени. Однако часто бывает необходимо, чтобы поведение системы было оптимальным в некотором смысле в любой текущий момент времени. К таким требованиям относится, например, требование максимальной текущей точности функционирования системы. В этом случае критерием оптимальности служит некоторый функционал (функция)

J (t) J[ y(t),u(t),t], параметрически зависящий от времени t , определенный на

6

 

 

множестве функций y(t) и (t) . Общий вид

такого функционала можно

представить в следующем виде

 

 

t

 

 

J (t) F (y ( ),u( ), )d G( y(t),u(t),t)

t0 t.

(1.6)

t0

 

 

Управление u(t) , минимизирующее J (t) в текущий момент времени,

называется локально-оптимальным.

Теперь задача оптимального управления может быть сформулирована как

задача поиска такой управляющей функции u(t) и соответствующей

траектории y(t) , удовлетворяющей системе (1.1), (1.2), на которых некоторый функционал J [ y(t), u(t)] достигает минимального или максимального значения.

При этом каждый раз оговаривается класс функций, среди которых

отыскивается минимум или максимум (класс функций сравнения).

Это может быть класс непрерывных, кусочно-непрерывных или непрерывно-дифференцируемых определенное число раз функций. Свойства любого функционала существенно зависят от того, на каком классе функций он

задан.

В том случае, когда функция u(t) u - не зависит от времени (постоянна),

функционал становится функцией этого параметра и задача оптимизации

сводится к задаче минимизации (максимизации) функции.

Пример 1. Понятие оптимальной ширины полосы пропускания системы.

Рассмотрим систему, где

v(p)

 

 

 

 

u( p),v( p), y( p), E( p) - изображения

 

 

 

u(p)

W(p)

y(p)

(по Лапласу) задающего воздействия

 

 

 

u(t) , помехи

v(t) , выходной

 

 

переменной y(t)

и ошибки системы

Рис. 3

 

E(t) u(t) y(t), соответственно,

7

w( p) - передаточная функция разомкнутой системы.

Учитывая, что y( p) ( p) (u( p) v( p)), где ( p) - передаточная

функция замкнутой системы, получим

E( p) ( p)[u( p) v( p)] u( p) [1 ( p)]u( p) ( p)v( p) .

Предположим, что u(t) и v(t) - независимые стационарные случайные

процессы с известными спектральными плотностями (плотностями

распределения дисперсии по частотам) Su ( ), Sv ( ) .

Тогда

спектральная

плотность ошибки системы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S ( )

 

1 ( j

 

2 Su ( )

 

 

( j

 

2

Sv ( ) , где ( j )

- частотная функция

 

 

 

 

 

 

 

 

замкнутой системы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф( j )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

jo

если

0 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть ( j )

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

если

0 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( j )

 

1

если

0

0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т.е. АЧХ системы

 

 

0 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

если

 

 

 

 

 

 

 

0

 

 

Здесь 0

- характеризует ширину полосы

 

 

 

 

 

 

 

 

 

 

 

пропускания системы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда дисперсия ошибки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

D S ( ) d Su ( ) d Sv ( ) d Du ( 0 ) Dv ( 0 )

 

 

 

 

 

 

 

 

 

0

 

 

0

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

при заданных Su ( ), Sv ( )

является функцией 0 , причем, с увеличением 0

Du

(

0

) уменьшается, а Dv

(

0

)

увеличивается, т.е. с увеличением

0

лучше

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отрабатывается полезный сигнал, но увеличивается влияние помехи. Поэтому может быть поставлена задача определения такой 0 , при которой дисперсия ошибки является минимальной. Используя необходимые условия экстремума

d DE ( 0 ) d 0 0 ,

получим уравнение, которому с необходимостью удовлетворяет искомая оптимальная ширина полосы пропускания системы opt0

 

 

 

 

 

 

8

 

 

 

 

S

( opt ) S

v

( opt ) 0 .

 

(1.7)

 

 

 

0

 

0

 

 

Последнее

может

быть

 

решено

 

Sv ( )

графически.

 

 

 

 

 

S( )

 

 

 

 

 

 

 

Так как уравнение (1.7) – нелинейное,

 

 

оно может иметь несколько решений,

 

Su ( )

 

 

каждое

из

которых

должно

 

быть

 

 

дополнительно

исследовано

и

найдено

0opt

 

 

 

действительно оптимальное.

 

 

 

 

Рис. 4

 

 

 

 

 

Методы решения задач оптимального управления

Теоретической основой решения задач оптимального управления являются:

1)вариационное исчисление,

2)принцип максимума Понтрягина,

3)метод динамического программирования Беллмана.

В том случае, когда задача оптимального управления сводится к параметрической оптимизации для поиска оптимальных параметров,

используются методы минимизации функций.

2. Основы вариационного исчисления

2.1. Вводные замечания.

В вариационном исчислении нет деления функций на управляющие и

функции состояния. Вводится семейство функций из определенного класса. Это

могут быть кусочно-непрерывные, непрерывные, непрерывно-

дифференцируемые конечное число раз функции, определенные на отрезке

[t0 ,t1] . На множестве этих функций определяется функционал J [ y(t)].

Для определенности будем предполагать, что функционал J [ y(t)] задан в форме Лагранжа, а подынтегральная функция содержит, кроме функций y(t) , и

их производные, т.е. F F ( y(t), y'(t),t)

( y'(t) dy

) .

 

dt

 

 

9

 

Функция

y0 (t) доставляет минимум функционалу J [ y(t)], если

для

любой другой функции y(t) выполняется неравенство

 

 

J [ y0 (t)] J [ y(t)].

 

Если выполняются неравенство противоположного знака,

y0 (t)

доставляет максимум функционалу J [ y(t)].

 

Функция

y0 (t) , доставляющая минимум или максимум (экстремум)

функционалу J [ y(t)], называется экстремалью.

 

Следует отметить, что минимум или максимум функционала может отыскивается среди всех кривых сравнения из некоторой области или среди,

так называемых, близких кривых сравнения.

Если минимум (максимум) достигается среди близких кривых сравнения,

он называется относительным. Если же он отыскивается среди всех кривых сравнения, то – абсолютным. При этом мера близости для разных классов

функций сравнения задается по-разному.

Мерой близости двух непрерывных или кусочно-непрерывных кривых

y0 (t) и y1(t) на отрезке [t0 , t1 ]может быть величина

0

max

 

y1 (t) y0 (t)

 

t [t0 ,t1 ]

(1.7)

 

 

 

t

 

 

 

 

 

Такая мера называется расстоянием нулевого порядка. Если 0 , где

-достаточное малое положительное число, то говорят, что y1(t) находится в

-окрестности функции y0 (t) . Расстоянием первого порядка между двумя непрерывно-дифференцируемыми функциями y0 (t) и y1(t) на отрезке [t0 ,t1]

называется величина

 

max[

 

y (t) y

0

(t)

 

,

 

y'

(t) y'

(t)

 

], y'(t)

dy

,

 

 

 

 

 

 

 

 

 

 

 

1

t

 

1

 

 

 

 

1

0

 

 

 

d t

(1.8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t [t0 ,t1].

Понятно, что из близости функций по мере 1 следует их близость и по мере 0 . Обратное же не имеет место.

10

Если - окрестность определяется мерой 0 ( 0 ), то говорят о сильной - окрестности, если же – мерой 1 ( 1 ) - слабой - окрестности.

Аналогично могут быть введенные понятия расстояний более высокого порядка.

2.2. Необходимое условие относительного экстремума.

Обозначим через y(t) искомую экстремаль. Тогда любую другую

функцию из рассматриваемого класса можно представить в виде y(t) y(t) ,

где y(t) - вариация функции. При этом, если y(t) является малой в смысле некоторой меры, то говорят о близких кривых сравнения.

Понятно, что

J [ y(t)] min J [ y(t) y(t)],

y(t)

тогда условия

J J [ y(t) y(t)] J [ y(t)] 0,

(1.9)

J J [ y(t) y(t)] J [ y(t)] 0

будут необходимыми и достаточными условиями минимума и максимума,

соответственно.

Однако, эти условия не конструктивны. Для получения более эффективных условий вводится понятие первой вариации функционала. Для

этого представим приращение функционала J в виде

 

 

 

J J [ y(t) y(t)] J [ y(t)] J 0( y) ,

 

(1.10)

где J

- линейная относительно y

часть

приращения, 0( y)

содержит

величины более высокого порядка малости, чем y , т.е. lim 0( y)

y

0 при

 

 

 

 

 

y 0 .

 

 

 

 

 

Тогда при достаточно малых

y

знак приращения

J будет

определяться знаком первой вариации y .

Из выражения (1.10) следует, что необходимым условием минимума или максимума (экстремума) функционала является условие