Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория оптимизац_Конспект лекций_2012.doc
Скачиваний:
104
Добавлен:
17.03.2015
Размер:
536.58 Кб
Скачать

2.2. Принцип максимума Понтрягина

Рассмотрим принцип максимума Понтрягина. При отсутствии фазового ограничения (3.4) и наличии ограничения на управлении в виде включения uU, где U – допустимое множество значений управления, можно сформулировать следующую задачу Лагранжа:

(3.14)

Составляется функция Лагранжа:

(3.15)

В соответствии с приемом Лагранжа задача (3.14) сводится к задаче

(3.15)

при тех же граничных условиях для x(t) из выражения (3.14). Ищется максимум функционала, хотя в исходной задаче функционалJ требуются минимизировать, так как в неособом случае принято, что множитель = -1.

Идея принципа максимума заключается в том, что решение одной задачи (3.15) сводится к решению двух задач:

(3.16)

(3.17)

при тех же граничных условиях, что в задаче (3.15).

Задача (3.15) простейшая задача вариационного исчисления. Для нее необходимые условия (уравнения Эйлера) имеют вид

(3.18)

В задаче (3.17) управление u*(t) доставляет максимум в том и только в том случае, если всюду на [t0, tf], кроме точек разрыва u*(t), выполнено равенство

(3.19)

П р и н ц и п м а к с и м у м а П о н т р я г и н а. Для того чтобы допустимая для задачи (3.14) пара (u*(t), x*(t)) была ее решением, необходимо, чтобы существовали константа 0* < 0 и решение *(t)= (1*, …, n*)T сопряженной системы (3.18) при x(t) = x*(t) и u(t) = u*(t), что при любом t  [t0, t], кроме точек разрыва u*(t), функция H(x*, u, *, t) достигает при u(t) = u*(t) максимума, т.е. выполняется соотношение (3.19).

Принцип максимума Понтрягина применяется для синтеза оптимального программного управления в виде функции времени, т.е. для систем разомкнутого управления.

2.3. Метод динамического программирования

Метод динамического проектирования (ДП) позволяет проектировать замкнутые оптимальные системы. Основу динамического программирования как метода оптимизации составляют: 1) принцип оптимальности; 2) инвариантное погружение, т. е. включение исходной задачи в семейство аналогичных задач; 3) функциональное уравнение, полученное на основе принципа оптимальности и инвариантного погружения.

Основная идея метода состоит в том, что вместо решения исходной задачи ее включают в некоторое семейство задач оптимизации (инвариантное погружение). При этом может оказаться, между отдельными задачами существуют простые соотношения и среди задач семейства найдется такая, которая легко решается. Тогда используя решение последней и соотношения, связывающие отдельные задачи семейства, получаем решение исходной задачи.

Рассмотрим следующую задачу.

(3.20)

Принцип оптимальности для этой задачи формулируется так: для оптимальности допустимой для (3.20) пары (u(t), x(t)) необходимо, чтобы при любом t[t0, tf] управление u*[t', tf] было оптимальным относительно состояния x*(t), в котором окажется объект в момент tпри использовании на начальном отрезке времени t0 t < t управления u[t0, t]. Это прямой принцип оптимальности. В обратном принципе оптимальности за первоначальный берется отрезок [t, tf], а управление на отрезке [t0, t] должно быть оптимальным относительно состояния x(t).

Вводится функция Беллмана для задачи (3.20)

(3.21)

Для этой функции выполняется условие S(x(tf), tf) = g(x(tf), tf). Решение задачи (3.20) сводится к уравнению Беллмана

(3.21)

Эти уравнения дают необходимые условия минимума. Если правые части уравнений объекта и подынтегральное выражение в критерии оптимальности явно не зависят от времени, то S/dt = 0.

Достоинством метода динамического программирования является то, что этот метод позволяет находить оптимальное управление как функцию фазовых координат, т.е. позволяет решать задачу синтеза оптимального регулятора. В этом случае оптимальная система будет замкнутой. Недостатком метода является необходимость решения нелинейного уравнения в частных производных, что представляет большие трудности.