- •Введение
- •1. Методы оптимизации
- •1.1. Экстремум функции одной переменной
- •1.2. Экстремум функции многих переменных
- •1.3. Относительный экстремум. Метод множителей Лагранжа
- •1.4.Задачи оптимизации при ограничениях в виде неравенств
- •2. Оптимальные системы управления
- •2.1 Метод множителей Лагранжа
- •Составляется функция Лагранжа
- •2.2. Принцип максимума Понтрягина
- •2.3. Метод динамического программирования
- •2.4 . Управляемость и наблюдаемость. Наблюдатели
- •2.5. Методы синтеза систем с обратной связью
2.2. Принцип максимума Понтрягина
Рассмотрим принцип максимума Понтрягина. При отсутствии фазового ограничения (3.4) и наличии ограничения на управлении в виде включения uU, где U – допустимое множество значений управления, можно сформулировать следующую задачу Лагранжа:
(3.14)
Составляется функция Лагранжа:
(3.15)
В соответствии с приемом Лагранжа задача (3.14) сводится к задаче
(3.15)
при тех же граничных условиях для x(t) из выражения (3.14). Ищется максимум функционала, хотя в исходной задаче функционалJ требуются минимизировать, так как в неособом случае принято, что множитель = -1.
Идея принципа максимума заключается в том, что решение одной задачи (3.15) сводится к решению двух задач:
(3.16)
(3.17)
при тех же граничных условиях, что в задаче (3.15).
Задача (3.15) простейшая задача вариационного исчисления. Для нее необходимые условия (уравнения Эйлера) имеют вид
(3.18)
В задаче (3.17) управление u*(t) доставляет максимум в том и только в том случае, если всюду на [t0, tf], кроме точек разрыва u*(t), выполнено равенство
(3.19)
П р и н ц и п м а к с и м у м а П о н т р я г и н а. Для того чтобы допустимая для задачи (3.14) пара (u*(t), x*(t)) была ее решением, необходимо, чтобы существовали константа 0* < 0 и решение *(t)= (1*, …, n*)T сопряженной системы (3.18) при x(t) = x*(t) и u(t) = u*(t), что при любом t [t0, t], кроме точек разрыва u*(t), функция H(x*, u, *, t) достигает при u(t) = u*(t) максимума, т.е. выполняется соотношение (3.19).
Принцип максимума Понтрягина применяется для синтеза оптимального программного управления в виде функции времени, т.е. для систем разомкнутого управления.
2.3. Метод динамического программирования
Метод динамического проектирования (ДП) позволяет проектировать замкнутые оптимальные системы. Основу динамического программирования как метода оптимизации составляют: 1) принцип оптимальности; 2) инвариантное погружение, т. е. включение исходной задачи в семейство аналогичных задач; 3) функциональное уравнение, полученное на основе принципа оптимальности и инвариантного погружения.
Основная идея метода состоит в том, что вместо решения исходной задачи ее включают в некоторое семейство задач оптимизации (инвариантное погружение). При этом может оказаться, между отдельными задачами существуют простые соотношения и среди задач семейства найдется такая, которая легко решается. Тогда используя решение последней и соотношения, связывающие отдельные задачи семейства, получаем решение исходной задачи.
Рассмотрим следующую задачу.
(3.20)
Принцип оптимальности для этой задачи формулируется так: для оптимальности допустимой для (3.20) пары (u(t), x(t)) необходимо, чтобы при любом t’[t0, tf] управление u*[t', tf] было оптимальным относительно состояния x*(t’), в котором окажется объект в момент t’при использовании на начальном отрезке времени t0 t < t’ управления u[t0, t’]. Это прямой принцип оптимальности. В обратном принципе оптимальности за первоначальный берется отрезок [t’, tf], а управление на отрезке [t0, t’] должно быть оптимальным относительно состояния x(t’).
Вводится функция Беллмана для задачи (3.20)
(3.21)
Для этой функции выполняется условие S(x(tf), tf) = g(x(tf), tf). Решение задачи (3.20) сводится к уравнению Беллмана
(3.21)
Эти уравнения дают необходимые условия минимума. Если правые части уравнений объекта и подынтегральное выражение в критерии оптимальности явно не зависят от времени, то S/dt = 0.
Достоинством метода динамического программирования является то, что этот метод позволяет находить оптимальное управление как функцию фазовых координат, т.е. позволяет решать задачу синтеза оптимального регулятора. В этом случае оптимальная система будет замкнутой. Недостатком метода является необходимость решения нелинейного уравнения в частных производных, что представляет большие трудности.