Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТОАУ.docx
Скачиваний:
51
Добавлен:
21.12.2018
Размер:
1.32 Mб
Скачать

1.3. Принцип максимума понтрягина

1.3.1. Игольчатая вариация и условия оптимальности

Одним из основных методов решения задач оптимального управления является принцип максимума, разработанный у нас в стране группой ученых под руководством акад. JI. С. Понтрягина [31]. Рассмотрим существо мето­да применительно к задаче (1.44) — (1.46).

Для доказательства принципа максимума удобно ввести ряд дополнительных переменных: прежде всего определяемую уравнением

(1.70)

из которого следует, что далее , подчиненную уравнению

(1.71)

Из (1.71) следует, что

(1.72)

С использованием этих введений задачу оптимального управления удобно сформулировать в новых терминах. С этой целью образуем - мерный вектор — модифицированный вектор состояния

(1.73)

и - мерный вектор-функцию

(1.74)

Теперь представим, что существует некоторый гипотетический объект управления, состояние которого характеризуется вектором (1.73). Для этого объекта на основании (1.44), (1.70), (1.71) имеем уравнение

(1.75)

подчиненное начальному условию

(1.76)

Качество управления объектом характеризуется в соответствии с (1.72) величиной . Требуется в классе допустимых управлений найти такое, при котором траектория движения объекта пройдет через начальную точку, а нулевая компонента вектора состояния в момент примет наименьшее значение, т. е.

(1.77)

С целью упрощения математических выкладок рассмотрим случай одномерного управления, т. е. положим . Пусть оптимальное управление и соответствующее ему решение уравнения (1.75) при начальных условиях (1.76) найдены. Обозначим их символами . На рис. 1.3 изображен возможный вид оптимального управления, принадлежащего классу кусочно-непрерывных функций. Так же как при выводе уравнения Эйлера, проварьируем оптимальное управление. Вариация должна принадлежать тому же классу, которому принадлежит управление, чтобы проварьированное управление являлось кусочно-непрерывным с разрывами первого рода. В принципе максимума варьиро­вание осуществляется на бесконечно малом интервале времени и вариация представляет импульс бесконечно малой длительности , значение которого может быть любым, но не должно выводить проварьированное управление за область существующих ограничений. Подобная вариация называется игольчатой. Ее введение приводит к управлению , совпадающему на интервалах с оптимальным и лишь на интервале отличающемуся от оптимального на величину игольчатой вариации.

Рассмотрим траектории движения объекта при оптимальном и неоптимальном управлениях (рис. 1.4). До момента они совпадают. Различие между и , проявляющееся при порождает соответствующее различие в траекториях при . Обозначим через обусловленное игольчатой вариацией отклонение оптимальной траектории от неоптимальной, т. е.

(1.78)

где — вектор, имеющий компоненты .

На участке траектории можно считать линейными в силу малости в, поэтому с учетом уравнения объекта (1.75)

(1.79)

Из всех составляющих вектора для решения за­дачи наиболее интересна функция , которая по определению при представляет отклонение минимально возможного значения функционала , достигаемого на оптимальном управлении , от его значения на неоптимальном управлении , отличающемся от оптимального игольчатой вариацией.

Сосредоточим внимание на поиске оптимального управления в момент . Управление будет оптимальным, если величина достигает минимума за счет выбора управления :

(1.80)

При доказательстве принципа максимума традиционно принято условие (1.80) переписывать в виде

Это условие удобно еще раз переписать, введя в рассмотрение -мерный вектор

(1.81)

позволяющий представить , поэтому условие отыскания оптимального управления в момент окончательно приобретает форму

(1.82)

Для отыскания управления в соответствии с этим усло­вием необходимо знать зависимость от . Для этого в свою очередь следует иметь функцию . Но установить зависимость от очень сложно, поэтому последующее решение задачи строится по такой схеме. Предположим, что можно найти вектор-функцию , удовлетворяющую равенству

(1.83)

Так как это соотношение выполняется при всех , то условие (1.82) можно заменить эквивалентным

(1.84)

Но функция определена по (1.79). Следовательно, предположение о существовании функции со свойством (1.83) позволяет воспользоваться условием (1.84), непосредственно содержащим управление с учетом (1.79). Объединяя (1.84) и (1.79) и опуская сомножитель , не зависящий от , получаем следующее условие поиска оптимального управления:

Так как принимает любые значения в интервале , то аргумент можем заменить текущим временем , записав

Второе слагаемое слева относится к оптимальному управлению и, следовательно, не зависит от неопти­мального управления . Поэтому выбор влияет лишь на первое слагаемое, и управление нужно назначить таким, чтобы именно это слагаемое достигало наи­большего значения. Последнее соотношение переписываем так:

Введем стандартное для принципа максимума обозначение

(1.85)

где — компоненты векторов .

Функцию называют функцией Гамильтона или гамильтонианом. В результате проведенных рассуждений приходим к следующему утверждению, называемому принципом максимума Понтрягина:

для того чтобы в задаче с закрепленным левым концом траектории, фиксированным временем управления , и свободным правым концом траектории управление было оптимальным для , необходимо существование такой ненулевой непрерывной вектор функции , чтобы при любом функция , представляющая скалярное произведение вектора скорости изображающей точки на вектор , достигала максимума по , т. е необходимо выполнение условия

(1.86)

в конечный момент времени имеет место соотношение

Обратим внимание на то, что при решении задачи в соответствии с принципом максимума получаем оптимальное управление как функцию времени , т. е. в виде , и оптимальная система оказывается разомкнутой. Для перехода к замкнутой системе, что эквивалентно переходу от к , необходимо преодолеть ряд дополнительных трудностей. В случае многомерного управления в установленных соотношениях скалярных надлежит заменить вектором .