Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТОАУ.docx
Скачиваний:
51
Добавлен:
21.12.2018
Размер:
1.32 Mб
Скачать

1.3.2. Система сопряженных уравнений

Чтобы воспользоваться принципом максимума (1.86), необходимо определить вектор ; он до сих пор не известен, хотя все предыдущие выводы основывались на его существовании. Продифференцировав (1.83) по времени , запишем

(1.87)

Компоненты вектора являются бесконечно малыми, так как порождены игольчатой вариацией, существующей на бесконечно малом интервале времени. Найдем уравнение, которое их описывает. За основу принимаем уравнение объекта (1.75) и предполагаем, что переменные при всех изменились на бесконечно малые величины . Допуская дифференцируемость функции по аргументу , из (1.75) в результате стандартной процедуры линеаризации, основанной на разложении нелинейных функций в ограниченный линейными членами ряд Тейлора, получаем уравнения в вариациях

(1.88)

где производная от вектора по вектору понимается как матрица вида

Учтем (1.88) в составе (1.87), тогда

Произведение сомножителей в левой части этого соотношения должно равняться нулю при любых функциях и всех . Это возможно, если первый сомножитель равен нулю, т.е.

(1.89)

или в скалярной форме

(1.90)

Уравнения (1.89) или (1.90) образуют линейную систему, позволяющую при граничных условиях (1.81) совместно с уравнениями (1.75) и (1.86) отыскать функции участвующие в формировании функции Гамильтона. Система (1.89) или (1.90) называется сопряженной по отношению к системе уравнений объекта (1.75). Обе системы часто объединяют общей формой записи, основанной на введенной функции Гамильтона (1.85). Из сопо­ставления соотношений (1.75), (1.85) и (1.89) нетрудно установить

или в скалярной форме

Эти соотношения называют каноническими уравнениями Гамильтона.

Оптимальное управление ищут при совместном решении уравнений (1.75), (1.86) и (1.90), содержащих неизвестных и . Соотношения (1.75) и (1.90) образуют систему из дифференциальных уравнений, решения которых зависят от такого же числа постоянных интегрирования. Для их определения мы располагаем начальными условиями (1.76) и конечными условиями (1.81). Условие (1.86) не приводит к дифференциальным уравнениям, поэтому располагаем всеми данными, достаточными для определения оптимального управления из условия совместного выполнения соотношений (1.75), (1.86) и (1.90).

1.3.3. Обобщения. Обсуждение результатов

Принцип максимума обобщается на другие варианты задачи оптимального управления. Приведем некоторые из этих обобщений.

Неавтономный объект с закрепленными концами траектории и фиксированным временем управления

Чтобы управление было оптимальным для , необходимо существование такой ненулевой непрерывной вектор функции , соответствующей функциям и сопряженной системе (1.89), чтобы при любом : 1) функция , определяемая соотношением (1.85), достигала максимума по управлению ; 2) .

Система (1.90) должна решаться при таких начальных условиях , при которых траектория объекта , найденная из решения системы (1.75) при начальных условиях и соответствующем условию (1.86) оптимальном управлении, пройдет через граничную точку . Эти начальные условия находят путем последовательных приближений в соответствии со специально разрабатываемыми вычислительными схемами. Смысл соответствующих операций сводится к следующему. Для решения системы (1.75) и (1.90), состоящей из дифференциальных уравнений, необходимо иметь начальных условий. Одна половина условий определена заданным начальным состоя­нием объекта , другая половина зависит от начально­го значения вектора . Если этим значением задаться произвольно и решить совместно (1.75), (1.90) и (1.86), то траектория не пройдет через точку . Начальные условия нужно изменить так, чтобы после повторения всех вычислений траектория прошла через заданную граничную точку.