- •Методические указания
- •Методические указания
- •1. Разделы дисциплины и виды занятий (тематический план)
- •2. Содержание разделов дисциплины
- •Раздел 1. Теория вероятностей (12 часов).
- •Раздел 2. Элементы математической статистики (6 часов).
- •Раздел 3. Интегральные преобразования Фурье (4 часа).
- •Раздел 4. Уравнения математической физики (дополнительные главы) (6 часов).
- •Раздел 5. Вариационное исчисление и оптимальное управление (4 часов).
- •Раздел 6. Введение в дискретную математику.
- •4. Методические рекомендации по
- •5. Рекомендуемый перечень тем практических занятий
- •6. Календарный план чтения лекций
- •Стационарные случайные процессы
- •Марковские случайные процессы
- •Процесс Пуассона
- •Случайные процессы с независимыми приращениями
- •Тема 2 Понятие нелинейной регрессии
- •Контрольные вопросы и задания
- •Задачи и упражнения для самостоятельной работ
- •Тема 3 Статистическая проверка статистических гипотез
- •Тема 4 Решение неоднородных уравнений с частными производными гиперболического типа методом Фурье
- •Тема 5 Основы вычислительного эксперимента
- •Контрольные вопросы и задания
- •9. Обработка и интерпретация результатов.
- •Тема 7 Постановка задачи оптимального управления. Формулировка необходимого условия оптимального управления в форме принципа максимума Понтрягина
- •Заключение
- •Библиографический список
- •394026 Воронеж, Московский просп.,14
Тема 7 Постановка задачи оптимального управления. Формулировка необходимого условия оптимального управления в форме принципа максимума Понтрягина
[4] с. 70-91.
Контрольные вопросы и задания
Какими уравнениями описывается поведение фазовых координат?
Запишите краевые условия, которым удовлетворяют начальное и конечное состояния управляемого объекта.
Запишите изопериметрические ограничения.
В чем заключается задача оптимального управления?
Основные понятия
Допустим, что математическая модель некоторого процесса характеризуется зависящими от времени t фазовыми координатами x1(t)…xn(t), поведение которых описывается системой дифференциальных уравнений
dxi /dt=fi , (i=1,…n), (7.1)
где u1(t), … um(t) - параметры управления.
Будем считать, что допустимые управления u=(u1,…,um ) содержатся в некотором множестве U и в этом множестве существует управление u(0)={u1(0)(t),…,um(0) (t)} переводящее управляемый объект из начального состояния S0(t0,x1(0),…,xn(0)) в конечное S1(t1,x1(1),…,xn(1)). Пусть начальное и конечное состояния удовлетворяют краевым условиям:
Ψj(t0,x1(t0),…,xn(t0);t1,x1(t1),…,xn(t1))≤0, (j=1,…k), (7.2)
фазовые координаты x1(t),…,xn(t) и управление
(u1,…,um) подчинены изопериметрическим ограничениям:
(s=1,…l), (7.3)
Предположим также, что функционал
J(x,u,t0,t1)= (7.4)
выражает некоторую характеристику процесса, которую условно рассматривают как цель, цену или качество процесса.
Задача оптимального управления заключается в отыскании во
множестве U такого управления u*={u1*(t),…,um* (t)}, которое осуществляет переход управляемого объекта, поведение которого описывается системой (7.1) из состояния S0 в состояние S1, при выполнении краевых условий (7.2) и изопериметрических ограничений (3) таким образом, чтобы функционал (7.4) достигал экстремального значения (для определенности, в дальнейшем будем говорить о минимуме функционала (7.4)).
Четверку величин x,u,t0,t1 называют управляемыми
процессом в задаче оптимального управления (7.1)-(7.4), если:
а) управление u(t) - кусочно-непрерывная функция на
отрезке [t0,t1 ], содержащаяся во множестве U ;
б) фазовая траектория x(t) непрерывна на отрезке [t0,t1],
в) для всех t кроме, быть может, точек разрыва
управления u(t), функции x1(t),…,xn(t) удовлетворяют системе уравнений (7.1).
Управляемый процесс называется допустимым, если удовлетворяются условия (7.2)-(7.3). Допустимый управляемый процесс (x*(t),u*(t),t*0,t*1) называется оптимальным, если найдется такое ε > 0, что для всякого допустимого управляемого процесса (x(t),u(t),t0,t1) такого, что ,
при t выполняется неравенство J(x,u,t0,t1)
Необходимые условия экстремума задачи оптимального
управления, позволяющие определить оптимальный управляемый процесс, если он существует, получены А. С. Понтрягиным
и имеют название принципа максимума Понтрягина. Для фор-
мулировки этого принципа предположим. что λ=(λ0,…,,λl) и μ=(μ0,…,μk), где λ0=μ0 , некоторые постоянные векторы, a w(t) = (w1(f),..., wn(t)) - кусочно-гладкая на [t0,t1],вектор-функция. Введем функции Лагранжа:
Ф(t,x,x/,u)=λ0F+ +
Ψ(t0,x(t0),t1,x(t1))= и функционал
J(x,u,t0,t1)= (7.5)
и пусть существует оптимальный управляемый процесс
(x*(t),u*(t),t*0,t*1). Для произвольной функции H(x,u,t0,t1) обозначим H*(t)=H(x*(t),u*(t),t*0,t*1) . Имеет место
Принцип максимума Понтрягина. Если (x*(t),u*(t),t*0,t*1) - оптимальный процесс для задачи (7.1)-(7.4), то найдутся множители λ, μ,w(t), неравные одновременно нулю и такие, что для функционала (7.5) выполняются:
уравнения Эйлера:
(i=1,…n);
условия трансверсальности по хi:
, (i=1,…,n);
условия трансверсальности по t:
принцип максимума по и:
условия согласованности знаков в соотношениях (7.2) и (7.3): если при некотором j в соотношении (7.2) (или при некотором s в соотношении (7.3)} стоит знак "<", то соответствующие λj=μs , >0; при тех j и s,y которых в соотношениях (7.2) и (7.3) стоят знаки равенства, знаки λj и μs могут быть произвольными;
условия дополняющей жесткости:
λs( ,(s=1,…,l); =0 (j=1,…k);
Замечание. При рассмотрении многих задач полезно применять функцию Понтрягина:
Форма контроля: устный опрос.