Rozova_Maximova
.pdfБудем говорить, что управление u(t) переводит систему (9.1) из положения x0 в положение x1, если решение x(t)=x(t,x0,t0,u), соответствующее этому u(t), таково, что
x(t1)=x(t1,x0,t0,u)=x1.
Постановка задачи оптимального управления.
Требуется среди допустимых функций u(t) найти такое управление и соответствующую ему траекторию, которое переводит объект из состояния x0 в момент времени t0 в состояние x1 в момент времени t1 так, чтобы I принимал минимальное значение. Управление u(t), решающее эту задачу, называется оптимальным. Оптимальное управление u(t) и соответствующая ему траектория x(t) называются оптималь-
ной парой (x(t),u(t)).
Если f0(x,u)=1, то функционал принимает вид I=t1–t0.
Такая задача называется задачей оптимального быстродействия.
9.2. Линейная задача оптимального быстродействия
Пусть система (9.1) имеет вид: |
(9.2) |
x = Ax + Bu , |
|
|
|
x(t0)=x0, x(t1)=x1,
I=t1–t0→min.
A= const – матрица размера n×n, B = const – матрица размера
n×r, x=x1,…,xn, u=u1,…,ur.
Система (9.2) линейна по x и по u.
Пример. Управляемое движение математического маятника под действием ограниченной внешней силы (трение не учитывается).
91
Движение происходит вдоль оси Oy, в состоянии покоя шарик находится в точке O. Движение происходит под действием силы f(t) вдоль оси Oy. По закону Ньютона,
my = −ky + f (t)
(упругая сила пропорциональна отклонению от положения равновесия).
Тогда my = −ky + f (t), k > 0 , где k – жесткость пружины. Полагая ω 2 = mk и v(t) = fm(t) , получим
y + ω 2 y = v(t) .
Рассмотрим задачу об успокоении маятника под действием ограниченной внешней силы v(t) за минимальное время. Пусть заданы
y(0)=a, y(0) = b, v(t) ≤ 1.
Положим |
y = x1 , y = x2 , |
|
v = u2 . |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Получим |
|
|
|
|
= x2 , |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
x1 |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
= −ω |
2 |
x1 |
+ u2 . |
|
|
|
|
|
|||||
|
|
x2 |
|
|
|
|
|
|
|
||||||||
u1 |
|
0 |
|
|
u |
|
≤ 1 |
, M |
|
a |
|
|
0 |
||||
|
|
|
|
||||||||||||||
u = |
|
= |
, |
|
|
|
= |
, M |
|
= |
|
. |
|||||
|
|
|
|
|
|
2 |
|
|
|
|
0 |
|
|
1 |
|
0 |
|
u2 |
|
u2 |
|
|
|
|
|
|
|
|
b |
|
|
|
Получили стандартную задачу линейного быстродействия.
Приведем без доказательства следующие теоремы, которые являются необходимыми условиями оптимальности в задаче (9.1).
92
9.3. Принцип максимума Понтрягина
Теорема 1 (принцип максимума Понтрягина).
Пусть
x = f (x, u), f1 ,..., fn , u = u1 ,..., ur x=x1,…,xn |
(9.3) |
x(t0)=x0,, x(t1)=x1.
Рассмотрим пару (x(t),u(t)), t [t0,t1], переводящую объект из
x0 в x1, т.е. x(t, x0 , t0 , u) t =t1 = x1 .
Рассмотрим также функцию:
n |
|
|
∂H |
|
H(ψ,x,u)= ψ i fi (x, u) , где ψ i = − |
∂xi |
. (9.4) |
||
i=0 |
∂fi |
|
|
|
|
|
|
|
|
n |
|
|
|
|
ψ=ψ0,ψ1,…,ψn, ψ j = − |
|
ψ i . |
|
|
∂x j |
|
|
||
i=0 |
|
|
|
Для оптимальности процесса (x(t),u(t)) необходимо сущест-
вование ψ(t)≠0 на [t0,t1] такого, что для почти всех t выполнено
1. H (ψ (t), x(t), u(t)) = max H (ψ , x, u) = M (ψ , x) , |
(9.5) |
u U
2. в конечный момент t = t1 выполнены соотношения
ψ0(t1)≤0 и M(ψ(t1),x(t1))=0.
Теорема 2. Если функции u(t) и x(t), ψ(t), t0≤ t ≤t1
удовлетворяют соотношениям (9.3), (9.4), и (9.5), то функция
H(t)=H(ψ(t),x(t),u(t)) =const при t [t0,t1].
Замечание. Если система, описывающая поведение объекта, линейна, то принцип максимума, сформулированный в виде теоремы I, остается, естественно, в силе. Функция
H(t)=H(ψ(t),x(t),u(t)) для задачи оптимального быстродей-
ствия имеет вид:
H(t)=H(ψ(t),x(t),u(t))=(ψ,Ax)+(ψ,Bu), где
ψ = − ATψ , ψ≠0.
93
Согласно принципу максимума, операция нахождения мак-
симума max H (ψ , x, u) почти для каждого t [t0,t1] сводится
u U
к нахождению максимума max(ψ , Bu) . Поэтому в задаче оп-
u U
тимального быстродействия рассматривается
H(ψ,x,u)= (ψ,Bu).
Рассмотрим задачу оптимального быстродействия
для системы:
x = Ax + Bu , где
A=const – матрица размера (n×n), B=const – матрица размера
(n×r), x(t0)=x0,, x(t1)=0.
Допустимыми являются управления, удовлетворяющие условиям:
I.u(t) – кусочно-непрерывные;
II.Значения u(t) принадлежат выпуклому многогран-
нику Ω Rr.
Задача: требуется найти допустимые управления u: I=t1–t0→min.
Опр. 1. Под выпуклым многогранником (в случае r- мерного пространства) понимается пересечение конечного числа полупространств, если оно является ограниченным множеством.
Опр. 2. Множество называется выпуклым, если с каждыми двумя точками оно содержит весь отрезок, их соединяющий.
Теорема 3. У любого выпуклого многогранника есть несущая k-мерная гиперплоскость, k≤ n.
94
Теорема 4. Граница любого k–мерного многогранника состоит из конечного числа k-1 мерных многогранников, которые называются гранями.
Лемма I. Пусть u(t) – произвольное допустимое управление, t [t0,t1], а x(t)=x(t,x0,t0,u). Пусть ψ(t)≠0 произ-
вольное решение системы ψ = − ATψ . Тогда во всех точках непрерывности u(t) выполнено соотношение:
dtd (ψ (t), x(t)) = (ψ (t), Bu)
и, следовательно,
t1
(ψ (t1 ), x(t1 )) − (ψ (t0 ), x(t0 )) = (ψ (t), Bu)dt.
|
Док-во. |
|
t0 |
|
|
||
|
|
|
|
|
|||
|
|
|
d |
(ψ (t), x(t)) = |
|
|
= |
|
|
|
dt |
||||
|
|
|
(ψ (t), x(t)) + (ψ (t), x(t)) |
||||
|
|
|
|
= (− ATψ , x(t)) + (ψ (t), Ax + Bu) = |
|
||
|
|
|
|
= −(ATψ , x(t)) + (ψ , Ax) + (ψ , Bu) = |
|
||
|
|
|
|
= −(ψ , Ax) + (ψ , Ax) + (ψ , Bu). |
|
||
|
Лемма доказана. |
|
|
|
|||
|
Лемма |
II. Пусть |
ψ(t)≠0 – |
решение |
системы |
||
ψ = − A |
ψ , a≠ 0 вектор из пространства X . Если для всех |
||||||
|
T |
|
|
|
|
|
|
t (θ0,θ1) выполнено соотношение (ψ(t),a)=0, то a принадлежит собственному инвариантному подпространству матрицы A, т.е. a,Aa,…,An-1a – линейно зависимы.
Док-во. Пусть Y – множество всех y из X таких, что (ψ(t),y)=0 при t (θ0,θ1), тогда Y – подпространство, т.к, если
y1 Y и y2 Y, то y1+ y2 Y и ky1,2 Y. По условию, a Y, т.е. Y≠ . По условию, ψ(t)≠0 при t (θ0,θ1) и, следовательно, Y≠X
95
(в противном случае ψ X и тогда ψ≡0). Докажем, что Y – инвариантное подпространство. Пусть y Y, т.е. (ψ(t),y)=0, следовательно, 0 = (ψ (t), y) = (− ATψ , y) = (−ψ , Ay) = 0 . Таким
образом, Ay Y и AY Y, т.е. Y – инвариантное подпространство и a Y . Лемма доказана.
Пусть Ω – выпуклый многогранник и 0 Ω и не является его вершиной.
Предположим, что для любого вектора ω, параллельного произвольному ребру многогранника, выполнено усло-
вие: Bω не принадлежит никакому собственному инвариант-
ному подпространству матрицы A, т.е. Bω, ABω,…, An-1Bω – линейно независимы, т.е. rang(B, AB,…, An-1B)=n.
Теорема 5. Пусть uˆ(t), t [t0 , t1 ] – допустимое управ-
ление, переводящее объект из заданного начального состояния x0 в положение x1=0. Для оптимальности управления необходимо и достаточно, чтобы оно удовлетворяло принципу максимума Понтрягина.
Док-во. По теореме 1 принцип максимума Понтрягина – необходимое условие, выполненное для данной задачи.
Докажем достаточность. Для линейной задачи оптимального быстродействия, как указано выше,
H(ψ,x,u)=(ψ,Bu).
И так как uˆ(t) – управление, удовлетворяющее принципу
максимума Понтрягина, то существует ψ≠0, такое, что
max H (ψ , x, u) = H (ψ , x, uˆ) . Тогда max(ψ , Bu) = (ψ , Buˆ) почти
uΩ uΩ
для любого t [t0,t1]. Предположим, что uˆ(t) не оптимально, тогда существует u~(t) и θ <t1 такие, что
~x(t) = ~x(t, x0 , t0 , u~) : ~x(θ ) = 0,θ < t1 .
96
В силу условия максимума имеем |
~ |
|
|
|
|
|
(ψ (t), Buˆ) = max(ψ (t), Buˆ) ≥ (ψ (t), Bu ), t [t 0 ,θ ) . |
(9.6) |
|||||
uΩ |
|
|
|
|
|
|
~ |
по условию задачи, то |
|
||||
Так как xˆ(t0 ) = x(t0 ) |
|
|||||
|
|
|
|
~ |
|
|
(ψ (t0 ), x(t0 )) = (ψ (t0 ), x(t0 )) |
|
|||||
и |
|
~ |
|
|
|
|
|
|
|
|
|
||
(ψ (t1 ), xˆ(t1 )) = (ψ (θ ), x (θ )) = 0 . |
|
|||||
По лемме I имеем для t (t0,θ) |
|
|
|
|
|
|
(ψ (t), xˆ(t)) − (ψ (t0 ), xˆ(t0 )) = t |
(ψ (t), Buˆ)dt |
|
||||
|
|
t0 |
|
|
|
|
~ |
~ |
|
t |
|
~ |
|
|
(ψ |
|
||||
(ψ (t), x (t)) |
− (ψ (t0 ), x (t0 )) = |
(t), Bu )dt. |
|
|||
|
|
|
t0 |
|
|
|
Рассмотрим t=θ и получим |
|
(θ ), x(θ )) = |
|
|||
(ψ (θ ), xˆ(θ )) = |
(ψ (θ ), xˆ(θ )) − (ψ |
|
||||
|
|
|
|
~ |
|
|
|
|
~ |
|
=0 |
|
|
|
|
(θ )) |
− (ψ (t0 ), x0 )] = |
|||
= [(ψ (θ ), xˆ(θ )) − (ψ (t0 ), x0 )] − [(ψ (θ ), x |
||||||
θ |
θ |
~ |
|
≥ 0, |
|
|
|
|
|
|
|||
= (ψ (t), Buˆ)dt − (ψ (t), Bu )dt |
|
|||||
t0 |
t0 |
|
|
|
|
|
т.е. из (9.6) имеем |
(ψ (θ ), xˆ(θ )) ≥ 0 . |
|
(9.7) |
|||
|
|
|||||
С другой стороны, так как 0 Ω и (ψ (t), Bu) линейно |
||||||
по u, то |
|
|
|
|
|
|
(ψ (t), Buˆ) = max(ψ (t), Bu) ≥ 0 . |
(9.8) |
uΩ
По лемме I
(ψ (θ ), xˆ(θ )) = (ψ (t0 ), x(t0 )) + θ (ψ , Buˆ)dt
t0
t1
(ψ (t1 ), xˆ(t1 )) = (ψ (t0 ), x(t0 )) + (ψ , Buˆ)dt.
t0
97
Вычтем почленно из первого равенства второе:
t1
(ψ (θ ), xˆ(θ )) − (ψ (t1 ), xˆ(t1 )) = − (ψ , Buˆ)dt.
θ
Так как xˆ(t1 ) = 0 по условию, то (ψ (t1 ), xˆ(t1 )) =0 и учитывая
(9.8), имеем
t1 |
|
(ψ (θ ), xˆ(θ )) = − (ψ , Buˆ)dt ≤ 0. |
(9.9) |
θ
Тогда из (9.7) и (9.9) получаем на (θ ,t1)
(ψ (θ ), xˆ(θ )) = 0 .
Тогда (ψ (t), Buˆ) = max(ψ (t), Bu) = 0, t (θ , t1 ).
uΩ
Пусть U1 – грань многогранника такая, что 0 intU1 (по условию 0 не является вершиной). U1 может совпадать с Ω либо быть его гранью. Но dimU1≥1. Т.к. во внутренней точке
U1 (ψ (t), Bu) = 0 и, кроме того, max(ψ (t), Bu) = 0 , то, в силу
uΩ
линейности (ψ (t), Bu) по u, и для любого t (θ,t1)
(ψ (t), Bu) = 0, u U1 .
Пусть u′ и u′′ – концы какого-либо ребра U1 , следова-
тельно, ω = u′′ − u′ направлено по ребру U1 и
(ψ (t), Bω) = (ψ (t), Bu′′) − (ψ (t), Bu′) = 0
т.к. (ψ (t), Bu) = 0 на всей U1. Тогда, в силу леммы II, Bω принадлежит инвариантному подпространству матрицы A и следовательно, условие линейной независимости
Bω,ABω,…,An-1Bω нарушено, что противоречит условию. Полученное противоречие доказывает теорему.
Рассмотренная задача оптимального управления не является единственной экстремальной задачей. Приведем примеры других задач.
98
1. Задача с не дифференцируемыми функционалами. Пусть ϕ i (t), i = 1, n – некоторые непрерывные функции, ϕ 0 (t) – заданная дифференцируемая функция.
x R n . Задача заключается в том, чтобы для заданной непрерывной функции ϕ 0 (t) найти x так, чтобы
F(x) = max ϕ 0 (t) − xiϕi (t) → min . |
|
[t0 ,t1 ] |
i |
Эта задача изучается в теории наилучших приближений. Ее отличительной особенностью является то, что функционал F(x) не имеет производной.
2. Пусть x(t) и u(t) – функции, связанные соотношением x = ϕ (x, u, t) ,
а G(x,t) – некоторая непрерывная функция. Определить u(t)
при u(t) M Rr |
так, чтобы max G(x(t), t) был минимален, |
|
t0 ≤t≤t1 |
т.е. найти min max G(x(t), t) , т.е. F(u) = max G(x(t), t) . |
|
u t0 ≤t≤t1 |
t0 ≤t≤t1 |
99
Структура учебно-методического комплекса
1. Описание и программа курса «Методы оптимизации».
Методы оптимизации относятся к числу важнейших математических дисциплин. Знание их теоретических основ и умение применять их к различным прикладным задачам является необходимой составной частью общего университетского образования. Кроме того, знания элементов теории экстремальных задач и методов оптимизации требует современное инженерное и экономическое образование.
Основная цель курса – обучение учащихся основам методов оптимизации и теории экстремальных задач и умению применять полученные знания к решению различных прикладных задач.
Для реализации поставленной цели в процессе преподавания курса предусмотрено чтение лекций и проведение семинаров.
2. Сведения об авторах.
Розова В.Н. – к.ф.-м.н., доцент, кафедра нелинейного анализа и оптимизации.
Максимова И.С. – старший преподаватель, кафедра нелинейного анализа и оптимизации.
3. Описание системы контроля знаний.
1. Баллы за работу в семестре (0–50) включают:
0–40 баллов – выполнение двух контрольных работ по 20 баллов каждая (каждая контрольная работа состоит из 5 задач по 4 балла); 0–10 баллов – посещаемость, выполнение домашней
работы и активная работа на семинарах.
100