Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Rozova_Maximova

.pdf
Скачиваний:
154
Добавлен:
15.04.2015
Размер:
714.37 Кб
Скачать

Будем говорить, что управление u(t) переводит систему (9.1) из положения x0 в положение x1, если решение x(t)=x(t,x0,t0,u), соответствующее этому u(t), таково, что

x(t1)=x(t1,x0,t0,u)=x1.

Постановка задачи оптимального управления.

Требуется среди допустимых функций u(t) найти такое управление и соответствующую ему траекторию, которое переводит объект из состояния x0 в момент времени t0 в состояние x1 в момент времени t1 так, чтобы I принимал минимальное значение. Управление u(t), решающее эту задачу, называется оптимальным. Оптимальное управление u(t) и соответствующая ему траектория x(t) называются оптималь-

ной парой (x(t),u(t)).

Если f0(x,u)=1, то функционал принимает вид I=t1t0.

Такая задача называется задачей оптимального быстродействия.

9.2. Линейная задача оптимального быстродействия

Пусть система (9.1) имеет вид:

(9.2)

x = Ax + Bu ,

 

 

x(t0)=x0, x(t1)=x1,

I=t1t0min.

A= const – матрица размера n×n, B = const – матрица размера

n×r, x=x1,…,xn, u=u1,…,ur.

Система (9.2) линейна по x и по u.

Пример. Управляемое движение математического маятника под действием ограниченной внешней силы (трение не учитывается).

91

Движение происходит вдоль оси Oy, в состоянии покоя шарик находится в точке O. Движение происходит под действием силы f(t) вдоль оси Oy. По закону Ньютона,

my = −ky + f (t)

(упругая сила пропорциональна отклонению от положения равновесия).

Тогда my = −ky + f (t), k > 0 , где k – жесткость пружины. Полагая ω 2 = mk и v(t) = fm(t) , получим

y + ω 2 y = v(t) .

Рассмотрим задачу об успокоении маятника под действием ограниченной внешней силы v(t) за минимальное время. Пусть заданы

y(0)=a, y(0) = b, v(t) 1.

Положим

y = x1 , y = x2 ,

 

v = u2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Получим

 

 

 

 

= x2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= −ω

2

x1

+ u2 .

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

u1

 

0

 

 

u

 

1

, M

 

a

 

 

0

 

 

 

 

u =

 

=

,

 

 

 

=

, M

 

=

 

.

 

 

 

 

 

 

2

 

 

 

 

0

 

 

1

 

0

 

u2

 

u2

 

 

 

 

 

 

 

 

b

 

 

 

Получили стандартную задачу линейного быстродействия.

Приведем без доказательства следующие теоремы, которые являются необходимыми условиями оптимальности в задаче (9.1).

92

9.3. Принцип максимума Понтрягина

Теорема 1 (принцип максимума Понтрягина).

Пусть

x = f (x, u), f1 ,..., fn , u = u1 ,..., ur x=x1,…,xn

(9.3)

x(t0)=x0,, x(t1)=x1.

Рассмотрим пару (x(t),u(t)), t [t0,t1], переводящую объект из

x0 в x1, т.е. x(t, x0 , t0 , u) t =t1 = x1 .

Рассмотрим также функцию:

n

 

 

H

 

H(ψ,x,u)= ψ i fi (x, u) , где ψ i = −

xi

. (9.4)

i=0

fi

 

 

 

 

 

 

n

 

 

 

 

ψ=ψ0,ψ1,…,ψn, ψ j = −

 

ψ i .

 

 

x j

 

 

i=0

 

 

 

Для оптимальности процесса (x(t),u(t)) необходимо сущест-

вование ψ(t)0 на [t0,t1] такого, что для почти всех t выполнено

1. H (ψ (t), x(t), u(t)) = max H (ψ , x, u) = M (ψ , x) ,

(9.5)

u U

2. в конечный момент t = t1 выполнены соотношения

ψ0(t1)0 и M(ψ(t1),x(t1))=0.

Теорема 2. Если функции u(t) и x(t), ψ(t), t0t t1

удовлетворяют соотношениям (9.3), (9.4), и (9.5), то функция

H(t)=H(ψ(t),x(t),u(t)) =const при t [t0,t1].

Замечание. Если система, описывающая поведение объекта, линейна, то принцип максимума, сформулированный в виде теоремы I, остается, естественно, в силе. Функция

H(t)=H(ψ(t),x(t),u(t)) для задачи оптимального быстродей-

ствия имеет вид:

H(t)=H(ψ(t),x(t),u(t))=(ψ,Ax)+(ψ,Bu), где

ψ = − ATψ , ψ≠0.

93

Согласно принципу максимума, операция нахождения мак-

симума max H (ψ , x, u) почти для каждого t [t0,t1] сводится

u U

к нахождению максимума max(ψ , Bu) . Поэтому в задаче оп-

u U

тимального быстродействия рассматривается

H(ψ,x,u)= (ψ,Bu).

Рассмотрим задачу оптимального быстродействия

для системы:

x = Ax + Bu , где

A=const – матрица размера (n×n), B=const – матрица размера

(n×r), x(t0)=x0,, x(t1)=0.

Допустимыми являются управления, удовлетворяющие условиям:

I.u(t) – кусочно-непрерывные;

II.Значения u(t) принадлежат выпуклому многогран-

нику Ω Rr.

Задача: требуется найти допустимые управления u: I=t1t0min.

Опр. 1. Под выпуклым многогранником (в случае r- мерного пространства) понимается пересечение конечного числа полупространств, если оно является ограниченным множеством.

Опр. 2. Множество называется выпуклым, если с каждыми двумя точками оно содержит весь отрезок, их соединяющий.

Теорема 3. У любого выпуклого многогранника есть несущая k-мерная гиперплоскость, kn.

94

Теорема 4. Граница любого k–мерного многогранника состоит из конечного числа k-1 мерных многогранников, которые называются гранями.

Лемма I. Пусть u(t) – произвольное допустимое управление, t [t0,t1], а x(t)=x(t,x0,t0,u). Пусть ψ(t)0 произ-

вольное решение системы ψ = − ATψ . Тогда во всех точках непрерывности u(t) выполнено соотношение:

dtd (ψ (t), x(t)) = (ψ (t), Bu)

и, следовательно,

t1

(ψ (t1 ), x(t1 )) (ψ (t0 ), x(t0 )) = (ψ (t), Bu)dt.

 

Док-во.

 

t0

 

 

 

 

 

 

 

 

 

 

d

(ψ (t), x(t)) =

 

 

=

 

 

 

dt

 

 

 

(ψ (t), x(t)) + (ψ (t), x(t))

 

 

 

 

= (ATψ , x(t)) + (ψ (t), Ax + Bu) =

 

 

 

 

 

= −(ATψ , x(t)) + (ψ , Ax) + (ψ , Bu) =

 

 

 

 

 

= −(ψ , Ax) + (ψ , Ax) + (ψ , Bu).

 

 

Лемма доказана.

 

 

 

 

Лемма

II. Пусть

ψ(t)0

решение

системы

ψ = − A

ψ , a0 вектор из пространства X . Если для всех

 

T

 

 

 

 

 

 

t (θ0,θ1) выполнено соотношение (ψ(t),a)=0, то a принадлежит собственному инвариантному подпространству матрицы A, т.е. a,Aa,…,An-1a – линейно зависимы.

Док-во. Пусть Y – множество всех y из X таких, что (ψ(t),y)=0 при t (θ0,θ1), тогда Y – подпространство, т.к, если

y1 Y и y2 Y, то y1+ y2 Y и ky1,2 Y. По условию, a Y, т.е. Y. По условию, ψ(t)0 при t (θ0,θ1) и, следовательно, YX

95

(в противном случае ψ X и тогда ψ≡0). Докажем, что Y – инвариантное подпространство. Пусть y Y, т.е. (ψ(t),y)=0, следовательно, 0 = (ψ (t), y) = (ATψ , y) = (ψ , Ay) = 0 . Таким

образом, Ay Y и AY Y, т.е. Y – инвариантное подпространство и a Y . Лемма доказана.

Пусть Ω – выпуклый многогранник и 0 Ω и не является его вершиной.

Предположим, что для любого вектора ω, параллельного произвольному ребру многогранника, выполнено усло-

вие: Bω не принадлежит никакому собственному инвариант-

ному подпространству матрицы A, т.е. Bω, ABω,…, An-1Bω – линейно независимы, т.е. rang(B, AB,…, An-1B)=n.

Теорема 5. Пусть uˆ(t), t [t0 , t1 ] – допустимое управ-

ление, переводящее объект из заданного начального состояния x0 в положение x1=0. Для оптимальности управления необходимо и достаточно, чтобы оно удовлетворяло принципу максимума Понтрягина.

Док-во. По теореме 1 принцип максимума Понтрягина – необходимое условие, выполненное для данной задачи.

Докажем достаточность. Для линейной задачи оптимального быстродействия, как указано выше,

H(ψ,x,u)=(ψ,Bu).

И так как uˆ(t) – управление, удовлетворяющее принципу

максимума Понтрягина, то существует ψ≠0, такое, что

max H (ψ , x, u) = H (ψ , x, uˆ) . Тогда max(ψ , Bu) = (ψ , Buˆ) почти

uΩ uΩ

для любого t [t0,t1]. Предположим, что uˆ(t) не оптимально, тогда существует u~(t) и θ <t1 такие, что

~x(t) = ~x(t, x0 , t0 , u~) : ~x(θ ) = 0,θ < t1 .

96

В силу условия максимума имеем

~

 

 

 

 

(ψ (t), Buˆ) = max(ψ (t), Buˆ) (ψ (t), Bu ), t [t 0 ,θ ) .

(9.6)

uΩ

 

 

 

 

 

 

~

по условию задачи, то

 

Так как xˆ(t0 ) = x(t0 )

 

 

 

 

 

~

 

 

(ψ (t0 ), x(t0 )) = (ψ (t0 ), x(t0 ))

 

и

 

~

 

 

 

 

 

 

 

 

(ψ (t1 ), xˆ(t1 )) = (ψ (θ ), x (θ )) = 0 .

 

По лемме I имеем для t (t0,θ)

 

 

 

 

 

(ψ (t), xˆ(t)) (ψ (t0 ), xˆ(t0 )) = t

(ψ (t), Buˆ)dt

 

 

 

t0

 

 

 

~

~

 

t

 

~

 

 

(ψ

 

(ψ (t), x (t))

(ψ (t0 ), x (t0 )) =

(t), Bu )dt.

 

 

 

 

t0

 

 

 

Рассмотрим t=θ и получим

 

(θ ), x(θ )) =

 

(ψ (θ ), xˆ(θ )) =

(ψ (θ ), xˆ(θ )) (ψ

 

 

 

 

 

~

 

 

 

~

 

=0

 

 

 

 

(θ ))

(ψ (t0 ), x0 )] =

= [(ψ (θ ), xˆ(θ )) (ψ (t0 ), x0 )] [(ψ (θ ), x

θ

θ

~

 

0,

 

 

 

 

 

= (ψ (t), Buˆ)dt (ψ (t), Bu )dt

 

t0

t0

 

 

 

 

 

т.е. из (9.6) имеем

(ψ (θ ), xˆ(θ )) 0 .

 

(9.7)

 

 

С другой стороны, так как 0 Ω и (ψ (t), Bu) линейно

по u, то

 

 

 

 

 

 

(ψ (t), Buˆ) = max(ψ (t), Bu) 0 .

(9.8)

uΩ

По лемме I

(ψ (θ ), xˆ(θ )) = (ψ (t0 ), x(t0 )) + θ (ψ , Buˆ)dt

t0

t1

(ψ (t1 ), xˆ(t1 )) = (ψ (t0 ), x(t0 )) + (ψ , Buˆ)dt.

t0

97

Вычтем почленно из первого равенства второе:

t1

(ψ (θ ), xˆ(θ )) (ψ (t1 ), xˆ(t1 )) = − (ψ , Buˆ)dt.

θ

Так как xˆ(t1 ) = 0 по условию, то (ψ (t1 ), xˆ(t1 )) =0 и учитывая

(9.8), имеем

t1

 

(ψ (θ ), xˆ(θ )) = − (ψ , Buˆ)dt 0.

(9.9)

θ

Тогда из (9.7) и (9.9) получаем на (θ ,t1)

(ψ (θ ), xˆ(θ )) = 0 .

Тогда (ψ (t), Buˆ) = max(ψ (t), Bu) = 0, t (θ , t1 ).

uΩ

Пусть U1 – грань многогранника такая, что 0 intU1 (по условию 0 не является вершиной). U1 может совпадать с Ω либо быть его гранью. Но dimU11. Т.к. во внутренней точке

U1 (ψ (t), Bu) = 0 и, кроме того, max(ψ (t), Bu) = 0 , то, в силу

uΩ

линейности (ψ (t), Bu) по u, и для любого t (θ,t1)

(ψ (t), Bu) = 0, u U1 .

Пусть uи u′′ – концы какого-либо ребра U1 , следова-

тельно, ω = u′′ − uнаправлено по ребру U1 и

(ψ (t), Bω) = (ψ (t), Bu′′) (ψ (t), Bu) = 0

т.к. (ψ (t), Bu) = 0 на всей U1. Тогда, в силу леммы II, Bω принадлежит инвариантному подпространству матрицы A и следовательно, условие линейной независимости

Bω,ABω,…,An-1Bω нарушено, что противоречит условию. Полученное противоречие доказывает теорему.

Рассмотренная задача оптимального управления не является единственной экстремальной задачей. Приведем примеры других задач.

98

1. Задача с не дифференцируемыми функционалами. Пусть ϕ i (t), i = 1, n – некоторые непрерывные функции, ϕ 0 (t) – заданная дифференцируемая функция.

x R n . Задача заключается в том, чтобы для заданной непрерывной функции ϕ 0 (t) найти x так, чтобы

F(x) = max ϕ 0 (t) xiϕi (t) min .

[t0 ,t1 ]

i

Эта задача изучается в теории наилучших приближений. Ее отличительной особенностью является то, что функционал F(x) не имеет производной.

2. Пусть x(t) и u(t) – функции, связанные соотношением x = ϕ (x, u, t) ,

а G(x,t) – некоторая непрерывная функция. Определить u(t)

при u(t) M Rr

так, чтобы max G(x(t), t) был минимален,

 

t0 tt1

т.е. найти min max G(x(t), t) , т.е. F(u) = max G(x(t), t) .

u t0 tt1

t0 tt1

99

Структура учебно-методического комплекса

1. Описание и программа курса «Методы оптимизации».

Методы оптимизации относятся к числу важнейших математических дисциплин. Знание их теоретических основ и умение применять их к различным прикладным задачам является необходимой составной частью общего университетского образования. Кроме того, знания элементов теории экстремальных задач и методов оптимизации требует современное инженерное и экономическое образование.

Основная цель курса – обучение учащихся основам методов оптимизации и теории экстремальных задач и умению применять полученные знания к решению различных прикладных задач.

Для реализации поставленной цели в процессе преподавания курса предусмотрено чтение лекций и проведение семинаров.

2. Сведения об авторах.

Розова В.Н. – к.ф.-м.н., доцент, кафедра нелинейного анализа и оптимизации.

Максимова И.С. – старший преподаватель, кафедра нелинейного анализа и оптимизации.

3. Описание системы контроля знаний.

1. Баллы за работу в семестре (050) включают:

040 баллов – выполнение двух контрольных работ по 20 баллов каждая (каждая контрольная работа состоит из 5 задач по 4 балла); 010 баллов – посещаемость, выполнение домашней

работы и активная работа на семинарах.

100