Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Российский университет дружбы народов

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Rozova_Maximova

.pdf

Скачиваний:

154

Добавлен:

15.04.2015

Размер:

714.37 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1210 11 12 > Следующая >>>

Будем говорить, что управление u(t) переводит систему (9.1) из положения x0 в положение x1, если решение x(t)=x(t,x0,t0,u), соответствующее этому u(t), таково, что

x(t1)=x(t1,x0,t0,u)=x1.

Постановка задачи оптимального управления.

Требуется среди допустимых функций u(t) найти такое управление и соответствующую ему траекторию, которое переводит объект из состояния x0 в момент времени t0 в состояние x1 в момент времени t1 так, чтобы I принимал минимальное значение. Управление u(t), решающее эту задачу, называется оптимальным. Оптимальное управление u(t) и соответствующая ему траектория x(t) называются оптималь-

ной парой (x(t),u(t)).

Если f0(x,u)=1, то функционал принимает вид I=t1–t0.

Такая задача называется задачей оптимального быстродействия.

9.2. Линейная задача оптимального быстродействия

Пусть система (9.1) имеет вид:	(9.2)
x = Ax + Bu ,	(9.2)

x(t0)=x0, x(t1)=x1,

I=t1–t0→min.

A= const – матрица размера n×n, B = const – матрица размера

n×r, x=x1,…,xn, u=u1,…,ur.

Система (9.2) линейна по x и по u.

Пример. Управляемое движение математического маятника под действием ограниченной внешней силы (трение не учитывается).

Движение происходит вдоль оси Oy, в состоянии покоя шарик находится в точке O. Движение происходит под действием силы f(t) вдоль оси Oy. По закону Ньютона,

my = −ky + f (t)

(упругая сила пропорциональна отклонению от положения равновесия).

Тогда my = −ky + f (t), k > 0 , где k – жесткость пружины. Полагая ω 2 = mk и v(t) = fm(t) , получим

y + ω 2 y = v(t) .

Рассмотрим задачу об успокоении маятника под действием ограниченной внешней силы v(t) за минимальное время. Пусть заданы

y(0)=a, y(0) = b, v(t) ≤ 1.

Положим

y = x1 , y = x2 ,

v = u2 .

Получим

= x2 ,

= −ω

+ u2 .

≤ 1

, M

u =

, M

Получили стандартную задачу линейного быстродействия.

Приведем без доказательства следующие теоремы, которые являются необходимыми условиями оптимальности в задаче (9.1).

9.3. Принцип максимума Понтрягина

Теорема 1 (принцип максимума Понтрягина).

Пусть

x = f (x, u), f1 ,..., fn , u = u1 ,..., ur x=x1,…,xn

(9.3)

x(t0)=x0,, x(t1)=x1.

Рассмотрим пару (x(t),u(t)), t [t0,t1], переводящую объект из

x0 в x1, т.е. x(t, x0 , t0 , u) t =t1 = x1 .

Рассмотрим также функцию:

n			∂H
H(ψ,x,u)= ψ i fi (x, u) , где ψ i = −			∂xi	. (9.4)
i=0	∂fi		∂xi
	∂fi
n
ψ=ψ0,ψ1,…,ψn, ψ j = −		ψ i .
ψ=ψ0,ψ1,…,ψn, ψ j = −	∂x j	ψ i .
i=0	∂x j

Для оптимальности процесса (x(t),u(t)) необходимо сущест-

вование ψ(t)≠0 на [t0,t1] такого, что для почти всех t выполнено

1. H (ψ (t), x(t), u(t)) = max H (ψ , x, u) = M (ψ , x) ,

(9.5)

u U

2. в конечный момент t = t1 выполнены соотношения

ψ0(t1)≤0 и M(ψ(t1),x(t1))=0.

Теорема 2. Если функции u(t) и x(t), ψ(t), t0≤ t ≤t1

удовлетворяют соотношениям (9.3), (9.4), и (9.5), то функция

H(t)=H(ψ(t),x(t),u(t)) =const при t [t0,t1].

Замечание. Если система, описывающая поведение объекта, линейна, то принцип максимума, сформулированный в виде теоремы I, остается, естественно, в силе. Функция

H(t)=H(ψ(t),x(t),u(t)) для задачи оптимального быстродей-

ствия имеет вид:

H(t)=H(ψ(t),x(t),u(t))=(ψ,Ax)+(ψ,Bu), где

ψ = − ATψ , ψ≠0.

Согласно принципу максимума, операция нахождения мак-

симума max H (ψ , x, u) почти для каждого t [t0,t1] сводится

u U

к нахождению максимума max(ψ , Bu) . Поэтому в задаче оп-

u U

тимального быстродействия рассматривается

H(ψ,x,u)= (ψ,Bu).

Рассмотрим задачу оптимального быстродействия

для системы:

x = Ax + Bu , где

A=const – матрица размера (n×n), B=const – матрица размера

(n×r), x(t0)=x0,, x(t1)=0.

Допустимыми являются управления, удовлетворяющие условиям:

I.u(t) – кусочно-непрерывные;

II.Значения u(t) принадлежат выпуклому многогран-

нику Ω Rr.

Задача: требуется найти допустимые управления u: I=t1–t0→min.

Опр. 1. Под выпуклым многогранником (в случае r- мерного пространства) понимается пересечение конечного числа полупространств, если оно является ограниченным множеством.

Опр. 2. Множество называется выпуклым, если с каждыми двумя точками оно содержит весь отрезок, их соединяющий.

Теорема 3. У любого выпуклого многогранника есть несущая k-мерная гиперплоскость, k≤ n.

Теорема 4. Граница любого k–мерного многогранника состоит из конечного числа k-1 мерных многогранников, которые называются гранями.

Лемма I. Пусть u(t) – произвольное допустимое управление, t [t0,t1], а x(t)=x(t,x0,t0,u). Пусть ψ(t)≠0 произ-

вольное решение системы ψ = − ATψ . Тогда во всех точках непрерывности u(t) выполнено соотношение:

dtd (ψ (t), x(t)) = (ψ (t), Bu)

и, следовательно,

(ψ (t1 ), x(t1 )) − (ψ (t0 ), x(t0 )) = (ψ (t), Bu)dt.

	Док-во.				t0
	Док-во.
			d	(ψ (t), x(t)) =			=
			dt
			dt		(ψ (t), x(t)) + (ψ (t), x(t))
				= (− ATψ , x(t)) + (ψ (t), Ax + Bu) =
				= −(ATψ , x(t)) + (ψ , Ax) + (ψ , Bu) =
				= −(ψ , Ax) + (ψ , Ax) + (ψ , Bu).
	Лемма доказана.
	Лемма			II. Пусть	ψ(t)≠0 –	решение	системы
ψ = − A		ψ , a≠ 0 вектор из пространства X . Если для всех
	T

t (θ0,θ1) выполнено соотношение (ψ(t),a)=0, то a принадлежит собственному инвариантному подпространству матрицы A, т.е. a,Aa,…,An-1a – линейно зависимы.

Док-во. Пусть Y – множество всех y из X таких, что (ψ(t),y)=0 при t (θ0,θ1), тогда Y – подпространство, т.к, если

y1 Y и y2 Y, то y1+ y2 Y и ky1,2 Y. По условию, a Y, т.е. Y≠ . По условию, ψ(t)≠0 при t (θ0,θ1) и, следовательно, Y≠X

(в противном случае ψ X и тогда ψ≡0). Докажем, что Y – инвариантное подпространство. Пусть y Y, т.е. (ψ(t),y)=0, следовательно, 0 = (ψ (t), y) = (− ATψ , y) = (−ψ , Ay) = 0 . Таким

образом, Ay Y и AY Y, т.е. Y – инвариантное подпространство и a Y . Лемма доказана.

Пусть Ω – выпуклый многогранник и 0 Ω и не является его вершиной.

Предположим, что для любого вектора ω, параллельного произвольному ребру многогранника, выполнено усло-

вие: Bω не принадлежит никакому собственному инвариант-

ному подпространству матрицы A, т.е. Bω, ABω,…, An-1Bω – линейно независимы, т.е. rang(B, AB,…, An-1B)=n.

Теорема 5. Пусть uˆ(t), t [t0 , t1 ] – допустимое управ-

ление, переводящее объект из заданного начального состояния x0 в положение x1=0. Для оптимальности управления необходимо и достаточно, чтобы оно удовлетворяло принципу максимума Понтрягина.

Док-во. По теореме 1 принцип максимума Понтрягина – необходимое условие, выполненное для данной задачи.

Докажем достаточность. Для линейной задачи оптимального быстродействия, как указано выше,

H(ψ,x,u)=(ψ,Bu).

И так как uˆ(t) – управление, удовлетворяющее принципу

максимума Понтрягина, то существует ψ≠0, такое, что

max H (ψ , x, u) = H (ψ , x, uˆ) . Тогда max(ψ , Bu) = (ψ , Buˆ) почти

uΩ uΩ

для любого t [t0,t1]. Предположим, что uˆ(t) не оптимально, тогда существует u~(t) и θ <t1 такие, что

~x(t) = ~x(t, x0 , t0 , u~) : ~x(θ ) = 0,θ < t1 .

В силу условия максимума имеем		~
(ψ (t), Buˆ) = max(ψ (t), Buˆ) ≥ (ψ (t), Bu ), t [t 0 ,θ ) .						(9.6)
uΩ
~	по условию задачи, то
Так как xˆ(t0 ) = x(t0 )	по условию задачи, то
				~
(ψ (t0 ), x(t0 )) = (ψ (t0 ), x(t0 ))
и		~
		~
(ψ (t1 ), xˆ(t1 )) = (ψ (θ ), x (θ )) = 0 .
По лемме I имеем для t (t0,θ)
(ψ (t), xˆ(t)) − (ψ (t0 ), xˆ(t0 )) = t				(ψ (t), Buˆ)dt
		t0
~	~		t		~
~	~		(ψ		~
(ψ (t), x (t))	− (ψ (t0 ), x (t0 )) =		(ψ		(t), Bu )dt.
			t0
Рассмотрим t=θ и получим			(θ ), x(θ )) =
(ψ (θ ), xˆ(θ )) =	(ψ (θ ), xˆ(θ )) − (ψ		(θ ), x(θ )) =
				~
		~		=0
		~	(θ ))		− (ψ (t0 ), x0 )] =
= [(ψ (θ ), xˆ(θ )) − (ψ (t0 ), x0 )] − [(ψ (θ ), x			(θ ))		− (ψ (t0 ), x0 )] =
θ	θ	~			≥ 0,
		~
= (ψ (t), Buˆ)dt − (ψ (t), Bu )dt
t0	t0
т.е. из (9.6) имеем	(ψ (θ ), xˆ(θ )) ≥ 0 .					(9.7)
	(ψ (θ ), xˆ(θ )) ≥ 0 .					(9.7)
С другой стороны, так как 0 Ω и (ψ (t), Bu) линейно
по u, то
(ψ (t), Buˆ) = max(ψ (t), Bu) ≥ 0 .						(9.8)

uΩ

По лемме I

(ψ (θ ), xˆ(θ )) = (ψ (t0 ), x(t0 )) + θ (ψ , Buˆ)dt

(ψ (t1 ), xˆ(t1 )) = (ψ (t0 ), x(t0 )) + (ψ , Buˆ)dt.

Вычтем почленно из первого равенства второе:

(ψ (θ ), xˆ(θ )) − (ψ (t1 ), xˆ(t1 )) = − (ψ , Buˆ)dt.

Так как xˆ(t1 ) = 0 по условию, то (ψ (t1 ), xˆ(t1 )) =0 и учитывая

(9.8), имеем

t1
(ψ (θ ), xˆ(θ )) = − (ψ , Buˆ)dt ≤ 0.	(9.9)

Тогда из (9.7) и (9.9) получаем на (θ ,t1)

(ψ (θ ), xˆ(θ )) = 0 .

Тогда (ψ (t), Buˆ) = max(ψ (t), Bu) = 0, t (θ , t1 ).

uΩ

Пусть U1 – грань многогранника такая, что 0 intU1 (по условию 0 не является вершиной). U1 может совпадать с Ω либо быть его гранью. Но dimU1≥1. Т.к. во внутренней точке

U1 (ψ (t), Bu) = 0 и, кроме того, max(ψ (t), Bu) = 0 , то, в силу

uΩ

линейности (ψ (t), Bu) по u, и для любого t (θ,t1)

(ψ (t), Bu) = 0, u U1 .

Пусть u′ и u′′ – концы какого-либо ребра U1 , следова-

тельно, ω = u′′ − u′ направлено по ребру U1 и

(ψ (t), Bω) = (ψ (t), Bu′′) − (ψ (t), Bu′) = 0

т.к. (ψ (t), Bu) = 0 на всей U1. Тогда, в силу леммы II, Bω принадлежит инвариантному подпространству матрицы A и следовательно, условие линейной независимости

Bω,ABω,…,An-1Bω нарушено, что противоречит условию. Полученное противоречие доказывает теорему.

Рассмотренная задача оптимального управления не является единственной экстремальной задачей. Приведем примеры других задач.

1. Задача с не дифференцируемыми функционалами. Пусть ϕ i (t), i = 1, n – некоторые непрерывные функции, ϕ 0 (t) – заданная дифференцируемая функция.

x R n . Задача заключается в том, чтобы для заданной непрерывной функции ϕ 0 (t) найти x так, чтобы

F(x) = max ϕ 0 (t) − xiϕi (t) → min .
[t0 ,t1 ]	i

Эта задача изучается в теории наилучших приближений. Ее отличительной особенностью является то, что функционал F(x) не имеет производной.

2. Пусть x(t) и u(t) – функции, связанные соотношением x = ϕ (x, u, t) ,

а G(x,t) – некоторая непрерывная функция. Определить u(t)

при u(t) M Rr	так, чтобы max G(x(t), t) был минимален,
	t0 ≤t≤t1
т.е. найти min max G(x(t), t) , т.е. F(u) = max G(x(t), t) .
u t0 ≤t≤t1	t0 ≤t≤t1

Структура учебно-методического комплекса

1. Описание и программа курса «Методы оптимизации».

Методы оптимизации относятся к числу важнейших математических дисциплин. Знание их теоретических основ и умение применять их к различным прикладным задачам является необходимой составной частью общего университетского образования. Кроме того, знания элементов теории экстремальных задач и методов оптимизации требует современное инженерное и экономическое образование.

Основная цель курса – обучение учащихся основам методов оптимизации и теории экстремальных задач и умению применять полученные знания к решению различных прикладных задач.

Для реализации поставленной цели в процессе преподавания курса предусмотрено чтение лекций и проведение семинаров.

2. Сведения об авторах.

Розова В.Н. – к.ф.-м.н., доцент, кафедра нелинейного анализа и оптимизации.

Максимова И.С. – старший преподаватель, кафедра нелинейного анализа и оптимизации.

3. Описание системы контроля знаний.

1. Баллы за работу в семестре (0–50) включают:

0–40 баллов – выполнение двух контрольных работ по 20 баллов каждая (каждая контрольная работа состоит из 5 задач по 4 балла); 0–10 баллов – посещаемость, выполнение домашней

работы и активная работа на семинарах.

100

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1210 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.07.201960.93 Кб2Redakt.doc
#
21.03.2016144.9 Кб266referat-grazhdanskoe-pravo-dogovor-arendi.doc
#
29.08.2019213.5 Кб1Referat_po_deloproizvodstvu.doc
#
18.09.2019314.37 Кб4respuestas de nief y gas.doc
#
11.11.2019276.99 Кб17Revision of tenses, 1st year.doc
#
15.04.2015714.37 Кб154Rozova_Maximova.pdf
#
15.04.2015868.91 Кб31rukovodstvo_po_patanatomii_chast_1.pdf
#
21.03.20163.6 Mб18R_Atkinson_upravlenie_kratkovremennoy_pamyatyu.doc
#
21.03.20165.76 Mб108S.Lowry - Learning Surgery The Surgery Clerkship Manual - 2005.pdf
#
19.11.201969.12 Кб2Secrets of the world четверг.doc
#
02.11.2018222.72 Кб19SEMINAR-TRENING__KOMMUNIKATIVNO__ETIKI (1).doc