Скачиваний:
1
Добавлен:
25.12.2022
Размер:
717.17 Кб
Скачать

y

0

=

f

0

(u, y, t) = G[u, y, t];

 

 

 

 

y

 

=

f

 

(u, y, t);

1

 

1

 

 

. . . . . . . . . .

y

n

=

f

n

(u, y, t),

 

 

 

 

или в общем виде

yn = fi (u, y, t)

(i

=

0, ...,

n)

.

(8.39)

Важную переменные ψ

роль в

0

(t), ,

 

принципе максимума играют вспомогательные ψn ((t) и функция

H

n

= ψi (t) fi (u, i =0

y,

t)

.

(8.40)

Функции

Важно

определением

ψi (t) определяются из дифференциальных уравнений

dψi dt = −H yi

(i = 0, ..., n)

.

(8.41)

 

 

 

подчеркнуть, что уравнение (8.41)

является

функций ψi (t) , и на

вопрос «Что такое

функции

ψ

(t)

i

 

?» исчерпывающим

ответом будет: «Это функции, которые

удовлетворяют уравнению (8.41)».

H

из (8.40), то получим

 

 

 

 

 

 

 

 

 

 

 

 

dψ

i

 

n

 

f

k

 

 

= −

ψk (t)

 

 

dt

 

 

 

 

 

k

=0

 

 

 

 

 

 

 

 

 

Если в (8.41) подставить функцию

(u,

y, t)

(i = 0, ..., n) .

(8.42)

y

 

 

 

 

i

 

 

 

Это равенство можно использовать как иную формулировку определения функций ψi (t) .

Кстати, из (8.39) и (8.40) следует, что

dy

dt = H ψ

i

(i = 0,

i

 

 

 

Действительно, так как

H ψi =

..., fi ,

n

) .

то

(8.43)

уравнения (8.43)

эквивалентны уравнениям (8.39).

Если уравнения (8.43) и (8.41) записать совместно i dt = − H yi ;

dyi dt = H ψi ,

то можно заметить определенную симметрию в этой системе уравнений. Уравнения такого вида называют канонически сопряженными.

Теперь сформулируем основную теорему рассматриваемого метода (принцип максимума):

213

для оптимальности управления

u(t)

и

траектории

y(t)

с

координатами соответственно

u1

(t), ..., ur

(t)

и

y1(t), ..., yr

(t)

необходимо существование такой ненулевой непрерывной функции

ψi (t)

с координатами ψ0

(t), ..., ψn (t), соответствующей функциям

u(t)

и y(t) в силу уравнений (8.42), что при любом t

(t0

t T )

функция

H [ψ(t), y(t), u]

переменного

u достигает

в

точке

u = u(t) максимума:

 

 

 

 

 

 

H [ψ(t), y(t), u] = max

u .

 

 

Рассмотрим максимума его воздействием u(t

)

отличительную особенность вывода принципа авторами. Ограничимся одним управляющим

.

Как и экстремали

при

u(t)

выводе уравнения Эйлера, добавляется вариация

к

η(t)

предполагаемой

,вычисляется

соответствующая первая вариация функционала

δQ

и из равенства

этой вариации нулю выводятся необходимые условия оптимальности u(t) . Характерна форма вариации при выводе принципа максимума

(рис. 8.8). Это импульс в момент τ бесконечно малой длительности ε , но конечной, произвольной высоты u(τ) . Единственное условие,

которое наложено на величину

u(τ)

, – это требования ограничения

u(τ)

. Например, если

u

1

,

то 1 u(τ) +1. Вариация такого

вида названа игольчатой вариацией.

Рис. 8.8

Важно отметить, что игольчатая вариация существенно отличается от вариаций, с помощью которых выводится уравнение

214

Эйлера. Последние должны были представлять собой гладкие функции, в то время как игольчатая вариация является «скачкообразной». Использование скачкообразных вариаций позволяет включить в класс отыскиваемых экстремалей кусочнонепрерывные функции. А между тем, именно кусочно-непрерывные функции являются экстремалями во многих задачах оптимального управления, как это мы увидим из последующих примеров.

Прежде чем перейти к примерам, наметим план решения задачи

спомощью принципа максимума.

1.Записываем уравнения объекта в виде системы уравнений первого порядка (8.39), не забыв уравнения для функционала (8.38):

yi = fi (u,

2. Составляем функцию H

y, t)

:

(i

=

0, ...,

n)

.

H

n

= ψi (t) fi (u, i =0

y,

t)

.

3. Определяем значение

H

u =

, максимизирующее функцию

max

u

, ..., u

.

 

r

 

1

 

H

:

(8.44)

4. Составляем уравнения (8.41) для определения ψi (t) :

dψi

dt = −H yi (i = 0, ..., n) .

 

Через функции

ψi (t)

выражается искомое

оптимальное

управление.

 

 

 

 

Особенностью принципа максимума является то, что

вариационная задача нахождения функции

u(t)

доставляющей

экстремум функционалу

Q , заменена гораздо более простой задачей

математического анализа – задачей нахождения параметра u ,

доставляющего максимум вспомогательной функции

H (u) . Отсюда

понятно и название метода – принцип максимума.

 

Пример 8.1. Решим с помощью принципа максимума задачу 8.1 об оптимальном по быстродействию управлении объектом с уравнением y = u при ограничении на управление u 1.

Решение. Составим систему уравнений первого порядка,

описывающих объект, вводя обозначения

1

 

;

 

2

= y

:

 

 

y

= y

 

y

 

 

y1 = y2 ,

y2 = u .

 

 

 

 

 

(8.45)

215

Функционалом является длительность процесса

Q = T

=

T 1dt

0

,

поэтому дифференциальное уравнение для функционала вид

y0 =1.

(8.38) имеет

(8.46)

Добавляя (8.46) к (8.45), получим полную исходную систему уравнений объекта

y

0

= 1;

 

 

 

 

 

y

 

= y

2

;

1

 

 

y

2

= u.

 

 

 

 

 

Составляем функцию

H

:

2

H = ψi fi i =0

= ψ

0

1+ ψ y

2

 

1

+ ψ

u

2

 

.

(8.47)

В (8.47) только последнее слагаемое

можно обеспечить максимальное значение

H

 

 

 

 

этого слагаемого, т.е. необходимо, чтобы

 

ψ

2

(t)u = max

u 1

.

 

 

 

зависит от , добившись

u , поэтому максимума

(8.48)

Значения u, максимизирующие (8.48), следует брать на

границах, т. е.

u = +1 или u = −1. Очевидно, что при

ψ

2

(t) 0

следует

брать

u = +1,

а при

ψ

2

(t) 0

необходимо

u = −1.

Этот закон

 

 

 

 

 

 

 

 

 

 

 

управления можно записать с помощью функции sign :

u = sign

2

(t)

.

 

 

Для определения функций ψi (t) составим

уравнения типа (8.41):

0 dt = − H y0 = 0; dψ1 dt = − H y1 = 0; dψ2 dt = − H y2 = −ψi .

(8.49)

дифференциальные

Решения этих уравнений имеют вид

ψ

0

= const = C

0

;

 

 

 

ψ

1

= const = C

;

 

 

 

1

 

ψ

2

= C

2

C t.

 

 

 

1

 

Подставляя (8.50) в (8.49), получим окончательно u = sign C2 C1t) .

(8.50)

(8.51)

216

Так как функция

ψ

2

= C

2

C t

 

 

1

может менять знак не более

одного раза, то оптимальное управление (8.51) представляет собой кусочно-постоянную функцию, принимающую предельные значения

+ 1

или 1

и имеющую не более двух интервалов постоянства.

Такое же решение было получено в разделе 8.3 при синтезе оптимальной системы.

На основе рассмотренного примера можно заметить, что

функцию

y0 = f0 , а

следовательно, ψ0 (t)

можно

не

включать в

выражение

 

для

H ,

если функционал не

содержит

в

явном виде

управления

u ,

так как в этом случае слагаемое ψ0 f0

не влияет на

максимизацию

H

.

Пример 8.2. Рассмотрим задачу 8.6 об оптимальной по быстродействию встрече двух движущихся объектов. Закон сближения объектов описывается уравнением второго порядка (8.23) T x + x = u b с начальными условиями (8.24), которые записываются

x(0) = −a;

x(0) =

b

. Здесь

T

– постоянная времени управляемого

объекта;

 

b

– скорость движения неуправляемого объекта;

a

 

начальное рассогласование между объектами. Все три величины:

T

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b , a – заданные постоянные числа.

 

 

 

 

 

Решение. Поскольку функционалом является время процесса, то

уравнение

x0

= f0 не включается в число уравнений задачи.

 

 

 

Запишем систему

уравнений типа (8.39), обозначив

1

 

2

= x

:

 

 

 

 

 

 

 

 

 

x = x;

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

= x

2

;

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

(8.52)

 

 

 

 

 

x

 

= (1/ T )(x

 

+ u b).

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Составим функцию

H

:

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H =

 

ψ

i

f

i

= ψ x

2

+ ψ

2

(1/ T )(x

2

+ u b) =

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= ψ1x2

1

ψ2 x2

+

b

ψ2u

b

ψ2.

(8.53)

 

 

T

T

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

От управления u

 

в (8.53)

зависит только последнее слагаемое,

поэтому H = max |u| 1,

 

 

когда

 

 

1

ψ2u = max |u| 1 , откуда

получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

очевидный закон управления

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u = sign [ψ2 (t)].

 

 

 

(8.54)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

217

Составим дифференциальные уравнения для функций

dψ

/ dt = − H / x

= 0;

1

1

 

ψ

(t)

i

 

:

dψ

2

/ dt = − H / x

2

= −ψ

+ (1/ T

2

.

 

 

1

 

 

Из первого уравнения следует

 

 

 

 

 

 

ψ1 = const ,

 

 

(8.55)

а из второго с учетом (8.55)

ψ

2

(t) = C +

 

1

Подставляя (8.56) в (8.54), оптимального управления

C2e

t / T

.

(8.56)

 

запишем

окончательно закон

u = sign (C1 + C2e

t / T

) .

 

На рис. 8.9 показаны графики функции сочетаний постоянных интегрирования: кривая

кривая 2 – для

 

1

 

 

,

 

2

 

; кривая 3 – для

 

1

– для

1

 

,

 

C

 

0

 

C

 

0

 

 

C

 

 

 

2

 

 

. Как видно, функция

 

2

 

 

C

0

 

C

 

0

 

 

 

 

 

 

ψ

 

(t)

 

2

 

 

 

 

 

 

 

(8.57)

ψ

(t)

для различных

 

 

 

 

 

 

 

 

 

 

1 для

 

C

0

,

C

2

0

;

 

1

 

 

 

 

0

,

C

2

 

0

и кривая 4

 

 

 

 

 

не более одного раза

меняет знак, следовательно, оптимальное управление содержит не более двух интервалов постоянства.

Рис. 8.9

Рис. 8.10

Из физического смысла задачи (см. траектории объектов A и B на рис. 8.4, а ясно, что вначале управление должно обеспечить разгон объекта B , а затем его торможение. С учетом результата (8.57) и физического смысла задачи можно утверждать, что управление

должно состоять

из

двух интервалов (рис. 8.10): на первом для

0 t t1

u = +1,

а

на

втором для

t1 t t2 управление u = −1.

Моменты

переключения

ti и окончания процесса сближения

t2

составляют неизвестные

параметры

закона управления. Для

t t2

218

движение объектов будет проходить одинаково, если положить u = b.

При этом, как следует из закона сближения объектов (8.23),

x = x = 0 .

Определим

t1 и t2

, используя уравнения системы и граничные

условия. Принимая за единицу времени постоянную T , т. е. вводя

нормированное

время

= t / T , перепишем

дифференциальное

уравнение (8.23) закона сближения

 

 

 

dx2 / d + x2 = u b .

(8.58)

Граничные условия примут вид

x1(0) = −a;

x12 ) = 0;

 

x2 (0) = −b;

Подставляя для

 

отрезка

времени

[0, τ1]

(8.58), имеем

 

 

 

 

 

 

 

 

 

 

 

 

x

2

+ x

2

= 1 b

,

 

 

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

x

 

= (1 b) + Ce

τ

(0 τ

2

 

 

 

 

 

 

 

 

 

 

x2 2 ) = 0 .

управление

τ1) .

(8.59) u = +1 в

(8.60)

 

Постоянную C

интегрирования найдем из начального условия

x2

= −b . Подставляя в (8.60)

 

τ = 0

, получим

 

C = −1, а закон изменения

x2

(τ) можно записать в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2 = (1 b) e

τ

 

(0 τ

τ1) .

 

 

(8.61)

 

Интегрируя

 

 

 

условий

 

(8.86), с учетом

 

начальных»

1

определим закон изменения

 

 

1

 

 

на отрезке

1

 

:

x (0) = −a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

(τ)

 

 

 

 

 

 

 

 

 

[0, τ ]

 

 

 

 

 

x1

(τ) = −(a +1) + (1 b) + e

τ

 

 

 

(0 τ τ1) .

(8.62)

 

 

 

 

 

 

 

 

Подставляя в уравнения (8.61) и

 

 

 

(8.62)

 

τ = τ

вычислим

 

 

 

 

 

1 ,

значения x

(τ )

и x

2

2

) , являющиеся начальными условиями для

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дифференциального

 

уравнения

 

 

движения

на

 

втором

интервале

τ

τ τ

2 , где u

= −1:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x (τ ) = −(a +1) + (1 b) + eτ ;

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

(8.63)

 

 

 

 

 

 

(τ ) = (1 b) eτ .

 

 

 

 

 

 

 

 

 

 

x

2

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Запишем уравнение движения для τ1 τ τ2 :

 

(8.64)

 

 

 

 

 

 

 

 

x

2

+ x

2

= −(1 + b)

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интегрируя (8.64) с учетом начальных условий (8.63), получим

 

 

 

x2 (τ) = −(1 + b) +

(2 e

τ

1

)e

(τ-τ

 

)

τ1 τ τ2.

(8.65)

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Закон изменения x11)

 

для отрезка времени τ1 τ τ2 найдем,

проинтегрировав (8.65) с учетом начальных условий (8.63)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

219

x

2

1

 

x1 По ) =

(τ) = (1 a + условию

x2 2 ) = 0 ,

1) (1 + b(2 e

τ

1

)e

(τ-τ

)

τ1

τ τ2.

(8.66)

 

1

 

 

 

 

 

 

 

 

задачи в момент окончания процесса

поэтому, подставляя

 

в

(8.65) и

(8.66)

τ = τ2

получим систему уравнений для определения моментов времени

τ2

:

(1 + b) + (2 e

τ

 

)e

 

)

= 0;

 

1

 

2

1

 

 

 

 

 

 

 

τ1

и

(1 a +

) (1 + b

 

(2 e

τ

1 )e

 

)

= 0.

2

 

 

2

1

 

1

 

 

 

 

 

 

 

 

 

Путем несложных преобразований от этой системы уравнений можно перейти к другой более простой паре уравнений

τ2

=

 

 

 

 

 

 

a b

 

 

2 e

τ

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

τ2

=

 

1

 

;

τ2 = τ1 + ln

 

 

.

 

 

 

 

 

 

 

 

1 + b

1 + b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассматривая

эти

уравнения

как функции

вида

τ

2

=

 

 

 

2

1

 

, можно построить на плоскости с координатами

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

(8.67)

1

 

1

 

и

 

)

 

τ1

и

τ2

соответствующие графики (рис. 8.11), определяет искомые моменты времени

точка пересечения которых и

τ1иск и τ2иск .

Рис. 8.11

8.6.Контрольные вопросы

1.Какую функцию называют кусочно-непрерывной?

2.Какие функции называют функционалами, а какие экстремалями?

220

3.Какие примеры постановки оптимального управления вы

знаете?

4.Какой вид имеет функционал при оптимальном быстродействии?

5.Что необходимо для реализации оптимального процесса в разомкнутой системе?

6.Что вы знаете о методе динамического программирования?

7.Назовите четыре основных метода в вариационном исчислении, используемых для решения задач оптимального управления?

8.Сформулируйте основную теорему принципа максимума.

9.Назовите план решения задачи с помощью принципа максимума.

10.Особенности применения принципа максимума.

221

Соседние файлы в папке Лекции