Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Задача заключается в построении такого управления х (t), при котором система за минимальное время Т из состояния (7.5.15) перешла бы в состояние

у(Т) = уÏ, у{Т) = 0,

(7.5.17)

не нарушая ограничений (7.5.16).

Естественным решением этой задачи следует считать «разгон» системы под действием максимально возможного

управляющего воздействия х (t) = 1 до у (t) — -g- (yt

у0) и ее последующее «торможение» с максимально возможным замедлением х (г) = — 1 до у (Т) = уг.

Легко заметить, что всякое другое управление было бы неоптимальным с точки зрения быстродействия.

Оптимальный алгоритм управления х (t) можно за­ писать в следующем виде:

 

1

при

у ( * )

< - £ ^ ,

 

*(<) =

1

при

у ( 0

> ^ ,

(7.5.18)

О при у (f) = уг.

Как видно, это управление отличается от управления объектом первого порядка (7.5.9) использованием обеих крайних возможностей Яплп и хтах на каждом цикле управления и необходимостью помнить исходное состоя­ ние у0. Эти обстоятельства связаны, прежде всего, с повышенной инерционностью объекта второго порядка.

Теперь рассмотрим более общий случай, когда инер­ ционное звено представляется в виде дифференциального уравнения п-го порядка

а0у{п) + a jj^ v +

+ an-i ÿ + y = x(t) (7.5.19)

с начальными условиями

 

У (0) = Уо; у(0) =

= y(n-1} (0) = 0 (7.5.20)

и ограничением того же вида (7.5.16). Задача заключается

вопределении такого управления х (t), которое, удовлет­ воряя условию (7.5.16), быстрейшим образом переводит систему из исходного состояния (7.5.20) в требуемое

Решение этой задачи изучается в теории оптимального управления [7.40—7.15]. Рассмотрим несколько основных положений этой теории.

Одним из фундаментальных положений теории опти­ мальных процессов является теорема об п интервалах [7.41]. Эта теорема утверждает, что в случае, когда корни уравнения

а0рп aip n~1 + -f- Ojр - [ - 1 = 0

действительны и неположительны, оптимальное управле­ ние представляет собой кусочно-постоянный процесс вида

 

-[- 1 при 0

t <

h,

 

— 1

при ti ^

t <

tit

‘'ОПТ(< )-

-[-1

при

 

(7.5.22)

1 ( - l)n_1 при tn-i < * < * „ = 7\

т. е. управление разбивается на п интервалов (число ко­ торых совпадает с порядком дифференциального уравне­ ния объекта) и на каждом интервале управление принимает наибольшее по модулю значение, причем знаки чередуются на соседних интервалах. Проще говоря, оптимальное управ­

ление сводится к чередованию «полного хода

вперед»

и «полного хода назад» и так п раз.

теоремы.

Не будем приводить доказательства этой

Сошлемся лишь на рассмотренные выше примеры объектов первого и второго порядка, оптимальное управление ко­ торыми, как видно, удовлетворяет этой теореме. Теорема об п интервалах не решает поставленной задачи синтеза оптимального управления аьпт (<), а лишь определяет ха­ рактер поведения этого управления. Для решения постав­ ленной задачи необходимо определить моменты переклю­ чения *2, ., tn-i = Т. Но это уже более простая задача, так как она сводится к минимизации функции п—1 переменных.

Действительно, пусть у (t) — решение уравнения (7.5.19) при начальных условиях (7.5.20) с правой частью вида (7.5.22). Это решение зависит от п—1 параметров

Построим следующую функцию

качества:

Q (T) = Т,

(7.5.24)

которую следует минимизировать при выполнении ог­ раничений

У (Т) = Ух; ÿ(T) = ÿ (Т) =

=

(Т) = 0.

 

 

(7.5.25)

Как видно, задача синтеза оптимального управления све­ лась к минимизации функции (7.5.24) с соблюдением ог­ раничений типа равенств (7.5.25). Особенности решения таких задач рассмотрены ниже, в главе 12 (§ 12.2).

Однако рассмотренный алгоритм оптимального управ­ ления процессом перевода переменной у в заданное со­ стояние является программным со всеми недостатками программного управлениями. § 1.1). Более гибким и ус­ тойчивым следует считать управление с обратной связью,

Рис. 7.5.4. Блок-схема оптимального управления объектом перво­ го рода.

использование которого для управления объектом пер­ вого рода показано на рис. 7.5.4. Здесь выход шаго­ вого экстремального регулятора подается на оптималь­ ный регулятор, управляющий входом объекта x(t). В обратную связь регулятора введена модель инерцион­ ности объекта W j(р), что позволяет ему эффективно сле­ дить за поведением переменной y(t) объекта. Время пе­ рекладки в этом случае равно времени Т отработки сиг­ нала у\ экстремального регулятора.

Таким образом, при экстремальном управлении инер­ ционными объектами первого рода широко применяются методы оптимального управления, позволяющие быстрей­ шим образом переводить объект в заданное состояние.

§ 7.6. Улучшение процессов экстремального управления инерционными объектами (объекты второго рода)

Трудность управления объектами второго рода заклю­ чается в том, что управление ж (t), прежде чем поступить на линейное динамическое звено W2 (р), искажается нели­ нейным преобразованием g (х), параметры которого неиз­ вестны. Если бы можно было ожидать установления пере­ ходных процессов, то величину g (ж -+* Аж) можно было бы определять точно. Но быстродействие при этом было бы крайне мало. Поэтому ставится задача об определении величины g (ж + Ах) за короткий промежуток времени. Сделать это можно остроумным приемом [7.16—7.18], смысл которого сводится к следующему.

Пусть параметры линейного динамического звена W2(p) известны. Для простоты рассмотрим случай апериодичес­ кого звена первого порядка

3 T F T -

<7'6Л)

Система уравнений задачи в этом случае имеет вид

 

Ч= *(*), Г, ■$- + <?=«,

(7.6.2)

где g (ж) — нелинейное безынерционное звено с экстре­ мальной характеристикой. Сама функция g (ж) неизвестна.

Задача заключается в том, чтобы, сделав определенный шаг Дж, узнать быстрейшим образом, какое значение будет иметь Q (ж + Аж) после процесса установления, т. е. ПрИ t •—>оо.

Пусть в исходном состоянии ж = ж0 (т. é. при t <1 О система неподвижна). Тогда после перехода в состояние ж0 + Дж получаем на выходе нелинейного звена

g (ж0 + Аж) = g (ж0) + Ад,

(7.6.3)

где Ад — некоторая неизвестная величина, которая под­ лежит определению. Пусть выход объекта

Q(t) = Q (0) + A Q 01) = g (ж„) + AQ (t). (7.6.4)

Рассмотрим поведение величины приращения AQ. Ее из­ менение подчиняется уравнению

т dAQ 1 г~АГ

Замеряя значение AQ (t) — Q (t) q (х0), можно опре­ делить Aq (рис. 7.6.1). Известно, что, продолжая началь­ ный участок экспоненты прямой до уровня q (х0 + + Аж), получаем постоянную времени звена Т2. Следова­ тельно, замеряя Q (tx) при малом tv получим

Дj » A < ? ( y n .

(7.6.6)

Для больших значений tx зависимость Aq — f [AÇ (fj),/^] более сложна. Таким образом, если шаг Ах сделан из стационарного состояния, когда Q (0) = q (х0), величина изменения выхода нели­ нейного звена определя­ ется без труда путем расче-

тапо формуле(7.6.6). Теперь рассмотрим бо­

лее общий случай, когда шаг Ах делается из неста­ ционарного состояния, т. е. когда Q (0)=f=q{xo). Здесь следует учитывать началь­

Рис. 7.6.1. К выводу формулы ные условия вида

(7.6.6).

 

 

Ç ( 0 ) = e , +

*(*,)• (7.6.7)

Выражение (7.6.4) теперь записывается в

виде

Q (t) =

<?о +

Л<? (*).

(7.6.8)

где A Q(0) = 0, AQ (оо) =

Aq +

q (х0) — Q0-

 

При малом fi, как видно, получаем

 

àQ(ti)=t1[Aq+q(x0) - Q 0]/T2,

 

т. е. в этом случае знак

AQ (tx) не совпадает со знаком

Aq, однако может служить его оценкой. Значение AQ( tx) удобно определять с помощью несложного устройства. Его блок-схема показана на рис. 7.6.2. Здесь П — эле­ мент памяти, запоминающий входное значение при за­ мыкании ключа К. Если этот ключ замыкать ненадолго через промежутки времени tx, то на выходе через tx (к моменту очередного замыкания) получим величину, равную AQ (fj.

Такое устройство можно использовать совместно с обычным шаговым экстремальным регулятором с совме­

щенными пробными и рабочими шагами, который будет оптимизировать инерционный объект второго рода шаго­ вым образом с тактностыо tx Тг.

На рис. 7.6.3 показана работа такого экстремального регулятора. Хорошо видн1 тенденция процесса поиска.

Рассмотрим потери на рысканье для такого поиска. Для этого исследуем предельный цикл, который образует­ ся в районе экстремума в процессе поиска.

Рис. 7.6.2. Блок-схема элемента памяти.

Сначала

рассмотрим

симметричный случай, когда

q {х* +

а) =

q (х* а) =

qv где х* — экстремальное зна­

чение управляемого парамет­

 

 

ра. На рис. 7.6.4 показано

 

 

образование предельного цик­

 

 

ла в этом случае. Здесь чер­

 

 

ными

точками обозначены

 

 

значения q (х). Пусть в пре­

 

 

дельном цикле система при­

 

 

ходит в экстремум со значе­

 

 

нием

показателя

качества

 

 

Q (0) =

Q* + b (точка 1

на

 

 

рисунке). За время tx эта точ­

Рис. 7.6.3. Работа экстремаль­

ка приблизится к минималь­

ного

регулятора на инерцион­

ному значению и показатель

 

ном объекте.

качества

станет

равным

 

определяется так:

Q (tj) =

Q* + кЪ,

где параметр к

 

 

 

 

к — е

и

(7.6.9)

 

 

 

 

 

 

 

 

 

 

 

(см. точку 2 на рис. 7.6.4).

Для малых значений отношения tJT^ имеем

 

к ж 1 ~ £ .

(7.6.10)

После этого система перейдет в состояние х* а (точка 3 на графике) и через tx несколько приблизится к q (х*

а) — Qi +

(?*>

т. е. перейдет в точку 4, которая для

замыкания

цикла

должна находиться

на

одном уровне

с исходной точкой 1. Это означает, что

должно выпол­

няться

требование

 

 

 

 

 

 

 

b =

k{qx kb),

 

(7.6.11)

откуда

получаем

основной

параметр

цикла

 

 

 

6 =

<71______ ?i__

 

[(7.6.12)

 

 

 

1 + А'

h

 

 

 

 

 

 

2 —-ÿr-

 

 

 

 

 

 

 

1а

 

 

При малом tx/T2 имеем

Рис. 7.6.4. Симметричный предельный цикл.

Потери на рысканье будут складываться следующим образом:

h t

t

R =

^ [Ье~~Ъ + ?! — (?i — kb) e~r>] dt. (7.6.13)

 

о

Получаем после очевидных преобразований выражение для потерь на рысканье

 

В = Щ - ,

(7.6.14)

т. е. потери не зависят

от времени

tv

Теперь рассмотрим более общий случай, когда функция

качества несимметрична

(рис. 7.6.5):

 

q (х* — а) = ?! + Q*,

q (х* + а) = ?2 + Q* ф gi + Q*y q (**) = Ç*.

Пусть Ь — также исходное состояние в предельном цикле. Тогда, повторяя все предыдущие рассуждения, получаем для точки 5 уровень относительно экстремума, равный ?х — kqx + к2Ъ. Далее, точка 6 будет иметь уровень, рав­ ный к (qx kqx -f- к2Ь). И, наконец, точка 8 цикла будет располагаться на уровне д2 — [q2 к (qx kqx k2b)\k. Но для предельного цикла точка 8 должна иметь один

1\

 

у

Qm

4,\ \

s

/

 

b .. :

\

^

А t ------ г

 

Ч

9 Jiff

у

ù . &

\ [ ' J‘------------ --------------------

 

9гЧ+кЦ

 

Щ -kç+Apt>)

 

________ L

J

—-- и,

 

----------V--------------- и------------- ~

х*-а

х*

х *+а

 

Рис. 7.6.5. Несимметричный предельный цикл.

уровень с исходной точкой 1. Отсюда получаем условие замкнутости цикла:

Яг — 1?2 — &(?i — + к2Ь)] к = Ъ. (7.6.16)

Из этого уравнения легко определить основной параметр цикла:

и _

g2 + №qi

(7.6.17)

l -

(1+ &*)(! + *)

 

Это выражение естественно обобщает полученное выше (7.6.10). Потери на рысканье здесь получаются анало­ гичным образом. Читателю в порядке упражнения реко­ мендуется определить и проанализировать поведение по­ терь на рысканье для этого случая.

Теперь рассмотрим более общий случай, когда инер­

ционное

звено W2 (р) имеет порядок

больше единицы

(л > 1 ).

В этом случае

вместо

(7.6.5)

имеем

 

+ М ? " - " + ...

+ Ь„_,

+ Д? = Дq, (7.6.18)

где параметры &0, ., Ъп-Хпредполагаются известными, а начальные условия в момент t = 0 неизвестны, так

как в этом звене еще может не установиться переходный процесс от предыдущего воздействия. Поэтому, кроме значения AÇ (0) = 0, другие начальные условия следует считать неопределенными. При п = 1, Ъ0 = Т2 и Ъг = 1 получаем рассмотренный выше случай (7.6.4). Задача теперь заключается в том, чтобы, наблюдая значения функции AÇ (t), определить величину Ад, которая явля­ ется стационарным установившимся значением прира­ щения показателя качества:

 

lim AQ (t) = Ад.

 

(7.6.19)

 

t —*оо

 

 

 

Решение уравнения (7.6.18) можно представить в

форме

 

 

 

 

 

 

П

 

 

 

AQ(t) = Ag + 3

»

(7.6.20)

 

 

i=l

 

 

где +,

., Хп — корни характеристического уравнения

 

6<ЛП+ b1Г"1 +

+

+ 1 = 0.

(7.6.21)

Этикорни в данном случае предполагаются неположитель­

ными и

разными. Как

видно,

зная параметры Ь0,

Ьп_!, можно,

решая

это

уравнение,

определить

. ..,

Яп. Теперь можно

приступить к

определению

Ад. Для этого достаточно измерить значения AQ в п мо­

ментов

времени +

t2,

.,

tn

и

разрешить

следующую

систему из п +1-го

уравнения:

 

 

 

 

 

 

 

П

 

 

 

AÇ (0) = Дq 4- 2

аг —

 

 

 

 

 

i=l

 

 

 

 

 

 

 

п

 

 

 

AQ (к) = Д? +

S

 

 

 

 

 

 

 

п

 

(7.6.22)

 

 

 

 

 

 

 

 

Д(? (^п) = Д? +

2

ai ^ n

 

 

 

 

 

 

i=l

 

относительно А/, что и решает поставленную задачу. При аппаратурной реализации этого алгоритма сле­ дует в систему экстремального регулирования встроить

решатель указанной линейной системы уравнений. Опишем одну из решающихсхем.

Пусть £0, . . ., еп — невязки правых и левых частей уравнений (7.6.22):

 

П

аь

 

 

е0 = Дд +

2

 

 

 

г=1

 

 

 

 

п

 

 

 

ei =. А? +

2

aie~h ‘l -

А<?

(7-6.23)

 

i=l

 

 

 

e,v—Дд +

2

ase~Xitn

A Q (in).

 

 

i=l

 

 

 

Составим систему дифференциальных уравнений вида

 

dbq

а0б0,

 

 

dt

 

 

da1

= а1еь

 

 

~dt

(7.6.24)

 

dan

илеп,

 

 

dt

 

 

 

 

где параметры a 0)

-, а д должны быть выбраны таким

образом, чтобы эта система была устойчивой. Для этого

достаточно,

чтобы

все корни

р0,

уравнения

1 -

J L

1

î

1

 

 

Cto

 

 

 

 

 

1

------ü

g -M i

< f V i

(7.6.25)

 

 

ai

 

 

 

1

 

e - V n

e- X71/ n

 

имели бы отрицательную действительную часть. В этом случае стационарное решение системы (7.6.24) и даст искомое значение Дд. Для убыстрения решения можно параметры а 0, ., а п выбрать по модулю достаточно большими. В этом случае искомое значение Дд будет получено за короткий промежуток времени.