Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ntv_6.pdf
Скачиваний:
34
Добавлен:
11.04.2015
Размер:
8.49 Mб
Скачать

РАЗВИТИЕ МЕТОДОВ РОБАСТНОГО УПРАВЛЕНИЯ В ЗАДАЧАХ АДАПТАЦИИ

А.А. Бобцов, С.А. Холунин

1. Введение

Всплеск популярности теории адаптивных систем имевший место в 70-х годах, постепенно начал угасать к середине 90-х. Темы, связанные с решением задач адаптивного управления перестали широко освещаться на отечественных и международных конференциях, финансирование проектов по этой некогда популярной тематике, постепенно стало уменьшаться. К причинам такого регресса следует отнести, в первую очередь, плохую реализацию на практике имеющихся схем адаптивного управления. Громоздкие, сложные и не всегда помехоустойчивые математические законы управления оказались “не по вкусу” инженерам-практикам. Возникло, как это часто бывает, рассогласование теоретических подходов с практикой. Решение проблемы понимания должно на этот раз исходить именно от математиков и специалистов, занимающихся теорией управления. Первые шаги в этом направлении были сделаны, в том числе, отечественными учеными [1,2], по огрублению алгоритмов адаптации по отношению к внешним неучтенным факторам. Дальнейший уход от алгоритмов адаптации интегрального типа к алгоритмам сигнальной адаптации [1,2], позволил значительно сократить размерность законов управления. Параллельно достижению этих результатов идет развитие методов адаптивного управления по выходу [3,4]. Получен ряд интересных схем и в том числе схем с огрублением для внешних возмущений, но проблема громоздкости и сложности все еще имеет место. К сегодняшнему дню получен ряд оптимальных подходов адаптивного управления по выходу заключающий в себе стратегию робастного управления [5-7].

Предлагаемая работа представляет собой развитие методов робастного управления в задачах адаптации по выходу [5-7]. В статье предлагаются новые схемы управления позволяющие получать менее сложные и громоздкие по размерности алгоритмы.

2. Постановка задачи

Рассмотрим неопределенную систему вида [3-5]

&

+ bω(t)

T

θ+ bu ,

(1)

x = Ax

 

y = cT x ,

 

 

(2)

где x = x(t) - вектор переменных состояния;

y - регулируемая переменная; u - сигнал

управления;

матрица A - гурвицева; ω(t)

- известная функция (регрессор); θ Rq -

вектор неизвестных постоянных параметров.

Наряду с моделью (1), (2) также будем рассматривать математическую модель

“вход-выход” [3,5]

 

y(t) =

B( p)

[ω(t)T θ+ u],

(3)

 

 

A( p)

 

где p = d / dt - оператор дифференцирования и полином

A( p) - асимптотически

устойчивый.

Сформулируем цель управления, как решение задачи синтеза алгоритма,

обеспечивающего при любых начальных состояниях объекта выполнение условия

 

lim

 

y(t)

 

≤ ε ,

(4)

 

 

t→∞

 

 

 

 

 

 

 

 

где ε - любое произвольно малое число.

 

223

 

 

 

 

 

 

 

3. Синтез алгоритма адаптации

 

Выберем передаточную функцию W ( p) , удовлетворяющую соотношению

W ( p) = ( p + α)H ( p) ,

(5)

где α -

любая положительная константа. Очевидно, что при таком представлении

передаточная функция W ( p) является асимптотически устойчивой. Так как

H ( p) =

 

1

 

W ( p) ,

 

p + α

 

 

 

 

 

 

 

то модель (3) может быть переписана в виде

 

y =

1

 

[ϖT θ+ u ]+ δ

(6)

p + α

 

 

 

 

 

 

 

или

 

 

 

T

θ+ u + δ ,

(7)

y = −α y + ϖ

&

 

 

 

 

 

 

 

где δ(t)

- экспоненциально затухающая функция времени, вызванная

ненулевыми

начальными условиями; δ = δ& + αδ - экспоненциально затухает; функция ϖ =W ( p)ω и

u = W ( p)u .

(8)

Введем новую переменную

 

ϕ = ϖT θ+

 

,

(9)

δ

тогда модель (7) примет вид

(10)

y = −α y + ϕ+ u .

&

 

 

 

Пусть новый закон управления u

имеет вид

u = −ϕˆ ,

(11)

где ϕˆ - текущая оценка функции ϕ . Тогда закон управления будет записан следующим

образом

 

u = −W ( p)1 ϕˆ .

(12)

Проблема в синтезе алгоритма (12) - это:

реализация операции дифференцирования;

достаточно точная оценка функции ϕ .

Поэтому требуется выстроить такую схему оценки функции ϕ , чтобы:

(ϕ − ϕˆ ) ε , где ε - малое число, такое что условие (4) будет удовлетворено;

для нахождения производных от ϕˆ была использована реализуемая вычислительная

процедура.

Временно предполагая, что функция ϕ подлежит измерению, выберем

следующий алгоритм оценки

ξ&1 = γσξ2 ,

ξ&2 = γσξ3 (13)

,

...

ξ&m = γσ(k1ξ1 k2ξ2 ... kmξm + k1ϕ),

ϕˆ = ξ1 ,

(14)

где число m определяет порядок системы (13) и выбирается таким образом, чтобы закон управления (12) был бы реализуем; постоянная γ > 0 ; положительная функция σ

является функцией той же скорости роста что и

 

&

 

2

(т.е.

 

&

 

2

/ σ < ∞), а все ее

m 1

 

 

 

 

 

ϕ

 

 

 

ϕ

 

 

производные известны или подлежат измерению; коэффициенты ki рассчитываются из соображений асимптотической устойчивости модели (13).

224

Теорема 1. Алгоритм оценки (13), (14) позволяет при увеличении параметра γ

максимально приблизить оценку ϕˆ

к функции ϕ .

 

 

Доказательство. Перепишем модель (13), (14) в векторно-матричной форме

ξ& = γσ(Γξ + dk ϕ) ,

 

 

 

 

 

 

(15)

 

 

1

 

 

 

 

 

 

 

ϕˆ = hT ξ,

 

 

 

 

 

 

 

 

(16)

 

0

1

0 ...

0

 

0

1

 

0

0

1 ...

0

 

0

0

 

0

0

0 ...

0

 

 

 

 

 

где Γ =

 

, d = 0

и h = 0 .

 

M

M

M O

M

 

 

 

 

 

 

 

M

 

M

 

 

 

k2

k3 ...

 

 

 

 

 

 

k1

km

1

0

Введем в рассмотрение вектор отклонений η = hϕ − ξ, тогда для его производной получим

η= hϕ − γσ(Γ(hϕ − η) + dk1ϕ) = hϕ+ γσΓη− γ σ(dk1 + Γh)ϕ.

(17)

& &

&

 

Так как dk1 = −Γh (проверяется подстановкой), то

η& = hϕ& + γσΓη,

где Γ - гурвицева.

Для доказательства сходимости η в любую заданную область, рассмотрим

функцию Ляпунова вида

 

 

 

 

 

 

 

 

 

 

 

 

V = ηT Pη,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(18)

где матрица P = PT > 0 , такая что

 

 

ΓT P + PΓ ≤ −λP < 0 .

 

 

 

 

 

 

 

 

 

 

(19)

Дифференцируя (18), получаем

 

V = γση (Γ

T

P + PΓ)η+ 2η Phϕ ≤ −λγση Pη+

&

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

T

&

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

T

Pη+μ

1

σ

1

 

&

 

 

2

,

 

(20)

 

 

 

 

 

ση Phh

 

 

 

 

 

 

ϕ

 

 

 

 

 

где положительное число μ такое что

 

&

 

 

T

 

Pη+ μ

1

σ

1

 

 

ϕ

 

 

2

,

 

(21)

 

 

 

 

 

 

 

V

≤ −λγση

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

&

 

 

 

 

 

 

 

а постоянная λ > 0 .

При выводе соотношения (20) было использовано легко проверяемое неравенство

(μσ)1 (μσa b)2 0 ,

откуда следует, что

2ab ≤ μσa2 +(μσ)1 b2

T

&

 

 

 

 

 

 

где a = η Ph и b = ϕ .

 

 

 

 

 

 

 

 

 

&

 

2

 

Поскольку функция σ

является функцией той же скорости роста что и

 

, то из

ϕ

 

 

выражения

(21) следует, что вектор отклонений η = hϕ − ξ ограничен и

все его

переменные могут быть сведены к любому малому компактному множеству, за счет увеличения параметра γ .

Для доказательства основного положения представленной теоремы, а именно максимального приближения ϕˆ к ϕ при увеличении параметра γ , умножим вектор

отклонений η = hϕ − ξ слева на hT . Тогда в силу структуры матрицы h , получаем: hT η = ϕ − hT ξ = ϕ − ϕˆ

225

и при соответствующих γ

 

(достаточно больших) обеспечивается сходимость в любую

малую окрестность.

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

Замечание 1.

Следует

отметить, что в

качестве

мажоранты

можно

использовать функцию

 

&

 

2

 

& T &

&

 

 

 

, т.е.:

 

 

 

 

&

 

 

ϖ

 

 

= ϖ ϖ , так как сигнал ϕ(t) пропорционален

ϖ(t)

 

 

ϕ(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

&

< ∞ . В тоже

время, в

законе управления

(12) будут

использоваться

только

 

 

 

 

&

 

 

ϖ(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

измеряемые производные от ϖ вплоть до m-ой, что в свою очередь, позволяет выбирать мажоранту σ указанным способом.

Замечание 2. Если функция ϕ&(t) имеет неограниченный рост во времени, то в силу неравенства (21), следует, что при ϕ&(t) → ∞ переменная η → 0 и, следовательно,

ϕˆ → ϕ .

Замечание 3. Если регрессор ω(t) - ограничен, то в качестве мажоранты σ

можно принять любую положительную константу.

Замечание 4. Отметим, что реализация мажоранты σ с использованием алгоритма приведенного в замечании1 для некоторых задач может оказаться громоздким, т.к. предполагает формирование вектора ϖ& каждая компонента которого находится из соотношения ϖ& i = pW ( p)ωi . Во избежание громоздких процедур расчета

мажоранты, целесообразно использовать алгоритм вида:

σ = pW ( p)[ωT ω+β],

где β > 0 .

Теперь построим реализуемую схему алгоритма оценки (13), (14) следующего

вида

ξ&

 

= γσξ

,

 

 

&1

2

,

 

ξ

2

= γσξ

(22)

 

 

3

 

...

 

 

 

 

 

 

 

&

 

ς = γσ(k2ξ2 ... kmξm + k1αy) − γσk1 y,

 

 

&

 

 

 

 

ξm = ς + γσk1 y .

(23)

Система (22), (23) содержит переменные, которые могут быть измерены или рассчитаны. Возможность применения указанного алгоритма представлена в следующей теореме.

Теорема 2. Алгоритм оценки вида (22), (23) эквивалентен алгоритму (13), (14). Доказательство. Из уравнения (10) находим

ϕ = y + α y u .

(24)

 

 

&

 

 

 

Подставляя последнее уравнение в выражение (13), получаем

 

ξ&

 

= γσξ

 

,

 

&1

 

2

,

 

ξ

 

= γσξ

(25)

 

2

 

3

 

...

 

 

 

 

ξ&m = γσ(k1ξ1 k2ξ2 ... kmξm + k1 ( y& + αy u)),

учитывая, что u = −ϕˆ ,

получаем

226

ξ&1 = γσξ2 ,ξ&2 = γσξ3 ,

...

ξ&m = γσ(k2ξ2 ... kmξm + k1 ( y& + αy)).

Введем в рассмотрение новую переменную

ς = ξm − γσk1 y .

Тогда дифференцируя (27) для системы уравнений (26), получаем

ξ&1 = γσξ2 ,ξ&2 = γσξ3 ,

...

ς& = γσ(k2ξ2 ... kmξm + k1αy) − γσ&k1 y, ξm = ς + γσk1 y .

4. Пример

(26)

(27)

(28)

(29)

Для иллюстрации работоспособности предложенной в работе схемы управления,

рассмотрим числовой пример. Пусть модель (1), (2) имеет вид:

(30)

x1 = x2 ,

&

(31)

x2 = −x1 2x2 + 3sin 4t +u ,

&

 

y = x1 ,

(32)

где вектор неопределенных параметров θ = 3, регрессор ω= sin 4t , u

- искомое

управление.

Для объекта (30)-(32) рассмотрим математическую модель математическую

модель “вход-выход” вида (3)

 

 

 

 

 

y(t) =

 

 

1

 

 

 

 

[3sin 4t + u].

 

 

 

(33)

( p +

1)2

 

 

 

 

 

 

 

 

 

 

 

Выберем

 

передаточную

функцию

W ( p) =

1

 

, тогда выражение (33) в

 

p +1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

соответствии с результатами раздела 3, примет вид (см. уравнение (10)):

y = −y + ϕ+ u ,

 

 

 

 

(34)

&

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где функция ϕ =

 

+W ( p)3sin 4t .

 

 

 

 

δ

 

 

 

 

Выбирая новый закон управления u

как

 

 

 

u = −ϕˆ ,

 

 

 

 

 

 

 

 

 

 

 

 

(35)

получаем для истинного закона управления

 

 

 

 

 

 

 

 

1

 

 

 

&

 

 

 

 

u = −W ( p)

ϕˆ

= −( p +1)ϕˆ

= −ϕˆ − ϕˆ .

 

 

 

(36)

 

 

 

 

 

 

Для реализации оценки ϕˆ , воспользуемся алгоритмом (22), (23):

ξ&

= γξ

 

,

 

 

 

 

 

 

 

 

 

 

(37)

&1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

ς = γ(2ξ2 + y),

 

 

 

 

 

ξ2

= ς + γy ,

 

 

 

 

 

 

 

(38)

ϕˆ = ξ1 ,

 

 

 

 

 

 

 

 

 

 

 

 

(39)

где коэффициенты

k2 = 2 , k1 =1 и в силу ограниченности регрессора ω−sin 4t (см.

замечание 3), мажоранта σ =1.

 

 

 

 

Запишем закон управления в обозначениях алгоритма оценки (37)–(39)

 

 

 

 

&

= −ξ1 − γ(ς + γy) .

 

 

 

(40)

u = −ϕˆ − ϕˆ

 

 

 

227

и проведем компьютерное моделирование. Результаты моделирования для различных значений параметра γ представлены на рис. 1, рис. 2 и демонстрируют уменьшение

значения выходной переменной с ростом параметра γ .

Рис. 1. График переходного процесса по переменной y(t) при γ = 5

Рис. 2. График переходного процесса по переменной y(t) при γ = 20 .

Заключение

Работа представляет собой развитие методов робастного управления в задачах адаптации по выходу. В статье предлагаются схемы управления позволяющие получать, как менее сложные и громоздкие по размерности алгоритмы и алгоритмы. Структура регулятора является линейной и содержит нестационарный фильтр, параметры которого выбираются из требований предъявляемых к выходной переменной объекта.

Литература

1.Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М. Наука, 1981.

2.Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990.

3.Никифоров В.О., Фрадков А.Л. Схемы адаптивного управления с расширенной ошибкой. Обзор // Автоматика и телемеханика. 1994. №9.

4.Андриевский Б.Р., Фрадков А.Л., Избранные главы теории автоматического управления с примерами на языке MATLAB. СПб.: Наука, 1999.

5.Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными механическими системами. СПб.: Наука, 2000.

6.Никифоров В.О. Робастное управление линейным объектом по выходу // Автоматика и телемеханика. 1998. № 9.

7.Никифоров В.О. Адаптивное и робастное управление с компенсацией возмущений. Диссертация на соискание ученой степени доктора технических наук. СПб., 2001.

228

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]