книги / Проектирование и исследование идентификационных моделей управляющих систем реального времени
..pdfления, показала следующее: наличие обратных отрицательных связей приводит к наличию отрицательных элементов как в матрице F (X, A),
так и в якобианах F1 (x), F2 (x).
Таким образом, сходимость данного метода не гарантируется, а следовательно, метод квазилинеаризации не может быть применен для совместного оценивания параметров и состояния.
2. Метод инвариантного погружения. В основе метода инвари-
антного погружения лежит преобразование многоточечной краевой задачи в одноточечную.
Данный метод менее зависим от начальных значений. Сходимость алгоритма идентификации к фактическим значениям параметров обеспечивается в довольно широком диапазоне начальных приближений. К недостаткам метода инвариантного погружения следует отнести существенные затраты времени на преобразования модели, что делает невозможным применение идентификации объектов управления в реальном времени. Существенным недостатком является зависимость сходимости алгоритма от выбора вспомогательных матриц.
3. Фильтр Калмана – Бьюси. Алгоритм фильтра Калмана позволяет в реальном времени построить оптимальную оценку состояния системы X(t) , основываясь на измерениях Y(t) , содержащих погрешности. Вектор измерений X(t) рассматривается в качестве многомерного выходного сигнала системы, при этом зашумленного, а вектор состояния Y(t) – неизвестный многомерный сигнал, подлежащий определению. Условием оптимальности построенной оценки является минимум среднеквадратичного отклонения оцененного значения от истинного.
В общем случае задача фильтрации по Калману формулируется для нелинейной нестационарной системы в условиях действия допущения. Модификация метода – фильтр Калмана – Бьюси применяется для линейного стационарного объекта, представленного в пространстве состояния при действующем белом шуме [10, 12].
dX(t) |
= AX(t) + BU(t) + N(t), |
(2.108) |
|
||
dt |
|
где X(t) – случайный марковский n-мерный процесс, задаваемый необходимой априорной информацией:
M {X} – математическое ожидание X(t) , M {X} = X0 ;
81
cov(X(t)) – ковариационная матрица X(t), cov(X(t)) = = M {(X(t) − M {X(t)})(X(t) − M {X(t)})T } = P0 ;
U(t) – измеряемое векторное входное воздействие, которое может
быть как детерминированной, так и случайной величиной;
N(t) – k -мерный вектор случайных воздействий, полагаемых процессами типа белого шума: M {N(t)} = 0 , cov(N(t)) =
= M {N(t)N(t)T } = Vδ (t− τ ),
где δ (t) – дельта-функция;
V – симметричная неотрицательно определенная матрица интенсивности белого шума N(t).
Процесс X(t) наблюдается с помощью измерителя, и вектор измеряемых координат определяется соотношением
Y(t) = CX(t) + ε (t) , |
(2.109) |
где ε (t) – p-мерный вектор шумов измерения, полагаемый случай-
ным |
процессом |
в |
виде |
белого |
шума: |
M {ε (t)} = 0 , |
cov(ε (t)) = M {ε (tε) (t)T } = Rδ |
(t − τ), |
|
|
|
||
где R – симметричная неотрицательно определенная матрица интен- |
||||||
сивности белого шума ε(t) . |
|
|
|
|
||
|
Процессы N(t) и ε(t) , а также X(t) и N(t) , X(t) и ε(t) полага- |
|||||
ются |
некоррелированными: M {N(t)ε(t)T } = 0, M {X(t)N(t)T } = 0, |
|||||
M {X(t)ε(t)T } = 0. |
|
|
|
|
|
|
|
Требуется построить линейную динамическую систему, обеспечи- |
|||||
вающую получение оптимальной оценки X* (t) |
вектора X(t) , если ошиб- |
|||||
ка оценивания задана: |
|
|
|
|
|
|
|
|
E(t) = X(t) − X* (t). |
|
(2.110) |
||
|
Критерием оптимальности является условие минимума ее квадра- |
|||||
тичной нормы: |
|
|
|
|
|
|
|
|
J (t) = E(t)E(t)T → min . |
|
(2.111) |
Задача фильтрации по Калману – Бьюси соответствует следующей структурной схеме (рис. 2.27).
82
Рис. 2.27. Структурная схема формирующего фильтра (ФФ)
иизмерителя при действии случайных возмущений
иналичии помех
При построении фильтра Калмана используется идея n-мерного наблюдателя (наблюдателя полного порядка), когда в качестве идентификатора состояния принимается математическая модель системы.
Фильтр Калмана осуществляет процедуру рекурсивного оценивания на основе наблюдений за входным и выходным сигналами объекта, где для уменьшения дисперсии оценок в алгоритм идентификатора вводится корректирующая обратная связь по выходу системы Y(t) .
Исходя из требования получения несмещенной оценки X* (t) уравнение фильтра имеет вид [10, 12]
dX* (t) |
= AX* (t) + BU(t) + L(Y(t) − CX* (t)), |
(2.112) |
|
||
dt |
|
где L – матрица коэффициентов усиления фильтра, обеспечивающая оптимальную в смысле минимальной дисперсии оценку состояния, которая определяется выражением
L = PCT R−1, |
(2.113) |
где P – ковариационная матрица ошибок оценивания, которая в случае стационарности процессов определяется решением алгебраического матричного уравнения Риккати:
AP + PAT − PCR−1CP + CVCT = 0. |
(2.114) |
В общем случае построение оптимального наблюдателя является решением задачи оптимального стохастического управления в условиях неполноты информации о векторе переменных состояния. Нахождение
83
матрицы коэффициентов усиления фильтра может быть реализовано методом аналитического конструирования регуляторов [10, 28, 29].
Фильтрация в случае выборочных измерений функции времени
k= 1, 2,… имеет следующий алгоритм:
1)По априорным значениям характеристик сигналов находится априорное значение ковариационной матрицы сигнала, основанное на k наблюдениях:
|
Q(k +1) = AP(k )AT + V. |
(2.115) |
2) |
Рассчитывается апостериорное значение ковариационной мат- |
|
рицы сигнала, основанное на k +1 наблюдениях: |
|
|
P(k +1) = Q(k +1) − Q(k +1)CT [CQ(k +1)CT + R]−1CQ(k +1). (2.116) |
||
3) |
Определяется матрица коэффициентов усиления |
L(k +1) , за- |
дающая вес поправок к начальным условиям на основе ковариационных матриц оценки состояний:
L(k +1) = Q(k +1)CT [CQ(k +1)CT + R]−1 = P(k +1)CT R−1. (2.117)
Величины P(k +1) , Q(k +1) , L(k +1) полностью определяются априорной информацией. Вычисления продолжаются до установления
стационарности |
фильтра, условием |
которой является равенство |
|||||||
|
P(k +1) − P(k ) |
|
≤ ξ |
или, соответственно, |
|
|
L(k +1) − L(k) |
|
≤ ξ , где ξ – за- |
|
|
|
|
||||||
данная точность. |
|
|
|
|
|
|
|||
|
После определения матрицы L(k) |
алгоритм работы фильтра Кал- |
мана – Бьюси сводится к последовательной обработке поступающих входных и выходных данных, при которой текущая оценка сигнала получается на основе корректировки ранее сделанной оценки с учетом информации, поступающей на вход фильтра в процессе наблюдения.
Фильтр Калмана – Бьюси требует дополнительной априорной информации, а именно вероятностных характеристик возмущений и помех. Данные требования являются избыточным для оценивания параметров и состояния детерминированного объекта.
Таким образом, исследования показали, что ни один из вышеприведенных методов оценивания параметров и состояния не является уни-
84
версальным. Каждый из рассмотренных методов обладает своими недостатками, ограничивающими область его применения.
Поэтому при идентификации моделей систем с ограничениями по измерениям необходимо разработать прикладной метод идентификации, простой в реализации, отвечающий требованиям сходимости, быстроте решения и ориентированный на конкретный класс моделей.
Для решения поставленной задачи предлагается следующий алгоритм идентификации [4, 27, 30]:
Объект описывается системой уравнений
|
V(i +1) = ФV(i) , |
|
|
(2.118) |
|
|
U(i) |
|
|
где |
V(i) – обобщенный вектор состояния, |
|
|
|
V(i) = X(i) |
, |
|||
|
|
|
|
|
Y(i)
U(i) – вектор входных воздействий; X(i) – вектор неизмеряемых координат; Y(i) – вектор измеряемых координат. Ф – матрица перехода.
Рассмотрим ограниченный класс модели, присущий многим системам автоматического управления. Согласно классификации, приведенной в работе [26], объекты данного класса могут быть представлены следующими типами звеньев:
–апериодическое звено;
–идеальное интегрирующее звено;
–реальное интегрирующее звено;
–реальное интегрирующее звено с суммарным входом;
–последовательное соединение апериодического звена 2-го порядка и интегрирующего звена.
Первые два типа звена являются полностью измеряемыми и поэтому могут быть оценены любым методом идентификации для полностью измеряемых объектов. Реальное интегрирующее и реальное интегрирующее звено с суммарным входом имеют одну неизмеряемую внутреннюю переменную. Объект, представляющий собой последовательное соединение апериодического звена 2-го порядка и интегрирующего звена, имеет две неизмеряемые переменные.
85
Матрицы перехода данных объектов имеют следующий вид:
– реальное интегрирующее звено
1 |
0 |
0 |
|
|
Ф = b |
a |
0 |
; |
(2.119) |
1 |
11 |
|
|
|
|
a21 |
|
|
|
0 |
1 |
|
|
|
– реальное интегрирующее звено с суммарным входом |
|
|||
1 |
0 |
0 |
|
|
|
a11 |
|
|
|
Ф = b1 |
0 |
; |
(2.120) |
|
|
a21 |
|
|
|
b2 |
1 |
|
|
– последовательное соединение апериодического звена 2-го порядка и интегрирующего звена:
|
|
|
1 |
|
0 |
|
|
0 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ф |
= b1 |
a11 |
|
|
0 |
0 . |
(2.121) |
|
|
|
|
0 |
a21 |
|
a22 |
0 |
|
||
|
|
|
|
|
0 |
|
a32 |
|
|
|
|
|
|
0 |
|
|
1 |
|
|||
Для звеньев 2-го порядка обобщенная матрица перехода имеет вид |
||||||||||
|
|
|
1 |
0 |
|
0 |
|
|
||
|
|
Ф = b |
a |
|
|
0 |
. |
|
||
|
|
|
|
1 |
11 |
|
|
|
|
|
|
|
|
|
|
a21 |
|
|
|
||
|
|
|
b2 |
a22 |
|
|||||
С учетом структуры матрицы перехода уравнение динамики |
||||||||||
(2.118) может быть записано в следующем виде: |
|
|||||||||
|
u(i +1) |
= u(i), |
|
|
|
|
|
|
|
|
|
|
= b1u(i) + a11x(i), |
|
(2.122) |
||||||
|
x(i +1) |
|
||||||||
|
y(i +1) |
= b u(i) + a |
21 |
x(i) |
+ a y(i). |
|
||||
|
|
2 |
|
|
|
22 |
|
|||
Система (2.122) после исключения из нее x(k) – неизмеряемой |
||||||||||
координаты примет вид |
|
|
|
|
|
|
|
|
||
1 |
( y(i + 2) − (a11 |
+ a22 ) y(i |
+1) + a11a22 y(i)) = u(i) |
(2.123) |
||||||
|
|
|||||||||
|
|
|||||||||
|
b1a21 + b2 (1− a11) |
|
|
|
|
|
|
|
|
86
или |
|
|
|
|
|
|
|
c1 y(i + 2) + c2 y(i +1) + c3 y(i) = u(i), |
(2.124) |
||||||
где |
|
|
|
|
|
|
|
c1 |
= |
|
|
1 |
, |
(2.125) |
|
|
|
|
|||||
b1a21 |
+ b2 (1− a11 ) |
||||||
|
|
|
|
||||
c2 |
= |
|
−(a11 + a22 ) |
, |
(2.126) |
||
|
b1a21 |
+ b2 (1− a11) |
|||||
|
|
|
|
|
|||
c3 |
= |
|
|
a11a22 |
. |
(2.127) |
|
b1a21 |
+ b2 (1− a11 ) |
||||||
|
|
|
|
После наблюдений над объектом формируются матрицы измерений входных U(i) и выходных Y(i) переменных, уравнение (2.124)
разрешается относительно коэффициентов c1, c2 , c3 .
По известным коэффициентам c1, c2 , c3 определяются коэффици-
енты матрицы переходов:
– реальное интегрирующее звено
|
|
= |
1 |
|
|
|
|
|
|
|
|
|
|
|
||||
b1a21 |
|
, |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
c1 |
|
|||||||||||||
|
+ a22 |
|
= − |
c2 |
|
|
|
|
||||||||||
a11 |
|
, |
|
|
(2.128) |
|||||||||||||
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
c1 |
|
|||||
|
|
|
|
|
|
|
c3 |
|
|
|
|
|
|
|
|
|||
a |
a |
|
= |
; |
|
|
|
|
||||||||||
|
|
|
|
|||||||||||||||
11 |
22 |
|
|
|
|
|
c1 |
|
||||||||||
– реальное интегрирующее звено с суммарным входом |
|
|||||||||||||||||
|
|
+ b2 (1− a11) = |
1 |
|
|
|||||||||||||
b1a21 |
, |
|
||||||||||||||||
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
c1 |
|
||
|
+ a22 |
= − |
c2 |
|
|
|
|
|
||||||||||
a11 |
, |
(2.129) |
||||||||||||||||
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
c1 |
|
||||||
|
|
|
|
|
c3 |
|
|
|
|
|
|
|
|
|
||||
a a |
|
= |
. |
|
||||||||||||||
|
|
|
||||||||||||||||
11 |
22 |
|
|
|
c1 |
|
87
Коэффициент b2 представляет собой реакцию системы на входное
воздействие на первом интервале дискретности, поэтому определить его не составляет труда.
Таким образом, в результате идентификации определяются коэффициенты матрицы перехода a11, a22 , b1a11 или b2 , a11, a22 , b1a11.
Это означает, что предложенный алгоритм идентификации позво-
ляет определить постоянные времени a = |
1 |
, |
a = |
1 |
и общий коэф- |
||||||
|
|
||||||||||
|
|
|
|
11 |
T1 |
|
22 |
T2 |
|
||
|
|
|
|
|
|
|
|
|
|
||
фициент усиления K |
Σ |
= K K |
|
= |
b1a21 |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
1 |
2 |
|
a11 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
||
Для звеньев 3-го порядка, в которых неизмеряемыми являются две |
внутренние переменные x1, x2 , с учетом структуры матрицы перехода уравнение динамики (2.118) может быть записано в следующем виде:
u(i +1) = u(i), |
|
||||||||||||
|
(i |
+1) = b1u(i) + a11x1(i), |
|
||||||||||
x1 |
(2.130) |
||||||||||||
|
(i |
+1) = a21u(i) + a22 x2 (i), |
|||||||||||
x2 |
|
||||||||||||
y(i +1) = a x (i) + y(i). |
|
||||||||||||
|
|
|
|
|
32 |
2 |
|
|
|
|
|
||
Выражение (2.130) после исключения из него неизмеряемых коор- |
|||||||||||||
динат имеет вид |
|
|
|
|
|
|
|
|
|
|
|
|
|
c1 y(i + 3) + c2 y(i + 2) + c3 y(i +1) + c4 y(i) = u(i), |
(2.131) |
||||||||||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
c1 |
= |
|
1 |
, |
|
|
(2.132) |
|||
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
b1a21a32 |
|
|||||
|
|
c = − |
a11 + a22 +1 |
, |
|
(2.133) |
|||||||
|
|
|
|
|
|||||||||
|
|
|
2 |
|
|
|
|
b1a21a32 |
|
||||
|
|
|
|
|
|
|
|
|
|||||
|
c |
|
= |
a11a22 + a11 + a22 |
, |
(2.134) |
|||||||
|
|
|
|
|
|||||||||
|
3 |
|
|
|
|
b1a21a32 |
|
||||||
|
|
|
|
|
|
|
|
||||||
|
|
|
c = − |
a11a22 |
. |
(2.135) |
|||||||
|
|
|
|
||||||||||
|
|
|
4 |
|
|
|
b1a21a32 |
|
|||||
|
|
|
|
|
|
|
|
|
88
После наблюдений над объектом формируются матрицы измерений входных U(i) и выходных Y(i) переменных, уравнение (2.122)
разрешается относительно коэффициентов c1, c2 , c3 , c4 .
По известным коэффициентам c1, c2 , c3 , c4 определяются коэффициенты матрицы переходов
|
|
|
|
|
= |
1 |
, |
|
|
|
|
|
||
b1a21a32 |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
c1 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
c |
||||
a11 + a22 |
+1 = − |
|
2 |
, |
|
|||||||||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
c1 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
c3 |
|
a a |
|
+ a |
|
+ a |
|
= |
, |
|||||||
|
|
|
||||||||||||
|
11 22 |
|
|
11 |
22 |
|
|
c1 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a a |
22 |
= − |
c4 |
. |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
||||||||
|
11 |
|
|
|
c1 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
– реальное интегрирующее звено с суммарным входом
|
|
|
|
|
|
|
|
|
1 |
|
|
b1a21 + b2 |
(1− a11 ) = |
, |
|||||||||
|
|||||||||||
|
|
|
|
|
|
|
|
|
c1 |
||
|
|
+ a22 |
= − |
c2 |
|
|
|
||||
a11 |
, |
||||||||||
|
|||||||||||
|
|
|
|
|
|
|
c1 |
||||
|
|
|
|
c3 |
|
|
|
|
|
||
a a |
= |
. |
|||||||||
|
|||||||||||
|
11 |
22 |
|
|
c1 |
(2.136)
(2.137)
Система уравнений (2.137) разрешается относительно a11, a22 , b1a21a32 , т.е. так же, как и для звеньев 2-го порядка опреде-
ляются постоянные времени a = |
1 |
, |
a |
|
= |
1 |
и общий коэффициент |
|
22 |
|
|||||
11 |
T1 |
|
|
|
T2 |
|
|
|
|
|
|
|
|
усиления KΣ = K1K2 K3 = b1a21a32 .
a11a22
Таким образом, предложенный подход к решению задачи идентификации с неизмеряемыми координатами позволяет получить простой и практически реализуемый алгоритм для идентификации объектов данного класса.
89
2.7. ПРИМЕНЕНИЕ НЕЙРОСЕТЕВОГО ПОДХОДА В ПОСТРОЕНИИ ИДЕНТИФИКАЦИОННЫХ МОДЕЛЕЙ ОБЪЕКТОВ В УПРАВЛЯЮЩИХ СИСТЕМАХ РЕАЛЬНОГО ВРЕМЕНИ
Нейронные сети – раздел искусственного интеллекта, в котором для обработки сигналов используются явления, аналогичные происходящим в нейронах живых существ [31].
Основными функциями искусственной нейронной сети (ИНС) являются:
–функция аппроксимации, актуальная при решении задач моделирования, идентификации и обработки сигналов;
–функция классификации и распознавания образов, актуальная, например, при решении задач диагностики состояния объекта;
–функция прогнозирования, актуальная при оценке будущего поведения системы по имеющейся последовательности ее предыдущих состояний;
–функция идентификации и оценивания, актуальная при решении задач управления динамическими процессами;
–функция ассоциативного управления.
Следует отметить, что приведенные функции ИНС полностью соответствуют основным задачам идентификации: обработке экспериментальных данных (функция аппроксимации); структурной идентификации (функция классификации и распознавания образов); параметрической идентификации (функция идентификации и оценивания и функция аппроксимации).
Внастоящее время проблема практического использования ИНС
вСАУ решена лишь отчасти. Недостаточно полно освещены вопросы применения нейрорегуляторов в системах автоматического управления, а также отсутствуют формальные методики построения нейросетевых моделей объектов управления различной сложности. Имеются примеры применения рекуррентных и нерекуррентных ИНС для решения лишь отдельных частных задач данного класса. В работах [33–35] рассмотрены проблемы разработки и исследования нейросетевых алгоритмов управления стационарными и нестационарными объектами; вопросы синтеза адаптивного нейрорегулятора для управления нелинейным мно-
госвязным объектом и идентификации электромеханических систем с использованием ИНС; предприняты попытки решить в комплексе про-
90