- •Определение систем в рамках теоретико - множественного подхода. Математические модели простых динамических систем.
- •Принцип разделения в цифровых системах управления. Обоснование для линейно – квадратичной задачи управления в дискретном времени.
- •Решение задачи линейного программиро-вания на основе симплекс- метода.
- •Общая постановка задачи оптимальной фильтрации и методика ее решения.
- •Кибернетический подход к описанию систем. Понятия об управлении, системе управления, структурные схемы процесса управления.
- •Теорема о нормальной корреляции и ее следствия.
- •Классификация систем управления. Основ-ные этапы синтеза сложных систем управления.
- •Метод анализа иерархий.
- •Устойчивость динамических систем. Теорема Ляпунова в непрерывном и дискретном времени.
- •Иерархическая схема управления сложным объектом. Основные принципы иерархического управления.
- •Управляемость и наблюдаемость систем управления.
- •Решение задачи о пошаговом распределении ресурсов (динамического программирования) на основе принципа оптимальности Беллмана.
- •Постановка и пример задачи автоматичес-кого управления для непрерывных динамичес-ких систем. Задачи Больца, Лагранжа, Майера.
- •Метод анализа иерархий.
- •Общее решение задачи автоматического управления без ограничений для детерминиро-ванной системы на основе методов вариации-онного исчисления.
- •Цифровая схема управления (общая схема преобразований). Эквивалентность цифровой и непрерывной систем.
- •Решение линейно – квадратичной задачи нахождения оптимального управления для динамической системы в непрерывном времени на основе методов вариационного исчисления.
- •Управление ресурсами и задача линейного программирования. Примеры, геометрическая интерпретация.
- •Решение задачи линейного программиро-вания на основе симплекс – метода.
- •Теорема о нормальной корреляции и ее следствия.
- •Решение задачи линейного программиро-вания на основе симплекс – метода
- •2.Общая постановка задачи оптимальной фильтрации и методика ее решения.
- •Линейный регулятор. Пример решения задачи лк – управления.
- •2. Синтез структуры сложной системы управления. Метод ветвей и границ.
- •Принципы координации в задачах управления сложными объектами.
- •2. Решение задачи о пошаговом распределении ресурсов (динамического программирования) на основе принципа оптимальности Беллмана.
- •Кибернетический подход к описанию систем. Понятия об управлении, системе управления, структурные схемы процесса управления.
- •Решение линейно – квадратичной задачи нахождения оптимального управления для динамической системы в непрерывном времени на основе методов вариационного исчисления.
- •Метод анализа иерархий.
- •2. Цифровая схема управления (общая схема преобразований). Эквивалентность цифровой и непрерывной систем.
- •Общее решение задачи автоматического управления без ограничений для детерминированной системы на основе методов вариационного исчисления.
- •2. Оптимальное управление в стохастических системах. Принцип разделения в непрерывных стохастических системах.
- •Принципы координации в задачах управления сложными объектами.
- •2. Уравнения фильтра Калмана в дискретном времени. Пример постановки задачи стохастического управления (управление нефтехранилищем).
- •Синтез структуры сложной системы управления. Метод ветвей и границ.
- •2. Принцип максимума Понтрягина и решение задачи о быстродействии при переводе материальной точки в начало координат.
- •Линейный регулятор. Пример решения задачи лк – управления.
- •2. Решение задачи о пошаговом распределении ресурсов на основе принципа оптимальности Беллмана.
- •Принцип максимума Понтрягина и решение задачи о быстродействии (задача о «лифте»).
- •2. Применение микропроцессоров и микро – эвм в цифровых системах управления.
2. Решение задачи о пошаговом распределении ресурсов на основе принципа оптимальности Беллмана.
Для исследования процедур, допускающих принятие решений по шагам или этапам, используется динамическое программирование. Эффективное применение нашел принцип оптимальности Беллмана, который послужил основой метода динамического программирования. Появление метода динамического программирования связано с исследованием процессов управления, в которых фактор времени рассматривался явно. Однако он может применяться и в таких задачах, где фактор времени вообще не фигурирует. Метод может быть эффективно применен в следующих ситуациях.
Постановка задачи интерпретируется как пошаговый (поэтапный) процесс принятия решения.
Задача должна быть определена на каждом шаге и ее структура не должна меняться с изменением числа шагов.
На каждом k-ом шаге должен быть задан параметр, характеризующий состояние системы, называемый параметром состояния
На каждом k-ом шаге имеется одно или несколько значений переменной, называемой управляющей переменной.
Оптимальные значения управляющей переменной зависят от параметров состояния системы на предыдущем шаге.
Решение для k-шаговой задачи получается из решения для (k-1)-шаговой путем добавления k-го шага и использования результата, полученного для (k-1) шагов.
Если эти условия выполнены, то решение m-шаговой оптимизационной задачи может быть сведено к решению последовательности задач: сначала одношаговой, затем двухшаговой, трехшаговой и далее, вплоть до m-шаговой.
Задача о двух предприятиях. Пусть имеется система из двух предприятий , описываемых в начале каждого года состояниями, определяющими имеющийся объем средств и приносимый доход. Изначально дано определенное количество средств (ресурсов) , которые мы в течение m лет должны распределить между двумя предприятиями. Пусть X средства, вкладываемые в первое предприятие, тогда за год получается доход f(X), при этом вложенные средства частично тратятся, так что к концу каждого года от них остается в деле (в виде денег, зданий, машин и т.п.) какая-то часть . Аналогично средства , вложенные во второе дело, приносят доход и уменьшаются до уровня . По истечению первого года (шага), средства оставшиеся от заново перераспределяются и т.д. Таким образом, можно сформулировать следующую постановку задачи.
Состояние системы перед i-ым шагом характеризуется параметром K – количеством средств, сохранившихся после предыдущих i-1 шагов. Управление на каждом шаге состоит в том, что выбирается , .
Общий доход на i-ом шаге определяется как .
Под влиянием управления на i-ом шаге система переходит в состояние K’ . Требуется найти управление за m шагов, при котором суммарный доход, приносимый обоими предприятиями, максимизируется , .
Поставленную задачу можно решать по разному: или строить сразу оптимальное управление u, или строить его постепенно, шаг за шагом, оптимизируя на каждом этапе расчеты только на один шаг вперед. Однако такое пошаговое управление не может оптимизироваться независимо от других, то есть без учета всех последствий принятых решений на всех будущих шагах. Из этого правила есть исключение: последний шаг, так как его можно планировать без оглядки на будущее. Другими словами, на последнем шаге используется такое управление, чтобы он принес наибольшую выгоду. Спланировав этот последний шаг, можно к нему пристраивать предпоследний, затем еще один и т.д. Поэтому процесс динамического программирования разворачивается от конца к началу. При этом для последнего шага вводится условное оптимальное управление с функцией условно оптимального выигрыша на последнем шаге .
. Далее на предпоследнем шаге определяется
. Аналогично вводится условно оптимальное управление и условный выигрыш на всех шагах, вплоть до первого . В результате получается совокупность условно оптимальных управлений .Тем самым, на каждом шаге ищется такое управление, которое обеспечивает оптимальное продолжение относительно достигнутого в данный момент состояния. Если условное управление на каждом шаге найдено, то можно теперь найти не условное, а оптимальное управление для известного начального состояния системы . Для этого надо пройти все состояния в прямом направлении (из начального состояния в конечное). При этом вычисляются величины
– состояние после первого шага.
, – состояние после второго шага.
= – состояние после i-го шага.
Соответствующая многошаговая цепочка состояние-управление выглядит следующим образом:
Величина будет представлять количество средств, оставшихся после последнего шага, а – доход, полученный при оптимальном управлении на m-ом шаге.Исходя из вышеизложенного, основное функциональное уравнение динамического программирования может быть записано в виде ,
– частный выигрыш на i-ом шаге; – выигрыш после i-го шага с учетом изменения состояния системы. Таким образом, процесс оптимизации управления методом динамического программирования при многошаговом развитии системы (в дискретном времени) осуществляется в два прохода: от конца к началу с нахождением совокупности условно-оптимальных управлений и условных выигрышей на всех шагах; от начала к концу при известном начальном состоянии, что позволяет в итоге определить уже не условное, а реально-оптимальное управление.
Контрольно-измерительный материал № 20