Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод+з+практ+СМПР_мой-1 (2).doc
Скачиваний:
45
Добавлен:
16.02.2016
Размер:
13.5 Mб
Скачать
  1. Принцип оптимальности Беллмана

Принцип оптимальности Беллмана ставит вопрос о том, что такое оптимальность отдельного элемента системы с точки зрения оптимальности всей системы. Принимая решение на отдельном этапе, мы должны выбирать управление на этом этапе с прицелом на будущее, т. к. нас интересует результат в целом за все шаги. Беллман предложил рассматривать величину выигрыша от го шага и до конца, еслиый шаг начинается с некоторого состояния. Такую величину называютусловным оптималь­ным выигрышем .

Тогда, принимая решение на шаге, мы должны выбратьтак, чтобы условный оптимальный выигрыш был максимальным отшага и до конца.

Определение: оптимальность в малом понимается через оптимальность в большом.

Любой процесс имеет где-то окончание, т. е. имеет горизонт планирования. Тогда последний этап «не имеет будущего». Вот именно его можно оптимизировать только из условий данного этапа. После этого приступают к оптимизации го этапа. Выбирают такое, чтобы при применении этогоего внести в управление последнего шага. При этом мы задаём состояние, с которого начинаетсяый шаг. Поэтому функциюназываютусловным оптимальным выигрышем. Таким образом, процесс оптимизации разворачивается от конца к началу, и начальное состояние становится известно. Принцип Беллмана нашёл применение в методе программно-целевого планирования (любое действие планируется некоторым проектом).

    1. Задача о наборе высоты и скорости летательного аппарата.

Летательный аппарат находится на высоте и летит со скоростью. Необходимо перевести его на высотусо скоростью. ПричёмРазобьём участок отдоначастей:

Известен расход горючего при переводе системы на прии напри. Таким образом, из каждого состояния есть лишь два управления.

За каждое такое управление получим расход горючего (выигрыш и потери). Суммарные потери равны сумме всех выигрышей на всех шагах. Дойдя до конца и получив 22, мы получим минимальную величину потерь горючего.

Любая задача, сводится к поиску минимального пути в графе и решается методом динамического программирования.

    1. Функциональное уравнение Беллмана.

Назовём состоянием системы вектор координат: . В некоторых задачах состояние – одна величина. Тогда работу системы можно представить как движение в фазовом пространстве – пространстве состояний. Назовёмшаговым управлением – управление на ом шаге. Рассмотрим процесс управления системой зашагов. Функцияназываетсявыигрышем на i-ом шаге. Здесь состояние передым шагом, ауправление наом шаге.

Величина должна быть известна до начала динамического программирования. Если состояние передым шагом былои мы приняли какое-то управление, то система перейдёт в новое состояние. Эта функция должна быть так же известна. Если эти функции не заданы, то их надо сформулировать. Введёмусловный оптимальный выигрыш. Это выигрыш на всех этапах от до конца, еслиый шаг начинается с состояния.

Рассмотрим шагов. Начнём сго шага. Мы системой управляем оптимально, величина оптимального выигрыша. Наом шаге - любое управление.неоптимальный выигрыш, т. к. наом шаге мы применяем управление.

Это функциональное уравнение Беллмана. Для использования уравнения Беллмана начинают с конца:

.

Итак, идя от конца к началу, мы получаем последовательно:

Придя в начальное состояние W1(S), мы можем подставить S = S0 и W1(S0) = Wmax – это безусловный выигрыш.

Теперь необходимо получить, идя от начала к концу по цепочке, безусловно оптимальное уравнение:

Итак, в конце мы получаем: