Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
mtn.docx
Скачиваний:
15
Добавлен:
17.04.2019
Размер:
376.25 Кб
Скачать

20. Критерий принятия решений в условиях неопределенности: критерий Вальда и Гурвица

критерий Гурвица. Этот критерий охватывает ряд различных подходов к принятию решений — от наиболее оптимистичного до наиболее пессимистичного (консервативного). Пусть 0 <= а <= 1 и величины

v(аi, sj) представляют доходы. Тогда решению, выбранному по критерию Гурвица, соответствует

Параметр а - показатель оптимизма.

Если a = 0, критерий Гурвица становится консервативным, так как его применение эквивалентно применению обычного минимаксного критерия.

Если а = 1, критерий Гурвица становится слишком оптимистичным, ибо рассчитывает на наилучшие из наилучших условий.

Можно конкретизировать степень оптимизма (или пессимизма) надлежащим выбором величины a интервала [0,1]. При отсутствии ярко выраженной склонности к оптимизму или пессимизму выбор а = 0,5 представляется наиболее разумным.

Критерий Вальда предполагает наихудшее развитие событий

W=min(aij)

21.Общая постановка задачи динамического программирования (дп). Особенности задачи дп

Динамическое программирование – это метод оптимизации многошаговых операций, т.е. когда операция может быть расписана на шаги

Пусть уравнение можно разбить на n шагов

Xk- уравнение на k шаге

Sk- состояние системы после k шага

X1 X2 Xk-1 Xk Xk+1 Xn-1 X

S 0 S1 S2 … Sk-1 Sk Sn-1 Sn

Показатель эффективности управления-целевая функция

X=(X1; X2;…Xn)

Z =f(S0;X) opt

Состояние системы после k шага зависит от состояния системы на предыдущем шаге и управления на этом шаге

Skk(Sk-1;Xk)

Прибыль на k шаге зависит от управления на k шаге и от предыдущего состояния системы.

Zk= fk(Sk-1;Xk)

Прибыль за всю операцию представляет сумму на каждом шаге

Z= Σ Zk

С тавится задача определить доходы допустимое уравнение X переводящее систему из состояния S0 Sk при котором целевая функция принимает свое оптимальное значение

Особенности:

1. Каждая задача ДП представляет собой n шаговый процесс

2. отсутствие прямой обратной связи , т.е. выбор управления на k шаге зависит только от состояния на k шаге

3. состояние системы после k шага зависит от управления на k шаге и от состояния системы на предыдущем шаге

22. Принцип оптимальности и уравнение Бэллмана

Какое бы не было состояние системы в результате какого-либо числа шагов на очередном шаге, нужно выбрать управление так, чтобы оно в совместимости с оптимальным уравнением на всех последовательных шагах приводило бы к оптимальному значению целевой функции на всех последовательных шагах и на данном шаге

Одношаговая задача

Xn

Sn-1 Sn

Zn=maxZn(Sn-1;Xn)=Zn(Sn-1)- условный максимум целевой функции на n шаге

Уравнение при котором он достигается называется условно-оптимальным уравнением и обозначается Zn(Sn-1)

Двухшаговая задача

Xn-1

Sn-2 Sn-1 Sn

Zn=max{Zn-1(Sn-2;Xn-1)+Zn(Sn-1)}= Zn-1(Sn-2)

Последние три шага

Sn-3 Sn-2 Sn-1 Sn

Sk-1 Sk Sn

Zk (Sk-1)=max{Zk(Sk-1;Xk)+Zk+1(Sk)}

Zk (Sk-1)-условно-оптимальное уравнение на k шаге

Уравнение Бэллмана

Zn (Sn-1)=maxZn(Sn-1;Xn)

Zk (Sk-1)=max{Zk(Sk-1;Xk)+Zk+1(Sk)}

Skk(Sk-1;Xk)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]