Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР.doc
Скачиваний:
5
Добавлен:
23.08.2019
Размер:
486.91 Кб
Скачать

3. Основные принципы принятия решений.

1) Принцип Парето (принцип единогласия, т.к. сформулирован для ситуации коллектив.выбора). Оптимальным по Парето решением явл-ся такое решение X, что для любого другого решения Z, если кто-л. (хотя бы один участник коллектива) считает, что Z лучше X, то обязательно найдется кто-то другой, считающий, что X лучше Z. Принцип Парето означает, что поиск решения надо вести до тех пор, пока все единогласно не скажут, что X – оптимально. Для любого другого решения Z будет хотя бы один голос против.

2) Принцип максимизации полезности: выбирать следует тот вариант решения, к-рый максимизирует суммар.полезность при коллектив.выборе.

3) Принцип равновесия Нэша. Существуют ситуации, при которых принятие решения индивидуально отдельным ЛПР неэффективно для любого участника коллектива или сложившейся ситуации. Равновесие в данной ситуации будет в т.Нэша - самое устойчивое распред-е или точка устойчивого успеха.

Имеется 4 острова, на к-рых охотятся 5 охотников. Распред-е (1112) – устойчиво, т.к. никто в одиночку не хочет менять полож-е, т.е. измен-е этого равновесия невозможно, т.е. распред-е устойчиво или оптимально по Нэшу.

3) Принцип гарантированного результата (принцип минимакса). Принцип, используемый участниками, которые не хотят рисковать, а желают получить гарантир.рез-т. Задана платежная матрица (nxm) и необходимо получить гарантир.рез-т. По минимаксу из каждого столбца матрицы мы выбираем макс.значение:

Это макс.значения проигрыша игрока 2 с учетом разумных действий игрока 1. Поэтому игрок II должен выбрать свою стратегию так, чтобы минимизировать свой макс.проигрыш:

По максимину в i-строке матрицы отыскивается минимальное значение выигрыша. - минимальные выигрыши игрока I с учетом разумных действий игрока II. игрок I должен выбрать свою стратегию так, чтобы максимизировать свой мин.выигрыш -

4) Принцип Байеса-Лапласа предполагает, что помимо платежной матрицы известно распред-е вероятностей появл-я реакций исследуемой системы. Наиболее объективной оценкой значения выигрыша для каждого варианта действий будет мат.ожидание: .

Применив это действие ко всем строкам, получим набор значений мат.ожиданий, выбираем наиб. из них: .

4. Постановка задачи динамического программирования.

Динамическое программирование определяет оптимальное решение n-мерной задачи путем ее декомпозиции на n этапов, каждый из которых представляет собой подзадачу относительно одной переменной. Способом объединения (связи) одномерных задач является принцип оптимальности Беллмана. Решение задачи выполняется рекуррентно, так, что решение одной задачи является начальным условием (исходными данными) для следующей задачи. Решив последнюю подзадачу, мы получим оптимальное решение исходной n-мерной задачи.

Для того чтобы сформулировать задачу динамического программирования, необходимо определить следующие элементы:

1)Содержание и количество этапов. Этапы могут быть выделены искусственно и естественно (если есть указания о последовательности или длительности выполнения). Искусственно - в соответствии с размерностью задачи (число переменных).

2)Определить, что является вариантами решения для каждого этапа (вариантов может быть неограниченное число и при необходимости ввести соответствующую переменную). Может быть конечным, неограниченным, непрерывным.

3)Определить состояние для каждого этапа и при необходимости ввести соответствующую переменную. Так как необходимо обеспечить связь между подзадачами (решениями этих задач), используется переменная состояния.

Задача ДП – определить оптимальное управление на каждом этапе и тем самым оптимальное управление всей операцией в целом. На каждом этапе осуществляется распределение и перераспределение ресурсов, участвующих в операции, с целью улучшения ее результата в целом.

Пример: задача о загрузке транспортного средства грузами нескольких наименований, имеющих свои характеристики: объем, масса, стоимость. ТС ограничено по вместимости. Каждое наименование груза обладает характеристикой эффективности: доход, прибыль. Надо загрузить ТС таким количеством груза, чтобы был максимальный суммарный эффект.

ТС грузоподъемностью W, n наименований грузов, массами wi, с прибылью ri. Найти mi количество каждого груза.

1)n этапов- i-тый этап –загрузка груза i-того наименования.

2)Вариант- mi- число единиц i-того груза.

3)Сосотояние xi-сколько загружено на i-том этапе, выражает суммарный вес грузов, загруженных на этапе i, i+1, n (для метода обратной прогонки).

4)Рекуррентное выражение:

fi(xi)- max суммарная прибыль на этапах i, i+1, n при заданном состоянии xi на i-том этапе.

i=1…xi(0…W) fn+1(xn+1)=0, то есть вначале нет прибыли. xi-wi*mi=xi+1.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]