- •Оглавление
- •Введение
- •1. Основные понятия теории системного анализа и принятия решений
- •Классификация задач принятия решения
- •Калибровочные соотношения между альтернативами
- •2.1. Однокритериальные задачи в условиях определенности
- •2.2. Многокритериальные задачи в условиях определенности
- •2.3. Принятие решений в условиях неопределенности
- •2.3.1. Принятие решений при наличии неопределенных факторов
- •Системная матрица расчетных случаев риска
- •2.3.2. Принятие решений в условиях отсутствия информации
- •2.3.3. Принятие решений в условиях нечеткой информации
- •2.3.4. Методы построения функций принадлежности
- •Качественные оценки градации альтернатив
- •3. Принятие решений с использованием критерИев
- •3.1. Минимаксный критерий
- •3.2. Расширенный минимаксный критерий
- •3.3. Критерий байеса-лапласа
- •3.4. Критерий сэвиджа
- •3.5. Модели агрегирования критериев
- •Схемы агрегирования локальных критериев
- •3.6. Основные понятия теории игр
- •Игра с нулевой суммой
- •3.7. Многомерные модели принятия решений
- •4. Методы многокритериальной оптимизации
- •4.1. Аксиоматическая теория полезности
- •4.2. Метод electre I
- •4.3. Метод electre II
- •4.4. Метод анализа иерархий (аналитическая иерархия)
- •5. Синтез оптимального управления объектами
- •5.1. Уравнение эйлера
- •5.2. Формализация задаЧи синтеза оптимальНого управления
- •5.3. Критерии оптимальности автоматических систем
- •5.4. Применение вариационного исчисления в оптимальНом управлении
- •5.5. Синтез оптимального управления. Метод бойчука
- •6. Задачи вычисления численных оценок
- •6.1. Процедура построения квазипорядка на множестве объектов (задача об упаковке)
- •6.2. ПроцедурА оптимального назначения объектов (Задача о назначениях)
- •6.2.1. Постановка многокритериальной задачи о назначениях
- •6.2.2. Формальный анализ задачи
- •6.2.3. Графы предпочтения
- •6.2.4. Матрица предпочтения
- •6.3. Задача планирования производства
- •6.4. Задача Принятия решений в условиях риска
- •6.5. Пример использования критериев
- •6.6. Задача постороенИя функций принадлежности
- •6.7. Синтез оптимального управления с использованием метода Бойчука
- •6.8. Объектно-ориентированный подход в системном анализе и управлении
- •6.8.1. Структура построения проекта задачи системного анализа с использованием ооп
- •Библиографический список
3.6. Основные понятия теории игр
Постановка задачи принятия решений следующая:
В задаче полагается, что фактором неопределенности управляется «разумным» противником. Его цели выражаются аналогично (3.31):
Такая задача (неопределенность типа «активный партнер») относится к теории игр. Противоборствующие стороны будем называтьигроками; выбираемые противниками альтернативы (xиz)—ходами; правила выбора решений—стратегиями; значения функционаловJиI—выигрышами.
Расхождение между функционалами JиIопределяет степень антагонизма игроков. Может оказаться, чтоJ= –Iпри любыхxиz. Такую игру будем называть антагонистической, строго конкурентной, игрой с нулевой суммой (J+I= 0). Такая антагонистическая ситуация является вырожденной. Более типичен конфликт, в котором интересы игроков не совпадают, но и не строго противоположны.
Представим ситуацию, когда не два, а kигроков максимизируют свои выигрышиpi(x1, x2,…, xk),i=1,…,k.
Пусть для первого игрока, выбирающего решение x1, остальные составляют фактор неопределенностиz:pi(x1, z). Если=0, то мы говорим об игре с нулевой суммой. Будем рассматривать игры двух лиц А — (3.31) и Б — (3.32). В общем случае,X,Z— векторные пространства разных размерностей. Представим задачу в виде таблицы (рис.3.2).
| |
|
Рис. 3.2. Постановка задачи игры для двух игроков.
На пересечении строки iи столбцаjстоит пара чисел (p,q), гдеp=J),q=I), с точки зрения игрока А. Функционалы требуется либо максимизировать, либо минимизировать, в зависимости от постановки задачи. В дальнейшем рассматриваем задачи с позиции игрока А. При принятии решений в условиях риска (подобные задачи могут быть отнесены к теории игр), предполагалось, что сторона Б — это внешние факторы («природа»). При игре с «думающим» противником введем гипотезы суть которых выделяет в теории ПР отдельную теорию — теорию игр. Будем различать следующие основные гипотезы.
1. Пусть каждый из субъектов А и Б не имеет информации о выборе противоположной стороны. Будем поступать аналогично задаче принятия решений в условиях полной неопределенности.
Для субъекта А:
Для субъекта Б:
Рис. 3.3. Линии постоянного уровня (J =20,J =10,J =0)
где z* — гарантирующее решение игрока Б. Обозначим решение задачи (3.33) через x**. Оказывается что
где — гарантированная оценка субъекта А, получаемая по принципу максмина (3.33). Неравенство (3.35) может быть строгим, тогда, следуя гипотезе 2 можно получить выигрыш, выбираяx**, а не x*.
Рассмотрим пример, игру с нулевой суммой (таблица 3.3).
На пересечении строки и столбца стоит значение критерия (выигрыш игрока А, или проигрыш игрока Б).
Минимаксная гарантирующая стратегия игрока А — x*= x3, гарантированная оценка . Если бы игрок А выбрал другое
Таблица 3.3
Игра с нулевой суммой
X |
Z | |||
z1 |
z2 |
z3 |
z4 | |
x1 |
5 |
-10 |
9 |
0 |
x2 |
6 |
7 |
8 |
1 |
x3 |
8 |
7 |
15 |
2 |
x4 |
3 |
4 |
-1 |
4 |
решение, отличное от x3, то мог, в зависимости от действий игрока Б, получить и меньшее значение выигрыша. Игрок Б (игра с нулевой суммой) стремится минимизировать наш выигрыш, тем самым и свой проигрыш. Т. е. игрок Б выбирает столбец, в котором максимальное число было бы наименьшим. Максминный критерий дает ,. Игрок Б не проиграет больше четырех условных единиц. Если игрок А выберетx** из условия то получитx**= x4, . В общем случае на основе гипотезы 2 можно получить лучший результат.
3. Допустим, что игрок Б поступает согласно гипотезе 2, т. е. использует стратегию . Игрок А с учетом этого выбирает оптимальное решение.
4. Пусть игрок А знает первый ход игрока Б. Тогда решение игрока А — x = x(z). Для каждого фиксированного z, можно определить искомое значение x, решая задачу оптимизации:
Можно определить гарантированный результат :
Результат будет отличаться от, найденного согласно гипотезе 1. Будем иметь:
Гипотеза 4 позволяет улучшить результат, полученный по принципу максминного гарантированного результата.
Доказательство (3.38). Неравенство (3.38) имеет вид:
Для любых двух фиксированных , справедливо неравенство:
где ,.
Пусть ,.
Тогда: .
Таким образом (3.40) доказано. Поскольку могут быть любыми, выберем;. Подставим эти значения в (3.40), получим (3.39).
Рассмотрим игру (таблица 3.3). . Дляимеем:.
5. Пусть Б знает ход А. Естественно предположить, что Б будет придерживаться стратегии z = z(x), которая является решением оптимизационной задачи:
(согласно гипотезе 4). Сохраняем допущение, что субъект А сообщил свой ход субъекту Б, а также допущение об использовании субъектом Б стратегии z(x). Это позволяет субъекту А воздействовать на выбор субъекта Б, чтобы он в максимальной степени соответствовал целям субъекта А. Выбор субъекта А:
Если максимум (3.41) достигается не в одной точке z, а на некотором множестве M(x), то гарантированный результат определяется как:
Общим для рассмотренных выше случаев является предположение, что обе стороны точно знают свои цели и информированы о целевых функциях «противника». Что не всегда выполняется для реальных конфликтных ситуаций. Чаще о целях наших партнеров имеют ограниченную информацию. Необходимо учитывать возможную сознательную дезинформацию.