Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Формализация_задачи.doc
Скачиваний:
18
Добавлен:
05.05.2019
Размер:
1.25 Mб
Скачать

1.6.2. Принятие решений в условиях риска

В отличие от условий полной неопределённости на множестве Z задана вероятностная метрика. Если множество Z дискретно, то каждому соответствует вероятность

В этих условиях наиболее распространённым принципом принятия решений является принцип Байеса:

. (1.35)

При равновероятном распределении:

решения, выбранные в соответствии с принципом Байеса (1.35) и Лапласа (1.34) совпадают.

Если множество Z непрерывно, то на множестве задаётся диффе-ренциальный или интегральный закон распределения вектора z  Z. В этом случае возможны различные постановки задач выбора оптимального решения:

(1.36)

(1.37)

(1.38)

где – математическое ожидание вектора y.

Рассмотренные задачи, строго говоря, не эквивалентны. Выбор любой из них отражает предположение о том, что определение решения в соответствие с выбранной постановкой обеспечивает требуемую эффективность операции. Постановка (1.36) соответствует использованию принципа Байеса в непрерывном случае.

1.7. Принятие решения в условиях конфликта

Для обоснования решений в условиях конфликта разработаны специальные математические методы, которые рассматриваются в теории игр. Её возникновение относится к 1944г., когда вышла в свет монография

Неймана и Моргенштерна «Теория игр и экономическое поведение» [38]. В настоящее время теория игр превратилась в самостоятельное математическое направление, имеющее много практических приложений.

В отличие от раздела 1.6, когда параметром z управляла «природа», в условиях конфликта параметр z отражает действия «разумного» противника, преследующего собственные цели. Столкновение противоположных интересов участников приводит к возникновению конфликтных ситуаций. Необходимость анализировать такие ситуации привела к возникновению теории игр, задачей которой является выработка рекомендаций по рациональному образу действий участников конфликта.

В дальнейшем рассматриваются только стратегические игры, в отличие от комбинаторных и азартных игр, когда источник неопределённости состоит в отсутствии информации о действиях противника, о его стратегии.

Рассмотрим модель игры более подробно. Если сталкиваются интересы двух противников, игра называется парной, если более двух – множественной.

Так как наибольшее практическое значение имеют парные игры, то рассмотрим только их. Итак, участников игры двое – А и В. Задано множество стратегий Х, игроков А и В. Соответственно:

Простейший вид стратегической игры – игра двух лиц с нулевой суммой (сумма выигрышей равна нулю). Выбор стратегии каждым из игроков производится при полном незнании выбора другого игрока. В результате выигрыш и каждого из игроков удовлетворяет соотношению:

(1.39)

откуда, если

,

то

Цель игрока А – максимизировать функцию , в свою очередь, цель игрока В – минимизировать эту же функцию.

Пусть Составим матрицу

Матрица  А  называется платёжной, её строки соответствуют стратегиям , столбцы – стратегиям , элемент – выигрыш игрока А, если он выбрал стратегию , а игрок В – стратегию .

Игрок  А, не зная информации о выборе стратегии игроком В, должен сделать такой выбор, чтобы максимизировать свой минимальный выигрыш:

(1.40)

где – гарантированный выигрыш игрока  А – называется нижней ценой игры.

Стратегия , обеспечивающая получение , называется максиминной.

Соответственно игрок В, выбирая стратегию, исходит из следующего принципа: при выборе некоторой стратегии его проигрыш не превысит максимального из значений элементов j-го столбца матрицы, т. е. меньше или равен . Естественно, что игрок В выберет такое значение j, при котором его максимальный проигрыш минимизируется:

. (1.41)

Величина называется верхней ценой игры, а соответствующая выигрышу стратегия минимаксной.

Фактический выигрыш игрока А при разумных действиях партнёров ограничен нижней и верхней ценой игры. Если же эти выражения равны

, (1.42)

то выигрыш игрока Авполне определённое число, и игра называется вполне определённой, а выигрыш (1.42) называется решением игры и равен элементу матрицы .

Вполне определённые игры называются играми с седловой точкой, а элемент называется седловой точкой.

Седловой точке соответствует оптимальные стратегии игроков, их совокупность является решением игры, которое обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого отклонение от его оптимальной стратегии не может быть выгодно.

Пример 1.6

Игры заданы платёжными матрицами:

Для матрицы А1 : 1 = 3, 1 = 4.

Для матрицы А2 : 2 = 2, 2 = 2.

Таким образом, цена второй игры = 2, решение игры состоит в выборе игроком А стратегии х2, а игроком В – стратегии у2. Легко видеть, что отклонение одним из игроков от оптимальной стратегии приводит к уменьшению выигрыша для игрока А и к увеличению проигрыша для игрока В.

Итак, если игровая матрица содержит седловую точку, то решение игры известно. Возникает вопрос нахождения решения для игр, матрицы которых не содержат седловой точки, в этих играх .

Естественным для каждого игрока является вопрос увеличения выигрыша (уменьшения проигрыша). Поиски такого решения состоят в том, что игроки применяют не одну, а несколько стратегий, причём выбор стратегий осуществляется случайным образом. Случайный выбор игроком своих стратегий называется смешанной стратегией.

В данной игре стратегии игрока А задаются набором вероятностей:

а стратегии игрока В задаются набором вероятностей:

,

причём: .

Стратегии игроков А и В, для которых вероятности и отличны от нуля, называются активными.

Согласно основной теореме игр [38], каждая конечная игра имеет, по крайней мере, одно решение, которым может быть и смешанная стратегия. При использовании смешанной стратегии выигрыш игрока А – случайная величина с математическим ожиданием:

,

или в векторной записи . Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры :

. (1.42)

Для оптимальных стратегий имеет место соотношение:

. (1.43)

Применение игроком А стратегии оптимальной стратегии Р* должно обеспечить ему при любых действиях игрока В математическое ожидание выигрыша не меньше цены игры . Поэтому выполняются соотношения:

(1.44)

Аналогично для игрока В оптимальная стратегия должна обеспечить ему при любых действиях игрока А проигрыш, не превышающий цену игры , т. е. справедливо соотношение:

(1.45)

Соотношения (1.44) и (1.45) могут быть использованы при построении формальных математических моделей для определения решения игры.

Рассмотрим, как выглядит модель выбора для определения стратегии при использовании соотношения (1.44). Введём новые переменные Тогда (1.44) перепишется следующим образом:

(1.46)

а из условия следует, что

. (1.47)

Так как решение игры должно максимизировать значение , то для выбора оптимальной смешанной стратегии игрока А необходимо найти:

(1.48)

при

Аналогично может быть сформулирована задача для выбора оптимальной смешанной стратегии игрока В с использованием (1.45):

найти (1.49)

при

Как видно из соотношения (1.48) и (1.49) для решения игры имеем пару двойственных задач линейного программирования. Используя свойство симметричности, можно решить одну из них, требующую меньших вычислений, а решение второй задачи найти, используя результаты теории двойственности (см. главу 2).

Пример 1.7 [34]

Рассматривается игра в хоккей. В одном из периодов состояния команд А и Б характеризуется следующим образом:

у команды А – 4 играющих пятёрки,

у команды Б – 3 играющих пятёрки.

Матрица игрового преимущества имеет вид:

Задача (1.48) представлена в виде следующей модели:

при

Оптимальное решение задачи методом линейного программирования (см. главу 2) выглядит следующим образом:

Таким образом, цена игры равна , а оптимальные вероятности использования чистых стратегий в смешанной стратегии тренеров команды А определились следующим образом:

Поэтому в данном игровом периоде тренеру команды А необходимо реже выпускать первую пятёрку, а четвёртую вообще не включать в игру.

Аналогично может быть сформулирована оптимальная стратегия и для команды  Б.

Содержание предыдущих разделов убеждает в том, что среди математических методов, используемых в теории принятия решений, особую роль играют методы решения оптимизационных задач. Они составляют фундамент системы математического обеспечения проблем принятия решений. Этим вопросам будет посвящено содержание следующего раздела.