Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kopia_Posobie.doc
Скачиваний:
8
Добавлен:
25.04.2019
Размер:
6.99 Mб
Скачать

3.2. Постановка игровых задач.

Формальное описание задачи принятия решения можно представить в виде математической модели, задав множество , элементы которого в теории игр называют альтернативами, множество , элементы которого называются исходами и множество , элементы которого называются показателями среды, характеризующие условия коммерческой деятельности.

При анализе ситуаций, возникающих в коммерческой практике, множество X описывает набор принимаемых решений одной стороны, множество Y — возможные варианты поведения противоположной стороны, а множество A — тот выигрыш (или проигрыш), который получит игрок.

Если каждая альтернатива может привести к одному из исходов, каждый из которых имеет определенную вероятность появления, то считается, что принятие решения происходит в условиях риска.

Если каждая альтернатива может привести к одному из нескольких исходов, причем отсутствует даже стохастическая зависимость исходов от альтернатив, то считается, что принятие решения происходит в условиях неопределенности.

Каждый исход a  A является функцией двух аргументов: , где x  X, y  Y. Функция F называется функцией реализации и она сопоставляется исход по каждой паре - «альтернатива - состояние среды».

Функцию реализации удобно представить в виде так называемой платежной таблицы.

y1 ... yj ... ym

x1 F(x1, y1) ... F(x1, yj) ... F(x1, ym)

... ... ... ... ... ...

xi F(xi, y1) ... F(xi, yj) ... F(xi, ym)

... ... ... ... ... ...

xn F(xn, y1) ... F(xn, yj) ... F(xn, ym)

3.3. Методы и модели решения игровых задач. Принцип минимакса.

Рассмотрим методы и модели решения игровых задач.

Рассмотрим конечную парную игру с нулевой суммой. Игрок I имеет m стратегий (А1, А2, ..., Аm), а игрок II — n стратегий (В1, В2, ..., Вn). Такая игра называется игрой размерностью m  n. Пусть каждая сторона определилась с выбором стратегии: игрок I — Ai (i = 1, 2, ..., m), игрок II — Bj (j = 1, 2, ..., n). Выигрыши игрока I — (Ai, Bj) и игрока II — (Ai, Bj) удовлетворяют соотношению (Ai, Bj) + (Ai, Bj) = 0.

Если игра состоит только из личных ходов, то выбор стратегии (Ai, Bj) однозначно определяет исход игры , т.е. выигрыш игрока I. Если игра содержит также случайные ходы, то выигрыш при паре стратегий (Ai, Bj) есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае ожидаемый выигрыш — это среднее значение (математическое ожидание). Предположим, что значения aij известны для каждой пары стратегий (Ai, Bj). Построим таблицу, строки которой соответствуют стратегиям игрока I, а столбцы — стратегиям игрока II, т.е. платежную матрицу. Каждый элемент (aij > 0) матрицы определяет величину выигрыша игрока I и проигрыш игрока II. Цель игрока I — максимизировать свой выигрыш, а игрока II — минимизировать свой проигрыш. Платежная матрица имеет следующий вид:

I \ II B1 B2 ... Bj ... Bn

A1 a11 a12 ... a1j ... a1n1

A2 a21 a22 ... a2j ... a2n2

... ... ... ... ... ... ... ...

Ai ai1 ai2 ... aij ... aini

... ... ... ... ... ... ... ...

Am am1 am2 ... amj ... amnm

Βj12 ... j ... n

Задача состоит в определении:

  1. наилучшей (оптимальной) стратегии игрока I из стратегий A1, A2, ..., Am;

  2. наилучшей (оптимальной) стратегии игрока II из стратегий B1, B2, ..., Bm.

Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

Проанализируем последовательно каждую стратегию игрока I. Если игрок I выбирает стратегию А1, то игрок II может выбрать такую стратегию Bj, при которой выигрыш игрока I будет равен наименьшему из чисел a1j:

.

Выбирая стратегию Ai, игрок I должен рассчитывать на то, что в результате разумных действий игрока II он не выиграет больше, чем i. Поэтому игрок I должен выбрать ту стратегию, для которой i максимально:

.

Величина  — гарантированный выигрыш, который может обеспечить себе игрок I при любом поведении игрока II. Величина  называется нижней ценой игры или максимином, а стратегия Аi игрока I, обеспечивающая получение нижней цены игры, называется максиминной чистой стратегией. При этом игрок I при любом поведении игрока II обеспечивает себе выигрыш, не меньше : i   (i = 1, 2, ..., m).

Игрок II заинтересован в том, чтобы уменьшить свой проигрыш, т.е. обратить выигрыш игрока I в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце:

.

и среди этих значений выбрать наименьшее: .

Величина  называется верхней ценой игры или минимаксом. Стратегия игрока II, обеспечивающая получение верхней цены игры, называется минимаксной чистой стратегией. Применяя ее, игрок II проиграет не больше  при любых действиях игрока I:

j   (j = 1, 2, ..., n), причем всегда справедливо неравенство   .

Таким образом, придерживаясь максиминной стратегии Ai, игрок I желает получить выигрыш не менее  не зависимо от действий игрока II, а игрок II, придерживаясь минимаксной стратегии Bj, гарантирует себе проигрыш не больше .

Принцип, диктующий игрокам соответствующих стратегий (максиминной и минимаксной), в теории игр называется принципом минимакса. Этот принцип был впервые сформулирован Дж. фон Нейманом в 1928 году.

Пример 1. Дана платежная матрица. Найти решение игры: определить нижнюю и верхнюю цены игры и минимаксные стратегии:

I \ II B1 B2 B3 B4

A1 5 3 8 2 2

A 2 1 6 4 3 1

A 3 9 5 4 7 4

Βj 9 6 8 7

Таким образом, нижней цене игры ( = 4) соответствует стратегия A3 игрока I. Выбирая эту стратегию, игрок I достигнет выигрыша не меньше 4 при любом поведении игрока II. Верхней цене игры ( = 6) соответствует стратегия игрока II — В2. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен а33 = 4.

Существуют матричные игры, для которых нижняя цена игры равна верхней, т.е.  = . Такие игры называются играми с седловой точкой.

В этом случае  =  =  называется чистой ценой игры, а стратегии игроков и , позволяющие получить это значение — оптимальными. Пара называется седловой точкой матрицы, так как элемент одновременно является минимальным в i-й строке и максимальным в j-м столбце. Оптимальные стратегии и и чистая цена являются решением игры в чистых стратегиях, т.е. без привлечения механизма случайного выбора.

Пример 2. пусть задана платежная матрица. Найти нижнюю и верхнюю цены игры.

I II B1 B2 B3

A1 5 1 2 1

A2 2 6 2 2

A3 3 4 3 3

 5 6 3

Следовательно  =  =  = 3.

Седловой точкой является пара альтернатив (А3, В3).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]