Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
математика 4 курс Метод пособие Математ програм...docx
Скачиваний:
16
Добавлен:
24.08.2019
Размер:
1.47 Mб
Скачать

2.3. Решение матичной игры в смешанных стратегиях

Если платежная матрица не имеет седловой точки, т.е. и , то применение чистых стратегий не дает оптимального решения игры. В этом случае можно получить оптимальное решение, случайным образом чередуя (выбирая) чистые стратегии, т.е. используют смешанную стратегию.

Смешанной стратегией игрока А называется применение чистых стратегий с вероятностями , причем: .

Смешанные стратегии игрока А записываются в виде матрицы или в виде строки .

Аналогично смешанные стратегии игрока В обозначаются: или в виде строки , где .

Пример 5. Найти верхнюю и нижнюю цену, заданной платежной матрицей

.

Решение. Платёжная матрица, в которой не существует решения в чистых стратегиях

.

Так как нижняя цена игры достигается в стратегии А1 и её значение равно 2, в то время как верхняя цена игры достигается в стратегии В4 и её значение равно 3.

Теорема Неймана. Каждая конечная игра имеет, по крайней мере, одно оптимальное решение в области смешанных стратегий.

Обозначим и - пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры , если второй игрок не выходит за пределы своих активных стратегий.

Если в платежной матрице все элементы i-й строки не меньше соответствующих элементов к-й строки, то i-я стратегия игрока А называется доминирующей над к-й стратегий, а к-я – доминируемой. Если все элементы j-го столбца платежной матрицы не больше соответствующих элементов к-го столбца, то j-я стратегия игрока В называется доминирующей над к-й стратегией.

Первому игроку невыгодно применять стратегии, которым соответствуют доминируемые строки; второму игроку невыгодно применять стратегии, которым соответствуют доминирующие столбцы. Поэтому при решении игры можно уменьшить размеры платежной матрицы путем удаления из нее доминирующих столбцов и доминируемых строк.

Пример 6. Определите, имеет ли платёжная матрица

доминируемые и доминирующие стратегии.

Решение.

Рассмотрим платежную матрицу

,

Все элементы стратегий А2 и А4 меньше элементов стратегии А3. Данные стратегии не будут выбраны игроком, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей. Исключим стратегии А2 и А4.

.

Для второго игрока. Все элементы стратегий В1, В2 и В3 больше элементов стратегии В4, поэтому их можно исключить. В результате преобразований получим матрицу

,

2.4. Игра 2 2

Рассмотрим игру 2 2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.

В игре, где отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий и .

Игра задана платежной матрицей .

Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1 (это соответствует 1-му столбцу платежной матрицы P), равен цене игры , т.е. . Тот же средний выигрыш получает игрок А, если игрок В применяет стратегию В2, т.е. . Учитывая, что , получаем систему уравнений для определения оптимальной стратегии и цены игры :

Решая эту систему, получим оптимальную стратегию :

,

,

и цену игры .

Применяя теорему об активных стратегиях при отыскании - оптимальные стратегии игрока В определяются по формулам:

,

.

Решение игры 2 2 приведенной выше платежной матрицы допускают наглядную геометрическую интерпретацию. По оси абсцисс (рис. 1) надо отложить единичный отрезок А1А2; точка А1 (x=0) изображает стратегию А1, а все промежуточные точки этого отрезка – смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка – это вероятность стратегии А1, расстояние до левого – вероятность стратегии А2. На перпендикулярных осях I-I и II-II откладываем выигрыши при стратегиях А1 и А2 соответственно. Если 2-й игрок примет стратегию В1, то она дает выигрыши и на осях I-I и II-II, соответствующие стратегиям А1 и А2. Обозначим эти точки на осях I-I и II-II буквой В1. Средний выигрыш , соответствующий смешанной стратегии SA, определяется по формуле математического ожидания и равен ординате точки М1, которая лежит на отрезке В1В1 и имеет абсциссу SA (рис. 1).

Аналогично строим отрезок В2В2, соответствующий применению вторым игроком стратегии В2 (рис 2). При этом средний выигрыш - ордината точки М2.

I

II

B1

y

II

M1

a21

В1

B2

a11

a22

P2

P1

x

x

А1

А2

A2

I

II

II

Рис. 1

I

y

II

M2

B2

a12

A1

P2

P1

I

Рис. 2

II

В соответствии с принципом минимакса оптимальная стратегия такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке В1N – против стратегии В1, на участке NВ2 – против стратегии В2). Оптимальную стратегию определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры . На рис. 3 обозначены верхняя и нижняя цены игры и .

Пример 7. Дайте геометрическую интерпретацию решения игры для двух игроков. Для проверки геометрического решения проведите также алгебраические расчеты и сравните результаты с полученными геометрическим способом для платежной матрицы .

Решение. Игра не имеет седловой точки, так как Оптимальное решение следует искать в смешанных стратегиях.

Геометрическая интерпретация игры . Построим на плоскости отрезки, соответствующие стратегиям второго игрока. Найдем оптимальную стратегию игрока А. Откладываем по оси абсцисс единичный отрезок А1А2;

точка А1(х=0) изображает стратегию А1, а все промежуточные точки отрезка А1А2 – смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка – это вероятность p1 стратегии А1, расстояние до левого конца - вероятность p2 стратегии А2. На осях Y и Y1 откладываем выигрыши при стратегиях А1 и А2 соответственно. На вертикальной оси Y откладываем отрезки , соответствующий стратегии В1, , соответствующий В2. На вертикальной оси Y1 откладываем отрезки , соответствующий стратегии , , соответствующий . Абсцисса точки N определяет стратегию SA , ордината – цену игры . Точка N является точкой пересечения прямых и . Уравнения прямой , проходящей через точки (0,1), (1,2): или .Уравнение прямой , проходящей через точки (0,3), (1,1): или . Точка пересечения прямых является решением системы

Точка N . Тогда . Оптимальная стратегия SA = . Цена игры .

Геометрически можно так же определить оптимальную стратегию игрока В, если поменять местами игроков А и В. Абсцисса точки М определяет q2

в оптимальной стратегии игрока В, ордината этой точки – цена игры. Прямая , проходящая через точки (0,1), (1,3), удовлетворяет уравнению . Прямая , проходящая через точки (0,2), (1,1), удовлетворяет уравнению . Координаты их точки пересечения М:

Откуда . Оптимальная стратегия Sв= .

Алгебраические расчеты игры . Оптимальная стратегия определяется по формуле:

,

и цену игры

.

Оптимальная стратегия определяется по формуле:

,

.

Ответ: Оптимальные смешанные стратегии игроков , цена игры составляет . Если первый игрок с вероятностью 1/3 будет применять первую стратегию и с вероятностью 2/3 вторую, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее . Если второй игрок с вероятностью 2/3 будет применять первую стратегию и с вероятностью 1/3 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в средней составит не более .