- •Математическое программирование.
- •Введение
- •1. Целочисленное программирование
- •Метод Гомори
- •Метод ветвей и границ
- •1.3 Задачи для самостоятельной работы
- •2. Теория игр
- •2.1. Основные положения теории игр
- •2.2. Решение матричной игры в чистых стратегиях
- •2.3. Решение матичной игры в смешанных стратегиях
- •2.4. Игра 2 2
- •2.5. Сведение матричной игры к задаче линейного программирования
- •2.6. Игры с природой
- •2.7. Задачи для самостоятельной работы
- •3. Линейный межотраслевой баланс
- •3.2. Задачи для самостоятельной работы
- •4. Нелинейное программирование
- •4.1 Постановка задача нелинейного программирования
- •4.2 Решение задач нелинейного программирования с ограничениями-равенствами
- •4.3. Решение задач нелинейного программирования с ограничениями-неравенствами
- •4.4. Задачи для самостоятельной работы
- •5. Динамическое программирование
- •Долл., долл.,
- •5.3 Задачи для самостоятельной работы
- •6. Контрольные задания
- •Литература
- •Содержание
- •Математическое программирование
2.3. Решение матичной игры в смешанных стратегиях
Если платежная матрица не имеет седловой точки, т.е. и , то применение чистых стратегий не дает оптимального решения игры. В этом случае можно получить оптимальное решение, случайным образом чередуя (выбирая) чистые стратегии, т.е. используют смешанную стратегию.
Смешанной стратегией игрока А называется применение чистых стратегий с вероятностями , причем: .
Смешанные стратегии игрока А записываются в виде матрицы или в виде строки .
Аналогично смешанные стратегии игрока В обозначаются: или в виде строки , где .
Пример 5. Найти верхнюю и нижнюю цену, заданной платежной матрицей
.
Решение. Платёжная матрица, в которой не существует решения в чистых стратегиях
.
Так как нижняя цена игры достигается в стратегии А1 и её значение равно 2, в то время как верхняя цена игры достигается в стратегии В4 и её значение равно 3.
Теорема Неймана. Каждая конечная игра имеет, по крайней мере, одно оптимальное решение в области смешанных стратегий.
Обозначим и - пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры , если второй игрок не выходит за пределы своих активных стратегий.
Если в платежной матрице все элементы i-й строки не меньше соответствующих элементов к-й строки, то i-я стратегия игрока А называется доминирующей над к-й стратегий, а к-я – доминируемой. Если все элементы j-го столбца платежной матрицы не больше соответствующих элементов к-го столбца, то j-я стратегия игрока В называется доминирующей над к-й стратегией.
Первому игроку невыгодно применять стратегии, которым соответствуют доминируемые строки; второму игроку невыгодно применять стратегии, которым соответствуют доминирующие столбцы. Поэтому при решении игры можно уменьшить размеры платежной матрицы путем удаления из нее доминирующих столбцов и доминируемых строк.
Пример 6. Определите, имеет ли платёжная матрица
доминируемые и доминирующие стратегии.
Решение.
Рассмотрим платежную матрицу
,
Все элементы стратегий А2 и А4 меньше элементов стратегии А3. Данные стратегии не будут выбраны игроком, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей. Исключим стратегии А2 и А4.
.
Для второго игрока. Все элементы стратегий В1, В2 и В3 больше элементов стратегии В4, поэтому их можно исключить. В результате преобразований получим матрицу
,
2.4. Игра 2 2
Рассмотрим игру 2 2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.
В игре, где отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий и .
Игра задана платежной матрицей .
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1 (это соответствует 1-му столбцу платежной матрицы P), равен цене игры , т.е. . Тот же средний выигрыш получает игрок А, если игрок В применяет стратегию В2, т.е. . Учитывая, что , получаем систему уравнений для определения оптимальной стратегии и цены игры :
Решая эту систему, получим оптимальную стратегию :
,
,
и цену игры .
Применяя теорему об активных стратегиях при отыскании - оптимальные стратегии игрока В определяются по формулам:
,
.
Решение игры 2 2 приведенной выше платежной матрицы допускают наглядную геометрическую интерпретацию. По оси абсцисс (рис. 1) надо отложить единичный отрезок А1А2; точка А1 (x=0) изображает стратегию А1, а все промежуточные точки этого отрезка – смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка – это вероятность стратегии А1, расстояние до левого – вероятность стратегии А2. На перпендикулярных осях I-I и II-II откладываем выигрыши при стратегиях А1 и А2 соответственно. Если 2-й игрок примет стратегию В1, то она дает выигрыши и на осях I-I и II-II, соответствующие стратегиям А1 и А2. Обозначим эти точки на осях I-I и II-II буквой В1. Средний выигрыш , соответствующий смешанной стратегии SA, определяется по формуле математического ожидания и равен ординате точки М1, которая лежит на отрезке В1В1 и имеет абсциссу SA (рис. 1).
Аналогично строим отрезок В2В2, соответствующий применению вторым игроком стратегии В2 (рис 2). При этом средний выигрыш - ордината точки М2.
I
II
B1
y
II
M1
a21
В1
B2
a11
a22
P2
P1
x
x
А1
А2
A2
I
II
II
Рис. 1
I
y
II
M2
B2
a12
A1
P2
P1
I
Рис. 2
II
В соответствии с принципом минимакса оптимальная стратегия такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке В1N – против стратегии В1, на участке NВ2 – против стратегии В2). Оптимальную стратегию определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры . На рис. 3 обозначены верхняя и нижняя цены игры и .
Пример 7. Дайте геометрическую интерпретацию решения игры для двух игроков. Для проверки геометрического решения проведите также алгебраические расчеты и сравните результаты с полученными геометрическим способом для платежной матрицы .
Решение. Игра не имеет седловой точки, так как Оптимальное решение следует искать в смешанных стратегиях.
Геометрическая интерпретация игры . Построим на плоскости отрезки, соответствующие стратегиям второго игрока. Найдем оптимальную стратегию игрока А. Откладываем по оси абсцисс единичный отрезок А1А2;
точка А1(х=0) изображает стратегию А1, а все промежуточные точки отрезка А1А2 – смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка – это вероятность p1 стратегии А1, расстояние до левого конца - вероятность p2 стратегии А2. На осях Y и Y1 откладываем выигрыши при стратегиях А1 и А2 соответственно. На вертикальной оси Y откладываем отрезки , соответствующий стратегии В1, , соответствующий В2. На вертикальной оси Y1 откладываем отрезки , соответствующий стратегии , , соответствующий . Абсцисса точки N определяет стратегию SA , ордината – цену игры . Точка N является точкой пересечения прямых и . Уравнения прямой , проходящей через точки (0,1), (1,2): или .Уравнение прямой , проходящей через точки (0,3), (1,1): или . Точка пересечения прямых является решением системы
Точка N . Тогда . Оптимальная стратегия SA = . Цена игры .
Геометрически можно так же определить оптимальную стратегию игрока В, если поменять местами игроков А и В. Абсцисса точки М определяет q2
в оптимальной стратегии игрока В, ордината этой точки – цена игры. Прямая , проходящая через точки (0,1), (1,3), удовлетворяет уравнению . Прямая , проходящая через точки (0,2), (1,1), удовлетворяет уравнению . Координаты их точки пересечения М:
Откуда . Оптимальная стратегия Sв= .
Алгебраические расчеты игры . Оптимальная стратегия определяется по формуле:
,
и цену игры
.
Оптимальная стратегия определяется по формуле:
,
.
Ответ: Оптимальные смешанные стратегии игроков , цена игры составляет . Если первый игрок с вероятностью 1/3 будет применять первую стратегию и с вероятностью 2/3 вторую, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее . Если второй игрок с вероятностью 2/3 будет применять первую стратегию и с вероятностью 1/3 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в средней составит не более .