- •2.Теоретические основы матричных игр
- •2.1 Структура матричных игр и принципы оптимальности
- •2.2. Минимаксы
- •2.3 Смешанное расширение матричной игры.
- •X1y1,x2y2,…,x1yn,x2y1,…,x2yn,…,xmyn
- •2.4. Теорема о минимаксе
- •2.5. Ситуации равновесия и оптимальные стратегии
- •Свойства значения игры и оптимальных стратегий
- •2.7. Доминирование стратегий
- •2.7 Игры против природы – частный и важный случай матричной игры.
2.4. Теорема о минимаксе
Теорема. Всякая конечная антагонистическая игра имеет хотя бы одну точку равновесия, может быть и в смешанных стратегиях.
vI = vII.
Эта важнейшая в теории игр теорема была доказана многими способами. Мы приведем здесь доказательство, принадлежащее фон Нейману и Моргенштерну. Для того, чтобы перейти к доказательству теоремы, начнем с двух лемм. [6]
Лемма 1 (теорема об опорной гиперплоскости). Пусть В — замкнутое выпуклое множество в п-мерном евклидовом пространстве, а х = (х1,..., хn) – некоторая точка, не принадлежащая В. Тогда существуют такие числа р1, ..., рп, рп+1, что
(2.32)
и (2.33)
(Геометрически это означает, что через точку х можно провести гиперплоскость так, что В будет лежать целиком «выше» этой гиперплоскости.)
Доказательство. Пусть z – такая точка из В, расстояние которой от х минимально. (Такая точка существует, так как В замкнуто.) Положим
pi = zi – xi, i=1, .... n,
Очевидно, равенство (2.32) выполняется. Нужно доказать, что имеет место (2.33). Мы имеем
и, следовательно,
Поэтому
Допустим, что существует , для которого
Так как В выпукло, отрезок, соединяющий у с z, должен целиком содержаться в В, т. е.
wi=ry+(1-r)zВ
для всех 0 < r < 1. Квадрат расстояния от х до wr имеет вид
Поэтому
Если r = 0 (в этом случае wr =z), то имеем
Здесь первое слагаемое по предположению не превосходит 2рn+1, а второе больше 2рn+1. Поэтому
Отсюда следует, что для r, достаточно близких к нулю,
р(х, wr ) < p(х, z).
Но это противоречит выбору z; следовательно, для всех у В условие (2.33) должно выполняться.
Таким образом, лемма жлказана.
Лемма 2 (теорема об альтернативах для матриц). Пусть H = (hij) есть (т X п) - матрица. Тогда справедливо либо утверждение (*), либо утверждение (**):
(*): точка 0 (в т-мерном пространстве) содержится в выпуклой оболочке т + п точек
h1 = (h11,…, hm1),
……………………………
hn = (h1n,…, hmn),
e1 = (1, 0,…, 0),
e2= (0, 1,…, 0),
……………………………
em= (0, 0,…, 1);
(**): существуют числа х1, ..., хm, удовлетворяющие условиям
xi > 0, , j=1,…, n.
Доказательство. Предположим, что утверждение (*) неверно. На основании леммы 1 существуют такие числа р1, .., рm+1, что
(отсюда следует, конечно, что рт+1 = 0) и
для всех у в указанном выпуклом множестве. В частности, это выполняется, если у является любым из т + п векторов hj, еi. Поэтому
для всех j,
pi > 0 для всех i.
Так как рi > 0, получаем, и можно положить
.
Следовательно,
xi > 0, .
Лемма доказана.
На основании двух этих лемм можно доказать теорему.
Доказательство теоремы о минимаксе. Пусть Г – некоторая матричная игра с матрицей H. По лемме 2 имеет место либо утверждение (*), либо (**).
Если верно (*), то 0 является выпуклой линейной комбинацией т + п векторов. Поэтому существуют такие s1, ..., sn, что
i =1,…, m,
sj > 0, j =1, …, m+n
Если бы все числа s1, ..., sn были равны нулю, то 0 оказывался бы выпуклой линейной комбинацией т единичных векторов е1, ..., еm , что, очевидно, невозможно, так как они линейно независимы. Следовательно, по крайней мере одно из чисел s1, …, sn положительно и . Тогда можно положить
и мы получаем
для всех i.
Значит, v(у) < 0 и vII < 0.
Предположим теперь, что верно утверждение (**). Тогда v(х) > 0, так что vI > 0.
Следовательно, неравенство v1<0<vII не может иметь места. Предположим теперь, что мы изменили игру H, заменив ее на игру В = (bij), где
bij = hij + k.
Ясно, что для любых х, у
хВуT = хHуT + k.
Поэтому
vI (В)=vI (H)+ k,
vII (В)=vII (H)+ k.
Так как неравенство
vI (В)<0< vII (В)
не может иметь места, то неравенство
vI (H)<-k< vII (H)
также не выполняется. Но H произвольно. Значит, неравенство v1< vII невозможно. Так как v1< vII, то
v1 = vII
что и требовалось доказать.
Таким образом, мы видим, что при использовании смешанных стратегий нижний выигрыш игрока I в точности равен верхнему проигрышу игрока II. Общая величина и этих двух чисел называется значением игры. Мы видим, что стратегия х, удовлетворяющая условию
j =1,…,n, (2.34)
является оптимальной для игрока I в том смысле, что не существует стратегии, которая дала бы ему больший ожидаемый выигрыш, чем v, против каждой стратегии игрока II. Обратно, если у удовлетворяет условию
i =1,…,m, (2.35)
то у является оптимальной стратегией для игрока II в том же смысле. Далее, очевидно, что
хHуT = v,
так как если бы правая часть этого равенства была меньше левой, то это противоречило бы (2.35), а если бы она была больше левой, это противоречило бы (2.34). Следовательно, оптимальные стратегии х и у являются также оптимальными одна против другой, а также против любой иной оптимальной стратегии. Будем называть любую пару оптимальных стратегий (х, у) решением игры.
Принципиальное значение теоремы о минимаксе состоит в том, что изложенные выше рассуждения о разумных действиях игроков, приводящих к седловым точкам, применимы к любым конечным антагонистическим играм.
Практическое значение этой теоремы значительно скромнее. Оно сводится лишь к тому, что для любой матричной игры поиски седловой точки в смешанных стратегиях имеют надежду на успех. Сама по себе теорема о минимаксе не указывает никаких путей нахождения оптимальных смешанных стратегий игроков в матричных играх. Эта задача является самостоятельной и довольно трудной. В настоящее время известны несколько путей ее решения, различных по сложности используемого математического аппарата, по объему необходимых вычислений и по широте применимости. Кроме того, имеется довольно большое число матричных игр, для которых оптимальные стратегии игроков удается найти в результате применения тех или иных индивидуальных искусственных приемов.
Предположим теперь, что смешанная оптимальная стратегия одного из игроков найдена. Пусть она состоит в том, что первая чистая стратегия этого игрока должна им выбираться с вероятностью х1, вторая — с вероятностью х2 и т. д. Фактическое осуществление такой смешанной стратегии должно заключаться в создании некоторого устройства, которое имеет столько состояний, сколько у игрока чистых стратегий, и в момент наблюдения находится в первом состоянии с вероятностью х1 во втором — с вероятностью х2 и т. д. Так, для реализации смешанной стратегии, которая с вероятностью ½ оказывается одной из чистых стратегий игрока, а с вероятностью ½ другой его чистой стратегией, можно подбрасывать монету, действуя затем в духе первой стратегии, если монета выпадет гербом, и в духе второй в противном случае.