Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
глава2.doc
Скачиваний:
16
Добавлен:
07.11.2018
Размер:
723.97 Кб
Скачать

2.4. Теорема о минимаксе

Теорема. Всякая конечная антагонистическая игра имеет хотя бы одну точку равновесия, может быть и в смешанных стратегиях.

vI = vII.

Эта важнейшая в теории игр теорема была доказана многими способами. Мы приведем здесь доказательство, принадлежащее фон Нейману и Моргенштерну. Для того, чтобы перейти к доказательству теоремы, начнем с двух лемм. [6]

Лемма 1 (теорема об опорной гиперплоскости). Пусть В — замкнутое выпуклое множество в п-мерном евклидовом про­странстве, а х = (х1,..., хn) – некоторая точка, не принадлежа­щая В. Тогда существуют такие числа р1, ..., рп, рп+1, что

(2.32)

и (2.33)

(Геометрически это означает, что через точку х можно провести гиперплоскость так, что В будет лежать целиком «выше» этой гиперплоскости.)

Доказательство. Пусть zтакая точка из В, расстояние которой от х минимально. (Такая точка существует, так как В замкнуто.) Положим

pi = zixi, i=1, .... n,

Очевидно, равенство (2.32) выполняется. Нужно доказать, что имеет место (2.33). Мы имеем

и, следовательно,

Поэтому

Допустим, что существует , для которого

Так как В выпукло, отрезок, соединяющий у с z, должен целиком содержаться в В, т. е.

wi=ry+(1-r)zВ

для всех 0 < r < 1. Квадрат расстояния от х до wr имеет вид

Поэтому

Если r = 0 (в этом случае wr =z), то имеем

Здесь первое слагаемое по предположению не превосходит n+1, а второе больше n+1. Поэтому

Отсюда следует, что для r, достаточно близких к нулю,

р(х, wr ) < p(х, z).

Но это противоречит выбору z; следовательно, для всех у В условие (2.33) должно выполняться.

Таким образом, лемма жлказана.

Лемма 2 (теорема об альтернативах для матриц). Пусть H = (hij) есть (т X п) - матрица. Тогда справедливо либо утвер­ждение (*), либо утверждение (**):

(*): точка 0 (в т-мерном пространстве) содержится в выпуклой оболочке т + п точек

h1 = (h11,…, hm1),

……………………………

hn = (h1n,…, hmn),

e1 = (1, 0,…, 0),

e2= (0, 1,…, 0),

……………………………

em= (0, 0,…, 1);

(**): существуют числа х1, ..., хm, удовлетворяющие условиям

xi > 0, , j=1,…, n.

Доказательство. Предположим, что утверждение (*) не­верно. На основании леммы 1 существуют такие числа р1, .., рm+1, что

(отсюда следует, конечно, что рт+1 = 0) и

для всех у в указанном выпуклом множестве. В частности, это выполняется, если у является любым из т + п векторов hj, еi. По­этому

для всех j,

pi > 0 для всех i.

Так как рi > 0, получаем, и можно положить

.

Следовательно,

xi > 0, .

Лемма доказана.

На основании двух этих лемм можно доказать теорему.

Доказательство теоремы о минимаксе. Пусть Г – некоторая матричная игра с матрицей H. По лемме 2 имеет место либо утверждение (*), либо (**).

Если верно (*), то 0 является выпуклой линейной комбинацией т + п векторов. Поэтому существуют такие s1, ..., sn, что

i =1,…, m,

sj > 0, j =1, …, m+n

Если бы все числа s1, ..., sn были равны нулю, то 0 оказывался бы выпуклой линейной комбинацией т единичных векторов е1, ..., еm , что, очевидно, невозможно, так как они линейно независимы. Следовательно, по крайней мере одно из чисел s1, …, sn положительно и . Тогда можно положить

и мы получаем

для всех i.

Значит, v(у) < 0 и vII < 0.

Предположим теперь, что верно утверждение (**). Тогда v(х) > 0, так что vI > 0.

Следовательно, неравенство v1<0<vII не может иметь места. Предположим теперь, что мы изменили игру H, заменив ее на игру В = (bij), где

bij = hij + k.

Ясно, что для любых х, у

хВуT = хHуT + k.

Поэтому

vI (В)=vI (H)+ k,

vII (В)=vII (H)+ k.

Так как неравенство

vI (В)<0< vII (В)

не может иметь места, то неравенство

vI (H)<-k< vII (H)

также не выполняется. Но H произвольно. Значит, неравенство v1< vII невозможно. Так как v1< vII, то

v1 = vII

что и требовалось доказать.

Таким образом, мы видим, что при использовании смешанных стратегий нижний выигрыш игрока I в точности равен верхнему проигрышу игрока II. Общая величина и этих двух чисел назы­вается значением игры. Мы видим, что стратегия х, удовлетворяю­щая условию

j =1,…,n, (2.34)

является оптимальной для игрока I в том смысле, что не существует стратегии, которая дала бы ему больший ожидаемый выигрыш, чем v, против каждой стратегии игрока II. Обратно, если у удовлетворяет условию

i =1,…,m, (2.35)

то у является оптимальной стратегией для игрока II в том же смысле. Далее, очевидно, что

хHуT = v,

так как если бы правая часть этого равенства была меньше левой, то это противоречило бы (2.35), а если бы она была больше ле­вой, это противоречило бы (2.34). Следовательно, оптимальные стратегии х и у являются также оптимальными одна против другой, а также против любой иной оптимальной стратегии. Будем на­зывать любую пару оптимальных стратегий (х, у) решением игры.

Принципиальное значение теоремы о минимаксе состоит в том, что изложенные выше рассуждения о разумных действиях игроков, приводящих к седловым точкам, применимы к любым конечным антагонистическим играм.

Практическое значение этой теоремы значительно скромнее. Оно сводится лишь к тому, что для любой матричной игры поиски седловой точки в смешанных стратегиях имеют надежду на успех. Сама по себе теорема о минимаксе не указывает никаких путей нахождения оптимальных смешанных стратегий игроков в матричных играх. Эта задача является самостоятельной и довольно трудной. В настоящее время известны несколько путей ее решения, различных по сложности используемого математического аппарата, по объему необходимых вычислений и по широте применимости. Кроме того, имеется довольно большое число матричных игр, для которых оптимальные стратегии игроков удается найти в результате применения тех или иных индивидуальных искусственных приемов.

Предположим теперь, что смешанная оптимальная стратегия одного из игроков найдена. Пусть она состоит в том, что первая чистая стратегия этого игрока должна им выбираться с вероятностью х1, вторая — с вероятностью х2 и т. д. Фактическое осуществление такой смешанной стратегии должно заключаться в создании некоторого устройства, которое имеет столько состояний, сколько у игрока чистых стратегий, и в момент наблюдения находится в первом состоянии с вероятностью х1 во втором — с вероятностью х2 и т. д. Так, для реализации смешанной стратегии, которая с вероятностью ½ оказывается одной из чистых стратегий игрока, а с вероятностью ½ другой его чистой стратегией, можно подбрасывать монету, действуя затем в духе первой стратегии, если монета выпадет гербом, и в духе второй в противном случае.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]