Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Петросян_Теория_игр

.pdf
Скачиваний:
34
Добавлен:
19.09.2019
Размер:
6.14 Mб
Скачать

По определению « для любого и существует такая мера

ц„еХ, что

minK(p.„,y)^v-lln.

У

Поскольку X — компакт в топологии слабой сходимости (лемма п. 4.5), то из последовательности {/^}^.ь ц„еХ, можно выбрать слабо сходящуюся подпоследовательность. Пусть сама последова­ тельность {n„}%L\ слабо сходится к некоторой мере ц0еХ. Тогда

lim KQim у) = ton j H(x, y)dnn (х) = J #(х, y)dfi0 (х)=К(ц0, у), yeY.

я-юо

в-»ооХ

X

Но К(ц0,

у) не меньше v для

каждого yeY. Следовательно,

minK(p,0, ;)>« и на ц0еX достигается требуемый максимум.

Аналогично доказывается, что inf sup в (4.9) можно заменить на min max.

4.8. Перейдем непосредственно к доказательству теоремы п. 4.4. Доказательство. Так как X я Y — метрические компакты, то

для любого целого и существуют конечные (1/л)-сети

Хя={х\, ..,, х»,п}, Х„ с X, Yn={y\, ..., yin), Y„ a Y,

соответственно множеств Хя Y. Это означает, что для любых точек хеХ я yeY найдутся такие точки х?е Х„ и у\е Y„, что

Pl(x, xf)<-, p2(y,yj)<-,

п

(4.11)

п

 

где pt(), р2(') — метрики пространств Хя

Yсоответственно.

 

Для произвольного целого п построим матричную игру с мат­

рицей А„={а$, где

 

 

о?,=Я(х?, yj), х?еХп, y)eYn.

(4.12)

Игра с матрицей А„ имеет значение 0„ и оптимальные смешанные стратегииp„ = (ifi,..., я?„), t„={xnb ..., TJJ игроков 1 я 2 соответственно

(см. теорему п. 6.1 гл. I).

Функция Н(х, у) непрерывна на декартовом произведении Хх Y метрических компактов, поэтому она равномерно непрерывна, т. е. для заданного е>0 можно найти такое 5>0, что как только

р^х, Xе)<5, р2{у, /)<<5,

то

80

\Н(х,у)-Н(,х',У)\<8. (4.13)

Выберем и_настолько большим, чтобы 1/п<8, и определим стратегию ц„ е X по правилу

lxn{F)=

£

(414)

{•IxJeF, х"еХ„}

для каждого борелевского множества F пространства X. Имеем

Если PzC^' )?)<^ то согласно (4.4), (4.5) и (4.13) получаем

\H{x,y)-H{x,yl)\<s,

\K(fin,y)-K<jimy])\<8.

Следовательно, для любого ye Y (Y„—(1/и)-сеть множества У)

К(ця,у)>в„-Е.

(4.16)

Так как min K(jx„, у) достигается (лемма п. 4.7), то

 

У

(4.17)

v>6„-e.

Аналогично можно показать, что

 

И<в„ + Е.

(4.18)

Из (4.17) и (4.18) получаем

 

v > v — 2е.

 

Но по лемме п. 2.2 гл. I неравенство v^v вьшолняется

всегда.

Учитывая произвольность е>0, получаем"

 

« = «;

(4.19)

тогда из леммы п. 4.7 и (4.19) следует утверждение теоремы (см. п. 2.1).

4.9. Следствие. Имеет место равенство

 

v=\im9n,

(4.20)

я-»оо

где 0„=v(A„) значение матричной игры с матрицей (4.12).

4.10. Из доказательства теоремы п. 4.4 следует, что непрерывную игру можно с любой степенью точности аппроксимировать конеч­ ными играми. Более того, справедлив следующий результат.

81

Теорема. Бесконечная антагонистическая игра Г=(Х, Y, Н), где X, Y метрические компакты, а Н непрерывная функция на их произведении, при любом Е>0 имеет ^.-оптимальные смешанные стратегии с конечным спектром.

Доказательство теоремы следует из доказательства (п. 4.8) теоремы п. 4.4. Действительно, по игре Г построим матричные игры с матрицами А„ и смешанные стратегии ц„еХ, определяемые соот­ ветственно (4.12), (4.14) для произвольного целого и. Стратегии v„e У игрока 2 по аналогии определяются следующим образом:

v.(G)=

I

т?,

 

(4.21)

 

 

{J^eG.^e Y„)

 

 

где f"=(Ti, ..., т^ — оптимальная

смешанная

стратегия

игрока

2 в игре с матрицей А„ и значением в„.

 

 

По построению имеем

 

 

 

 

 

D,= n

« t

; =

% v J ,

.

(4.22)

(-1

) -

\

 

 

 

где К(р, v) — выигрыш в смешанных стратегиях (ji, v) в игре Г. Из (4.16) и аналогичного неравенства для стратегии v„ получаем, что

для произвольного £>0 найдется номер п такой, что

К{х, v„)-e<en<K(ji„, У)+Е

(4.23)

для всех хеХ и yeY. Учитывая, что стратегии ц, и v, имеют конечный спектр ХЙ и Y„ соответственно (Х„ и Г, — конечные (1/и)-

сети соответственно множеств X и Y), получаем утверждение те­ оремы (см. п. 3.4).

4.11.Объединяя результаты теорем п. 4.4 и 4.10, можно сделать вывод, что бесконечная антагонистическая игра с непрерывной фун­ кцией выигрыша и компактными множествами стратегий для любо­ го Ё > 0 имеет е-оптимальные стратегии игроков, являющиеся смеся­ ми конечного числа чистых, а также смешанные оптимальные стра­ тегии в классе борелевских вероятностных мер. В частности, эти результаты справедливы для игр на квадрате (п. 1.3) с непрерывной функцией выигрыша.

4.12.Имеется большое число работ, в которых доказывается существование значения бесконечных антагонистических игр. На­ иболее общий результат в этом направлении принадлежит Сайону

[66].Для игр с компактными пространствами стратегий и полунеп­ рерывными функциями выигрыша известны результаты [50, 75, 90]. Покажем, что в некоторых направлениях они не поддаются обобще­ нию.

82

Пример 10. (Игра на квадрате, не имеющая значения в смешанных стратегиях [67]). Рассматривается антагонистическая игра Г ={Х,

Y, Н), где Х= У=[0, 1], а функция выигрыша Н имеет вид

{

—1, если х<у<х+1/2,

 

0, если х=у

или

x=x+\j2,

 

1, если у<х

или

x+\j2<y.

 

Эта функция имеет разрывы на

прямых

у=х и

у=х+1/2.

Покажем, что

 

 

 

 

sup inf ОД, v) = 1/3; inf sup ОД, v)=3/7.

(4.24)

/ I V

V

Ц

 

 

Пусть ц — вероятностная мера на [0, 1]. Если ц ([0, 1/2))^1/з> т о положим Уц=1. Если же ц ([0, 1/2))>1/з> т о выберем 8>0, чтобы

V- (№>11г~^])>1/з> и положим Уц=112 — Ь- В каждом из этих случаев получаем неравенства

inf К(ц, v)^K(v,

yj^l/l,

V

которые доказываются непосредственной проверкой.

С другой стороны, если ц выбрано так, что ц ({0}) = ^ ({1/2})=^ ({1}) = 1/3, то для всех уе[0, 1] имеем

J H(x, у№(х)=1/3[Я(0, у)+Н(\/2, у) + Щ1, у)]>1/3.

о

Следовательно, доказано первое из равенств (4.24).

Теперь пусть v — какая-либо вероятностная мера на [0, 1]. Если vflO, 1))>3/7, то положим х,= 1. Если v ([0, 1))<3/7, то v({l})>4/7,

и в этом случае положим ху=0, если v([0, 1/2))<l/7; если же v([0,

11г))> 1/7, то выберем <5>0 так, чтобы v([0,1/2 —^])> 1/7, и положим xv= 1/2—(5. В каждом из указанных случаев убеждаемся, что

sup ОД, У):>ОДУ, V)>3/7.

м

С другой стороны, если v выбрано так, что

v({l/4}) = l/7, v({l/2}) = 2/7, v({l})=4/7, то для любого хе[0, 1] имеем

]н(х,у)а\(у)=1р[Н{х, 1/4)+2Я(х, 1/2)+4Я(х, 1)]<3/7.

о

Таким образом, доказано второе из равенств (4.24).

83

§5. ИГРЫ С ВЫПУКЛОЙ ФУНКЦИЕЙ ВЫИГРЫША

В§ 4 при достаточно общих предположениях было доказано существование решения в бесконечных антагонистических играх

снепрерывной функцией выигрыша и компактными множествами стратегий. Вместе с тем представляет теоретический и практический интерес выделение таких классов игр, когда один или оба игрока имеют оптимальные чистые стратегии. Такие игры рассматривают­ ся в данном параграфе.

5.1. Определение. Пусть XcR",

YCR"компакты, множе­

ство Yвыпукло, функция H:Xx.Y-*Rl

непрерывна по совокуп­

ности аргументов и выпукла по yeY

при любом фиксированном

значении хеХ. Тогда игра Г(Х, Y, Н) называется игрой с выпуклой

функцией выигрыша (выпуклая игра).

 

 

Приведем симметричное определение относительно игрока 1.

Определение. Если XcR™, YcR"

компакты, множество

X выпукло, функция выигрыша Н непрерывна по совокупности ар­ гументов и вогнута по хеХпри любом фиксированном у е Y, то игра Г=(Х, Y, Н) называется игрой с вогнутой функцией выигрыша (вогнутая игра).

Если же XcR™, YcR" — выпуклые компакты, а непрерывная по совокупности аргументов функция выигрыша Н(х, у) вогнута по х при любом фиксированном у и выпукла по у при каждом х, то игра Г(Х, Y, Н) называется игрой с вогнуто-выпуклой функцией выигрыша (вогнуто-выпуклая игра).

Рассмотрим игры с выпуклой функцией выигрыша. Аналогич­ ные результаты справедливы и для вогнутых игр.

Теорема. Пусть Г=(Х, Y, Н) выпуклая игра. Тогда игрок

2 имеет оптимальную чистую стратегию, при этом значение игры равно

«==minmax#(jc, у).

(5.1)

уеТ хеХ

 

Доказательство. Так как X и Y— метрические компакты (в

метрике евклидовых пространств R™ и R"), а функция Я непрерывна на произведении Хх, Y, то согласно теореме п. 4.4 в игре Г существу­ ет значение v и оптимальные смешанные стратегии /х*, v*. Известно, что множество вероятностных мер с конечным носителем всюду плотно в множестве всех вероятностных мер на Y [85]. Поэтому

существует последовательность смешанных стратегий v" с конечным

спектром, слабо сходящаяся к v*. Пусть спектр стратегии v" состоит из точек у*, ..., yfy, и они выбираются с вероятностями п\, ..., г\\п. Тогда в силу выпуклости функции Н имеем

84

K(x, v")= § п1Н{х, ?„)>Н(х, у"),

(5.2)

где y"=Yirljyl>i- Переходя к пределу при л-юо в неравенстве (5.2)

j-i

(если необходимо, то следует рассмотреть подпоследовательность

{у"}), получаем

 

К(х, v*)^H(x, у), хеХ,

(5.3)

где у — предельная точка последовательности {у"}. Из (5.3) и лем­ мы п. 4.2 имеем

 

та\К(х,

v*)^maxH(x,

у).

(5.4)

 

X

X

 

 

Пусть неравенство (5.4) строгое. Тогда

 

 

v=maxK(x,

v*)>ma&H(x, y)^min

ma.xK(x, v)=«,

 

X

X

V

X

 

что невозможно. Таким образом, max#(x, y)=maxK(x, v*)=v и из

_ X X

теоремы п. 3.5 получаем, что у — оптимальная стратегия игрока 2. Установим справедливость равенства (5.1). Так как "yeY— оп­

тимальная стратегия игрока 2, то

 

v=maxH(x, y)^min

max#(x, у).

 

х

у х

С другой стороны, вьшолняется неравенство

«=min тахК(х, v)<min maxH(x, у).

v

х

у х

Сравнивая последние неравенства, получаем (5.1).

5.2. Напомним, что функция (р: У-»ЛХ, Y с Rn, Y—выпуклое

множество, строго выпукла, если для всех Ле(0, 1) вьшолняется строгое неравенство

(ЛУ1 + 0 ~ %г) < *9 (У1> + 0 -1)9 (Уг); У\Уге Y, yt Фуг.

Теорема. Пусть Т=(Х, Y,H) выпуклая игра со строго выпук­ лой функцией выигрыша. Тогда игрок 2 имеет единственную оп­ тимальную стратегию, которая является чистой.

Доказательство. Пусть ц* —оптимальная стратегия игрока U (p(y)=K(ji*, у) и v — значение игры. Если у — точка спектра оптимальной стратегии игрока 2, то вьшолняется равенство (п.4.2).

85

Однако для всех yeY имеем неравенство K(ji*, y)^v, поэтому

ср (у)=min ср (у)=v.

yeY

Функция <р(у) является строго выпуклой, поскольку для Ле(0, 1) имеет место неравенство

ср {ку, + (1 -Х)уг)=JЩх, ЛУ1 + (1 - % 2 ) Ф * (*)<

X

 

<XiH(x,yl)dfx*(x) + (l-X)^H(x,y2)dfi*(x)

=

= Аф(у1) + (1-А)ф(у2).

(5.5)

Из (5.5) следует, что функция ср(у) не может достигать минимума в двух различных точках. С другой стороны, существование точки минимума У функции ср(у) гарантируется теоремой п. 5.1, что завершает доказательство.

5.3. Приведем без доказательства результаты, симметричные теоремам по п. 5.1 и 5.2 для вогнутых и вогнуто-выпуклых игр.

Теорема. Пусть Г = (Х, Y, Н), X с FT, УсЛ" — вогнутая игра. Тогда значение игры v вычисляется по формуле

w=max min#(.x, у),

(5.6)

*У

каждая чистая стратегия х*. на которой достигается max min (5.6), является оптимальной для игрока 1. Если, кроме того, функция Н(х, у) строго вогнута по х при каждом фиксированном yeY, то оптимальная стратегия игрока 1 единственна.

Теорема. Пусть Г=(Х,

Y, Н), X<zFT, Y a R" вогнуто-вы­

пуклая игра. Тогда значение игры v равно

 

v=mmmaxH(x,

y)=max

min#(;e, у).

(5.7)

у х

х

у

 

В игре Г всегда существует ситуация равновесия (х*, у*) в чистых стратегиях, где х* е X, у* е Y чистые стратегии игроков 1 и 2, на которых достигаются внешние экстремумы в (5.7). Если при этом функция Н (х, у) строго вогнута (выпукла) по переменной х (у) при любом фиксированном yeY (хеХ), то игрок 1 (2) имеет единствен­ ную оптимальную стратегию, которая является чистой.

5.4. Выясним структуру оптимальной стратегии игрока 1 в вы­ пуклой игре Г=(Х, Y, Н).

Теорема. В выпуклой игре Г=(ЛГ, Y, Н), Г с R" игрок 1 имеет

86

оптимальную смешанную стратегию ц* с конечным спектром, со­ стоящим не более чем из (л + 1)-й точки множества X.

Доказательство этого результата основано на известной теореме Хелли о выпук­ лых множествах, которую мы приведем без доказательства [63, с. 210; 3, с. 107]*.

Теорема (теорема Хелли). Пусть Ксемейство из не менее чем п + 1 выпуклого

множества в R , причем каждое множество из К компактно. Тогда, если каждые п + 1 из множества семейства К имеют общую точку, то существует точка, общая всем множествам семейства К.

Прежде чем перейти непосредственно к доказательству теоремы, докажем ряд вспомогательных утверждений.

Пусть функция Н(х, у) непрерывна на произведении Хх Y ком­

пактных множеств X с Rm, Y а R". Обозначим Х'=Хх

... х X декар­

тово произведение г множества X.

 

Рассмотрим функцию </>: X' х X-^R1:

 

q>(xv ..., х„ у)=тахН(хи у).

 

Лемма. Функция (р(хх,..., хг, у) непрерывна на

X'xY.

Доказательство. Функция Н(х, у) непрерывна на компактном множестве Хх Y, поэтому и равномерно непрерывна на нем. Тогда

для любого 8>0 найдется 5>0 такое, что из неравенств рх (Зс, х)<5,

Рг(У1> Уг)<Ь следует неравенство \Н(х, y^-Hfx, у2)\<е,

где рх(),

р2() — расстояния в Л™ и Л" соответственно.

 

 

Имеем

 

 

 

 

\<р(х...,

х„ yj-<p(xlt

..., х, у2)\ =

 

 

= |тах#(х„ уJ-max

Н(хь y2)\ = \H(xh, j^)-#(*,,, у2)},

где

 

 

 

 

H(xh, yl) = maxH(xi, уJ, #(*,„ y^maxHixt,

y2).

Если px (3c,, xt)<8 для i= 1,..., r, p2{yv

y2)<b и если Я(х„

у^>Н(х,

Уг), то

 

 

 

 

0^H(xti, yx)-H(xi2,

j>2)<# (xfl, ух)-Н{х^

у2)<е.

Аналогичные неравенства имеют место в случае H(xit, у^^Н^х^, у2).

Лемма. В выпуклой игре Y=(X, Y, H), Y с R" значение игры

•Вопросы, связанные с обобщениями и приложениями теоремы Хелли, подробно изложены в книге: Данцер Л., Грюнбаум Б., Кли В. Теорема Хелли. М., 1968.

87

v равно

 

 

 

 

 

 

 

 

 

 

v=min тахЯ(л, у)=

max min

max H(xh у),

(5.8)

 

У

*

 

 

 

xt

Jtn+i

у

1«|«л + 1

 

где ye F, xteX,

i'=l,

...,

n+l.

 

 

 

 

 

Доказательство. Обозначим через

 

 

 

 

 

6=

max

 

min

max H(xt, y).

 

 

 

 

*i

*л+1

У

K i < « + I

 

 

Так как min

max H(xt, y)^mitx

maxH(x,

y)=v для каждой систе-

y

1<Кл+1

 

%

 

у

х

 

 

 

мы точек (xl5 ..., x„+i)eX"

, то

 

 

 

 

 

 

 

 

 

 

0<«.

 

 

(5.9)

Для произвольного

фиксированного

набора стратегий xteX,

i=l, ...,л+1, рассмотрим систему неравенств относительно у

 

 

 

Н (xhyHe,yeY,

i=l,

..., и+1.

(5.10)

Покажем, что система (5.10) имеет решение.

 

Действительно,

 

 

 

 

 

 

 

 

0>min

max H(xhy)=

max

 

H(Xi,y)^H(xhy),i=l,n+l.

у

1«<л-Н

 

 

ЦКл+1

 

 

 

Таким образом, у удовлетворяет системе (5.10).

Следовательно, система (5.10) имеет решение для любых xieX, i'=l,2, ..., и+1.

Зафиксируем х и рассмотрим множество

Dx={y:H(x,y)<6}.

Функция Н{х, у) выпукла и непрерывна по у, поэтому множество Dx выпукло и замкнуто при каждом х. Множества {Dx} образуют

систему выпуклых компактных множеств в R", причем в силу того, что неравенства (5.10) всегда имеют решение, любой набор по (и+ 1)-му множеству системы {Dx} имеет непустое пересечение. По­ этому по теореме Хелли существует точка у0 е Y, общая для всех множеств D„ т. е. такая, что

Н(х,уо)<0

(5.11)

при любых хеХ. Предположим, что вфк. Тогда из (5.9) и (5.11)

88

имеем

0<«=min max#(jc, y)^maxH(x, j0 )<S,

ух x

т.е. в<в. Полученное противоречие и доказывает (5.8). Перейдем к доказательству теоремы. Доказательство. Из предыдущей леммы имеем

v= max

min

max Н{х„у)=тахп. max H(xb

y)=

ж,, ..., дгп+1

у

1<;<я + 1

у 1^/<п+1

 

 

 

я+1

 

 

 

=min max £

#(х,> j)71»

(5-12)

УР '=1

где Зс15 ..., Зсл+, —векторы, на которых достигается внешний мак­ симум в (5.8),

Я+1

 

р = (пи ..., ял+1)еЛл+1, я.^О, J] я,= 1.

(5.13)

Рассмотрим функцию

К(р, y)=t Ж** У)Щ, У* Y, реР,

где Р — состоит из векторов, удовлетворяющих (5.13). Функция К(р, у) непрерывна иорау, выпукла по у и вогнута по р, а множест­ ва Y с FC, Р С R" — компакты в соответствующих евклидовых пространствах. Поэтому по теореме п. 5.3 и из (5.12) имеем

 

я+1

 

л+1

 

 

«=min max £

H(xh д/)я,=тах min £ H (хь

у)щ.

(5.14)

у

p i - l

p

у i - l

 

 

Из (5.8) и (5.14) следует существование таких р*еР

и у* в Y, что

для всех хеХ и уе У выполняется неравенство

я+ 1

;-|

Теорема доказана.

Сформулируем теорему о структуре оптимальной стратегии иг­ рока 2 в вогнутой игре Г = (Х, Y, Н).

Теорема. В вогнутой игре Т = {Х, Y, Н), X a Rm игрок 2 имеет оптимальную смешанную стратегию v* с конечным спектром, со­ стоящим не более чем из (т+1)-й точки множества Y.

Доказательство теоремы аналогично доказательству предыду­ щей теоремы.

5.5. Суммируем результаты теорем для выпуклых игр, доказан­ ные в этом параграфе.

89