Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Петросян_Теория_игр

.pdf
Скачиваний:
34
Добавлен:
19.09.2019
Размер:
6.14 Mб
Скачать

Из леммы п. 4.3 следует, что (х*. y*)eZ(YA) — ситуация равно­ весия в игре Гл< в смешанных стратегиях, а значение игры равно vA=vA — ^ = l/e—p. Теорема доказана.

Неформально факт существования решения в классе смешанных стратегий означает, что игроки всегда могут снять неопределен­ ность выбора стратегии, с которой они столкнулись перед началом игры, рандомизируя множество чистых стратегий. Следует отме­ тить, что не всегда в антагонистических играх существует решение в смешанных стратегиях. Примеры таких игр с бесконечным числом стратегий приведены в § 3, 4 гл. И.

Заметим также, что доказательство теоремы конструктивно, по­ скольку сводит решение матричной игры к задаче линейного про­ граммирования, при этом алгоритм решения игры Гл- следующий.

1. По матрице А

строится строго положительная матрица

А = А' + В, где В={ри},

p,j=p>0.

2.Решаются задачи линейного программирования (6.1), (6.2). Находятся векторы х, у и число в [см. 6.3)].

3.Строятся оптимальные стратегии игроков 1 и 2 соответ­ ственно

х* = х1в,у*=у/в.

4. Вычисляется значение игры Г^

Пример 8. Рассмотрим матричную игру ГА, определенную мат­ рицей

-Б 3

Соответствующие ей задачи линейного программирования имеют следующий вид:

min^ + ^2,

max^+f/2,

1+2£2>1,

4ij!<l,

3{

2>1,

2»h + 3ij2<l,

Заметим, что эти задачи в эквивалентной форме могут быть записа­ ны для ограничений типа равенств:

min^ + ij,

max ^+7/2,

1+2£2-£з = 1,

4 ^ + ^з = 1,

30

2-£4=1>

2 ^ + 3 ^ + ^ = 1 ,

£i>0, £2^0, Z3>0, £4>0,

п^О, t,2>0, т]2>0,

Таким образом, любой метод решения задач линейного про­ граммирования может быть приспособлен для решения матричных игр. Наиболее распространенным методом решения таких задач является симплекс-метод, систематическое изложение которого мо­ жно найти в [16, 25, 73].

6.2. Задача линейного программирования в определенном смыс­

ле эквивалентна матричной игре Гл.

Действительно, рассмотрим

следующие прямую и двойственную задачи линейного програм­

мирования

 

 

 

minxu

(6.9)

 

xA^w,

 

х>0;

 

 

maxyw

(6.10)

 

Ау^и,

 

у>0.

 

Пусть X и Y — множества оптимальных решений задач (6.9) и (6.10)

соответственно. _

Обозначим

(11в)Х={х/в\хеХ},

(\1в)¥={у1в\уе¥},в>0.

Теорема. Пусть Гл (тхп)-игра с положительной матрицей А (все элементы положительны) и даны две двойственные задачи линейного программирования (6.9) и (6.10). Тогда имеют место сле­ дующие утверждения.

1. Обе задачи линейного программирования имеют решение (ХФ0 и УФ0), при этом

0=min хм=max yw.

ху

2.Значение vA игры ГА равно

астратегии

х* = х16,у*=у1в,

являются оптимальными, где хеХ оптимальное решение прямой

задачи (6.9), ayefдвойственной задачи (6.10).

3. Любые оптимальные стратегии х*еХ* и y*eY* игроков мо­ гут быть построены указанным способом, т. е.

Х* = (1/в)Х, Г* = (1/в)?.

Доказательство. Утверждения 1, 2 и включения (\l&)XczX*,

31

l/OYczY* непосредственно следуют из доказательства теоремы п. 6.1.

Покажем обратное включение. Для этого рассмотрим векторы

х* = (Л*. •••> &)еХ* и х=(^, .... 1т), где х=0х*. Тогда для всех jeN имеем

xaJ=Bx*aJ> 0(1/0)= 1,

при этом х>0, так как б>0 и х*>0. Поэтому х— допустимое решение задачи (6.9).

Вычислим значение целевой функции

хи=вх*и = в=min xu,

X

т. е. хеХ— оптимальное решение задачи (6.9).

Аналогично доказывается включение Y*cz(l/0)Y. Теорема до­ казана.

§ 7. СВОЙСТВА ОПТИМАЛЬНЫХ СТРАТЕГИЙ И ЗНАЧЕНИЯ ИГРЫ

Рассмотрим свойства оптимальных стратегий, которые в ряде случаев помогают находить значение игры и ситуацию равновесия.

7.1. Пусть (х*, у*)еХх

Y— ситуация в смешанных стратегиях

в игре Г^. Оказывается, что для проверки ситуации (х*, у*) на

равновесность неравенства (4.7) достаточно проверять не для всех

хеХ и yeY,

а лишь для

ieM

и jeN, поскольку

справедливо

следующее утверждение.

 

 

 

 

Теорема. Для того чтобы ситуация (х*, у*) была равновесной

в игре ТА, а число v=K(x*. у*) значением

игры Тл

необходимо

и достаточно выполнение следующих неравенств

для всех ieM

njeN:

 

 

 

 

 

 

K(i,y*)*ZK(x*,y*)^K(x*,j),

 

(7.1)

Доказательство. Необходимость. Пусть (х*, у*) — ситу­

ация равновесия в игре Г^. Тогда

 

 

 

 

К(х,у*)^К(х*,у*)*Щх*,у)

 

 

для всех xeX.yeY. Поэтому, в частности, для щеХл

и^е У имеем

K(i, y*)=K(uit y*)^K(x*,

у*НЦх*.

Wj) = K(x*,j)

для всех ieM

ujeN.

 

 

 

 

Достаточность. Пусть (х*, у*) — пара смешанных стратегий, для которой выполняются неравенства (7.1). Пусть также х=(£19 ...

..., £т)еХя y = (rjit .... q„)e Y— произвольные смешанные стратегии игроков 1 и 2 соответственно. Умножая первое и второе неравенства (7.1) на & и г\} соответственно и суммируя, получаем

32

£

{,Щ у*)^ Цх*. у*)% Ъ = К(х*, у*);

(7.2)

£

r,jK(x*,j)>K(x*, у*) £ r,j=K(x*, у*).

(7.3)

j-l

У-i

 

При этом имеем

 

 

 

£ Mi, >*)=*(*, у»);

(7.4)

 

/ - 1

 

 

t^^*,;) =^*,j;).

(7.5)

j-i

Подставляя (7.4), (7.5) в неравенства (7.2) и (7.3) соответственно и учитывая произвольность стратегий хеХя ye Y, получаем равно­ весность ситуации (х*. у*).

Следствие 1. Пусть (f, j*) ситуация равновесия в игре ГА. Тогда ситуация (/*, j*) равновесна и в игре ГА.

Пример 10. (Решение игры на уклонение.) Предполагается, что игроки выбирают целые числа / иУ между 1 и п, а игрок 1 выигрыва­ ет величину а.=\1—j \ , т. е. расстояние между числами / и /

Пусть

первый игрок придерживается

стратегии х* = (1/2, 0, ...

..., 0, i/2).

Тогда

 

 

 

 

K(x*,j)=\l2\\-j\

+ l/2\n-j\

= \l2(j-l)

+

ll2(n-j)=(n-W

для всех 1</^и.

— нечетно. Тогда игрок 2 имеет чистую стра­

а) Пусть n=2k+1

тегию j * = (п +1 )/2 = к+1 такую, что

 

 

 

o^ = |i-(n + l)/2| =

| i - * - l | < b = ( n - l ) / 2

для всех /=1, 2, ..., п.

б) Предположим, что п = 2к — четно. Тогда игрок 2 имеет та­

кую стратегию у* = (0, 0, ...,

х

2

.

1

2

 

к

2

+ =

1

/

2

>

 

/

 

/

, 0, ..., 0), где г\

, >7*1

 

 

rij = 0,j^k + l,j^k, что

 

 

 

 

 

 

 

 

 

 

 

 

 

Щ У*) = 1/21i-k|.+1/21i-k-11<1/2*+

l/2(fc-1) = (л-1)/2

 

 

 

 

для всех 1</<и.

Теперь, используя теорему, нетрудно убедиться, что значение игры v = (n—1)/2, игрок / имеет оптимальную стратегию х*, а оп­ тимальная стратегия игрока 2 равна j * , если и=2£+1, и у*, если

п= 2к.

7.2.Приведем результаты, являющиеся непосредственным след­ ствием теоремы п. 7.1.

Теорема. Пусть ГА — (тхп)-игра. Для того чтобы ситуация в смешанных стратегиях (х*, у*) была равновесной в игре ГА, необ-

33

ходимо и достаточно выполнение равенства

max K(i, у*) = min K(x*. j).

(7.6)

Доказательство. Необходимость. Если (х*. у*) — ситуа­ ция равновесия, то согласно теореме п. 7.1 имеем

K(i,y*)^K(x*,y*HK(x*,j)

для всех /б{1, ..., m},je{l, ..., и}. Поэтому

K(i,y*HK(x*,j)

для каждого i и / Предположим противное, т. е. (7.6) не выполнено.

Т о г д а

max Щ, у*) < min K(x*. j).

Следовательно, имеют место неравенства

К(х*. у*)= £

£Щ y*)*Z max Щ, у*)< min K(x*,j)^

 

^£ri;K(x\j)

= K(x*,y*).

j-1

Полученное противоречие и доказывает необходимость утвержде­ ния теоремы.

Достаточность. Пусть пара смешанных стратегий (х, у) тако­ ва, что max K(i, y)=min K(x, j). Покажем, что в этом случае

/j

(х, у) — ситуация равновесия в игре ГА. Справедливы соотношения

 

л

 

 

min Щ,

j)^^fjj

K(x, J)=К(х, у) =

= £

№ • Ж

max Щ

у).

Поэтому имеем

 

 

 

Щ, JO^max K(i, y)=K(x, y)=min

K(j, x)^K(x,j)

i

 

J

 

для всех 1«% i^m и^.</<и, тогда по теореме п. 7.1 (х, у) — ситуация

равновесия в игре Г^.

Из доказательства следует, что любое из чисел в (7.6) равно значению игры. _

7.3. Теорема. Для матричной игры YA справедливы следующие соотношения:

max min K(x, j)=vA=min

max K(i, у),

(7.7)

x j

у

i

 

34

причем экстремумы по смешанным стратегиям хиу в (7.7) достига­ ются на оптимальных стратегиях игроков.

Теорема является следствием теорем п. 3.4, 7.2, и ее доказатель­ ство предоставляем читателю.

7.4. Теорема. В матричной игре ГА множества оптимальных смешанных стратегий X* и Y* игроков являются выпуклыми много­ гранниками.

Доказательство. Согласно теореме п. 7.1 множество X* явля­ ется множеством всех решений системы неравенств

xaJ'^vA,jeN, хи=1,

х>0,

где и=(1, ..., \)eRm, vA—значение игры. Таким образом, X*— выпуклое многогранное множество (п. 5.1). С другой стороны, Х*<^Х, где X — выпуклый многогранник (п. 5.3). Поэтому X* — ограничено. Следовательно, по теореме п. 5.3 множество X* — вы­ пуклый многогранник.

Аналогично доказывается, что У* — выпуклый многогранник. 7.5. 6 качестве примера использования теоремы п. 7.3 приведем геометрическое решение игр с двумя стратегиями у одного из игроков ((2 х и)- и (т х 2)-игры). Такой подход в литературе также

называется графоаналитическим методом решения игр. В основе графоаналитических методов лежит свойство оптимальных страте­ гий х* и у* доставлять внешние экстремумы в равенстве

»4=max min K(x,j)=mm max K(i, у).

X J У I

Пример 11. ((2 x п)-игра). Рассмотрим игру, в которой игрок 1 имеет две стратегии, а игрок 2 — и стратегий. Матрица имеет вид

а 1 1

«12 - а1»"|

[а 21

а 22 "• a2nJ

Пусть игрок 1 выбрал смешанную стратегию х=(£, 1 —£), а иг­ рок 2 чистую стратегию jeN. Тогда выигрыш игрока 1 в ситуации

(х, J) равен

Kix.j^faMl-Ovy. (7.8)

Геометрически он представляет собой прямую в координатах (€, К). Таким образом, каждой чистой сратегии j соответствует своя прямая. Графиком функции

H(£)=mmK(.x,j)

35

является нижняя огибающая семей­ ства прямых (7.8). Эта функция вог­ нута как нижняя огибающая семей­ ства вогнутых (в данном случае ли­ нейных) функций (п. 5.5). Точка £*, в которой достигается максимум фу­ нкции Н{£) по £ е [0, 1], и дает требу­ емое оптимальное решение х* = (£*, 1 — £*) и значение игры vA=H(£,*).

Для определенности рассмотрим игру с матрицей

 

 

 

Л~

2

1 4 О

 

 

 

Для каждого j= 1, 2, 3, 4 имеем:

 

К(х, 1)= - £ + 2, /фс, 2) = 2£+1, /фс,

 

3;= - 3^+4, Дх, 4J=4£. Нижняя

рис 1

огибающая

#(£)

семейства прямых

{Щх, j)}

и

сами прямые

К(х, j),

 

j=\,

2,

3,

4, изображены

на рис.

1. Максимум #(£*) функции //(О находится на пересечении первой

и четвертой прямых. Таким образом, £* — решение уравнения

Откуда получаем

оптимальную

стратегию х* = (2/5, 3/5)

игрока

1 и значение игры vA — S/5. Оптимальную стратегию игрока 2 най­ дем из следующих соображений. Заметим, что в рассматриваемом случае К(х*. 1)=К(х*. 4)=«< = 8/5.

Для оптимальной стратегии y* = (tj\, г\г, т/3, т/4) должно выпол­ няться равенство

vA = K{x*. у*) = ц\ К(х*. l) + ri'2 К{х*, 2)+т/3 К(х*. 3) + т,4 Цх», 4).

При этом К(х*, 2)>8/5, К(х*, 3)>8/5, следовательно, 7/2 = 1/3 = О, а г\\, т/4 можно найти из условия (7.1)

ц\ + 4т,;= 8/5,

27,1 = 8/5.

Таким образом, 7/1 = 4/5 и т/4=1/5 и оптимальная стратегия игрока 2 равная* = (4/5, 0, 0, 1/5).

Пример 12. ((т х Ту-игра.) В этом примере Две стратегии имеет игрок 2, а игрок 1 т стратегий. Тогда матрица А имеет вид

а,

 

4 2

*21

«•22

Л =

 

а т1

0^2

36

Анализ этой игры проводится аналогично. Действительно, пусть

У ==(?/, 1 — TJ) — произвольная смешанная стратегия игрока 2. Тогда выигрыш игрока 1 в ситуации (i, у) равен

K(i, у)=ацГ1 + ап(1-г1) = (ап-а,п)г1 + аа-

График функции K(i, у) — прямая. Рассмотрим верхнюю огиба­ ющую этих прямых, т. е. функцию

H(ri)=max [(a,, - аа)п + a j .

i

Функция H{r\) выпуклая (как верхняя огибающая семейства выпук­ лых функций).

Точка минимума п* функции Н(п) дает оптимальную стратегию у* = (?/*, l — ri*) и значение игры vA=H(n*) = min Н(п).

, , „

<J6 [0. 1]

7.6. Приведем результат, полезный при отыскании решения

игры.

 

 

Теорема. Пусть х* = (£\,.... О яу* = (п\,..., п'^ оптимальные

стратегии в игре ГА

и vA значение игры. Тогда для любого i, при

котором K(i, y*)<vA,

имеет место равенство £*=0, а для любого

j такого, что vA<K(x*,j), имеет место равенство п]=0.

Обратно, если £*>(), то K(i, y*)=vA,

а если n)>Q, то K(x*,j)=vA.

Доказательство. Допустим, что для некоторого /0еД/ выпол­ нено K(i0, y*)<vA и при этом £*0#0. Тогда получаем, что

K(i0,y*K<vAil

Для всех ieM K(i, y*)^vA, поэтому

K(i,y*)£^vAC

Следовательно, К(х*. y*)<vA, что противоречит тому, что vA — зна­ чение игры. Вторая часть теоремы доказывается аналогично.

Этот результат является аналогом теоремы о дополняющей нежесткости [73] или, как ее еще называют, канонической теоремой равновесия для задачи линейного программирования [25].

Определение. Чистая стратегия ieM(jeN) игрока 1 (2) назы­ вается существенной или активной стратегией, если существует оптимальная стратегия х* = (£,\, .... \*„) (у* = (п\, .... пп)) этого игрока, для которой £>0 (fy>0).

Из определения и последней теоремы следует, что для каждой существенной стратегии i игрока 1 и любой оптимальной стратегии y*eY* игрока 2 в игре Г^ выполняется равенство

K(i,y*)=ao>*=vA.

Аналогичное равенство имеет место для любой существенной стратегии j eN игрока 2 и оптимальной стратегии х* еХ* игрока 1

37

K(x*,j) = aJx*=vA.

Если для чистой стратегии ie M и смешанной стратегии уе У выпол­ няется равенство a{y=vA, то говорят, что стратегия i уравновешива­ ет смешанную стратегию у в игре Г^.

Таким образом, в данной терминологии теорему можно перефо­ рмулировать следующим образом. Если чистая стратегия игрока существенна, то она уравновешивает любую оптимальную страте­ гию противника.

Знание спектра оптимальной стратегии упрощает нахождение решения игры. Действительно, пусть Мх> — спектр оптимальной

стратегии JC* игрока 1. Тогда каждая оптимальная стратегия у*= (г\\, .... г\*„) игрока 2 и значение игры v удовлетворяют системе

неравенств

aor*=v, ieM*.,

 

При этом в спектр М* любой оптимальной стратегии х* могут

входить лишь существенные стратегии.

7.7. В заключение параграфа приведем аналитическое решение игры «нападение — защита» (см. пример 4 п. 1.3)

Пример 13. Рассмотрим игру с(лхи) матрицей А

7*1*1 Ч ... Tj

А = чЯ2 ^ 2

ЧА. %.

Здесь

т,>0 — ценность,

а

0</?,<1—вероятность

поражения

объекта Q, /=1, 2, ..., л, при условии, что он защищен. Пусть

т12

<...<т)1. Определим

функцию ср от целых чисел 1, 2, ...

..., п следующим образом:

 

 

 

 

?(*)=[£ (WO^-lj^Ml-u)}-1,

(7.9)

и пусть /е{1, 2, ..., л} — целое число, доставляющее

максимум

функции (р(к), т. е.

 

 

 

 

(р(1)=

max q>(k).

(7.10)

к~\, 2,

Установим свойства функции (р(к). Обозначим символом R один из знаков отношения порядка {>, =, <}. В этом случае

38

 

 

<p(k)R(p(k+\)

 

(7.11)

тогда и только тогда, когда

 

 

 

 

•zkR(p(k), k=\,

2, ..., п-1,

т0 = 0.

(7.12)

Действительно, из (7.9) получаем

 

 

 

<№

О - А)" 1

, ,.ч

,. , ,

(1-АГ1

 

I

fofl-A)}-1

I fod-ft)}-1

i-Jfc+1

 

j-Jt-fl

Тогда имеем

 

 

И - l l

. " - М " +?(*)=.(*+!)•

(7.13)

L " J

Е Mi-ft»"'

 

i«*+l

Заметим, что коэффициент в (7.13), стоящий после квадратных скобок, положительный. Поэтому из (7.13) получаем эквивалент­ ность соотношений (7.11) и (7.12).

Теперь так как q>(l)^(p(l—l) или <р(/)>ф(/+1) (в этом случае т,_1<ф(/—1) или т,>ф(0), то из соотношений (7.10), (7.11) имеем

неравенство

(7.14)

т,_,<ф(0<тА

Найдем оптимальные стратегии в игре Г^. Напомним, что мы

предполагаем выполненными неравенства т1 2 ^...^тп . Тогда оп­

тимальными смешанными стратегиями х* = (£,\,

.... £*т) и y* = (t]\,

.... r\J игроков 1 и 2 соответственно являются следующие:

0, «=1, .... / - 1 ,

 

{

/"

(7 15)

Wi-ft)]"1 /! fed-/»/)]-1, '='--. «;

f<W=i / - 1 ,

 

^

ЦТУ-Ф((Я/М1-ДЙ, у-/, .... и.

( - J

а значение игры равно

 

 

«л = <?(%>•

л

Действительно, ^'^0, i= 1, 2,..., п и £ £*= 1 • Из определения <р(/)

л

и (7.14) получаем, что rjj^0,j=l, 2, ..., л и ^ ^*=1-

Пусть K{x*,j) — выигрыш игрока 1 в ситуации (x*,j), аналогич­ но K(i, у*) — выигрыш в ситуации (i, у*).

39