Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка 2 откорректированная24янв.doc
Скачиваний:
15
Добавлен:
27.11.2019
Размер:
1.83 Mб
Скачать

4. Неантагонистические (биматричные) игры

4.1. Бескоалиционная игра в нормальной форме

Реальные задачи принятия решения в условиях конфликта характеризуется большим числом участников и, как следствие этого, неантагонистичностью конфликтной ситуации. Интересы игроков могут пересекаться, но не обязательно быть противоположными. Это, в частности, может приводить к ситуациям, выгодным обоим игрокам, что делает осмысленным кооперирование (выбор согласованного решения), приводящее к увеличению выигрыша обоих игроков. Однако возможны такие конфликты, когда кооперация или соглашение невозможны по правилам игры. В связи с этим в неантагоничтических играх различают бескоалиционное поведение, когда соглашения между игроками запрещены правилами, и кооперативное поведение игроков, когда разрешается кооперация типа выбора совместных стратегий и совершения побочных платежей.

Система

, (4.1)

в которой N – множество игроков, Х – множество стратегий игрока, Н – функция выигрыша игрока, определенная на декартовом произведении множеств стратегий игроков, называется бескоалиционной игрой.

Бескоалиционная игра n лиц происходит следующим образом: игроки одновременно и независимо друг от друга выбирают свои стратегии из множества стратегий, в результате чего формируется ситуация. После этого каждый игрок получает выигрыш. На этом игра заканчивается.

Более подробному рассмотрению бескоалиционных игр посвящена см. глава 6.

4.2. Биматричные игры. Основы теории

В экономических ситуациях редко бывает, что интересы двух игроков прямо противоположны; очень часто оба игрока могут оказаться в выигрыше вследствие кооперирования. Такие игры называются играми с произвольной суммой. Частный случай биматричной игры – игры с нулевой суммой.

Вообще говоря, конечную игру двух лиц с произвольной суммой можно описать парой (m x n) – матриц

и (4.2)

или, что эквивалентно, (m x n) – матрицей (А, В), каждый элемент которой есть упорядоченная пара (аij, bij ). Элементы аij и bij являются выигрышами (в единицах полезности) соответственно игроков 1 и 2 в предположении, что они выберут соответственно свои i-ю и j-ю чистые стратегии. Игра в такой форме называется биматричной игрой.

Во многих случаях кооперирование между игроками может принести им обоим выгоду. Однако может случиться, что, хотя такая кооперация взаимовыгодна, она запрещена правилами игры.

В связи с этим для биматричных игр различаются два случая.

1. Некооперативные (бескоалиционные) игры, в которых запрещается любой тип соглашения ( например, совместный выбор стратегий и побочные платежи).

2. Кооперативные игры, в которых любая подобная кооперация разрешается.

Рассмотрим некооперативные игры. Мы можем определить смешанные стратегии игроков 1 и 2 соответственно как m- и n-векторы с неотрицательными компонентами, сумма которых равна 1.

Вообще, говорят, что ситуация (пара смешанных стратегий (х*, у*) в биматричной игре (А, В) является ситуацией равновесия, если для любых других смешанных стратегий х и у

,

Каждая биматричная игра имеет, по крайней мере, одну ситуацию равновесия.

Пример 4.1 (семейный спор). Рассмотрим биматричную игру

Очевидно, что чистые стратегии х = (1, 0) и у = (1, 0), а также х’ = (0, 1) и у’ = (0, 1) образуют ситуацию равновесия. С другой стороны, ситуации (х, у’) и (x’, у) не являются равновесными. Кроме того, выигрыш в этих двух ситуациях равновесия (х, у) и (х’, y’) различны; ситуация (х, у) предпочтительнее для игрока 1, а игрок 2 предпочитает (х’, y’). Вообще здесь трудно говорить о том, что может произойти.

Даже в случае, когда имеется только одна ситуация равновесия (что бывает часто), не очевидно, что она дает как раз то, что требуется.

Пример 4.2 (дилемма заключенного). Рассмотрим игру

В этой игре вторая строка доминирует над первой, второй столбец доминирует над первым. Следовательно, единственная ситуация равновесия достигается посредством вторых чистых стратегий каждого игрока. Она определяет вектор выигрышей (1, 1). Но если оба игрока сыграют «неправильно», т. е. выберут свои первые чистые стратегии, то в результате получится выигрыш (5, 5), что существенно лучше для обоих. Трудность состоит в том, что каждый из игроков может выиграть еще больше (без учета интереса другого).

Рассмотрим теперь случай игр, в которых допускается кооперирование между игроками. Это значит, что могут заключаться совместные соглашения, допускается совместный выбор смешанных стратегий, полезность может передаваться от одного игрока к другому.

Имеется некоторое множество исходов, которое можно получить, если два игрока действуют совместно. Если для двух игроков выберем пару функций полезности, то множество исходов можно отобразить в подмножество евклидовой плоскости R2. Образ такого множества будет замкнут и ограничен сверху. Задача состоит в том, чтобы из этого множества выбрать точку, которая будет удовлетворять обоих игроков.

Если дана игра двух игроков с произвольной суммой, то имеется некоторое подмножества S плоскости R2, называемое допустимым множеством. Оно допустимо в том смысле, что для любой точки (u, v) из подмножества S игроки, действуя совместно, могут получить соответственно полезности u и v.

Невозможно предвидеть, как будет действовать некоторое лицо, тем не менее, можно установить минимальную величину, которую оно получит в следствие односторонних действий при любых действиях другого игрока. Такой величиной является максиминное значение игры для этого игрока. Обозначим два значения для игроков 1 и 2 через u* и v*. Таким образом, в биматричной игре с матрицей (А, В)

u* = max min xAyT

x y

v* = max min xByT,

x y

где x и y выбираются из множеств всех смешанных стратегий.

Предположим, дано множество S и максиминные значения (u*, v*). Требуется найти решение:

 (S, u*, v*) = (u, v).

Следующие разумные условия. Аксиомы Дж. Нэша необходимо применить в отношении такой функции:

№ 1. Индивидуальная разумность, .

№ 2. Допустимость, .

№ 3. Оптимальность по Парето. Если (u, v) S и (u, v) , то (u, v) = .

№ 4. Независимость от посторонних альтернатив. Если T S и = (S, u*, v*), то =  (T, u*, v*).

Аксиома утверждает, что если точка есть решение задачи о сделках и если допустимое множество расширяется, то решением новой задачи будет либо сама , либо одна из новых точек, но никак не точка в старом меньшем множестве.

№ 5. Независимость от линейного преобразования. Пусть Т получается из S с помощью линейного преобразования

u’= 1u+1, v’= 2v+2

Тогда, если  (S, u*, v*) = , то

 (T, 1u* + 1, 2v* + 2) = (1 +2,2 + 2).

№ 6. Симметрия. Предположим, что S таково, что

(u, v) S (v, u) S.

Предположим также, что u* = v* и  (S, u*, v*) = . Тогда = .

Аксиома приемлема, если сделка идет между двумя одинаковыми игроками; она может оказаться неприемлемой в случае сделок между неодинаковыми игроками, например между лицом и коллективом.

№ 7. Монотонность. Если Т S, то

 (T, u*, v*) = <  (S, u*, v*).

Вообще, существует единственная функция , определенная для всех задач о сделках (S, x*, y*) и удовлетворяющая аксиомам № 1 – № 6. Это показывает, что аксиомам Нэша можно удовлетворить посредством единственной схемы.

Согласно схеме Нэша дополнительная полезность должна делиться между игроками в таком же отношении, в каком она может передаваться. Так как не предполагается, что полезность линейно трансферабельна, то естественно, что может оказаться лишь одна точка, в которой полезность передается в данном отношении (рис. 4.1).

В случае линейно трансферабельной полезности задача становится проще. Действительно, можно предполагать, что отношение, в котором может передаваться значение, равно 1:1, т. е. игрок 1 может передать единицу полезности игроку 2, лишаясь при этом только одной единицы. Таким образом, S содержит все точки, лежащие на некоторой прямой u + v = k или ниже нее (где k – максимально возможная полезность, которою эти два игрока могут получить совместно) и выше и правее точки (u*, v*) (рис. 4.2). Соответствующим решением Нэша будет точка , где

= (u* - v* + k)/ 2 и

= (v* - u* + k)/ 2.

В этом случае относительные положения игроков сохранились, а их полезности максимально возросли (т. е. избыток полезности делится поровну между игроками).

Рис. 4.1 Рис. 4.2

Пример 4.3. Двоим людям предлагают 100 долларов, если они смогут решить, как поделить эти деньги между собой. Предполагается, что первый из них очень богат, а второй имеет капитал всего в 100 долларов. Предполагается также, что полезность суммы денег пропорциональна ее логарифму. Как должны быть разделены эти деньги?

Так как первый игрок очень богат, мы можем предположить, что полезность x долларов, где x <= 100, пропорциональна x. Так как второй игрок имеет только 100 долларов, полезность, которую он получает от x долларов, равна

log (100 + x) – log 100= log (100 + x) / 100.

Таким образом, множество S будет выпуклой оболочкой точки (0, 0) и дуги кривой, задаваемой уравнением

v = log((200 – u) / 100).

Так как эта функция выпукла, S просто является областью, ограниченной данной кривой (рис. 4.3).

Рис. 4.3

Найдем точку в S, которая максимизирует uv, т. е. значение u, которое максимизирует функцию

g = u log ((200-u) / 100).

После дифференцирования и приравнивания нулю производной получаем уравнение u/(200-u) = log((200-u)/100). Решая его, получаем приближенно u = 54,4, Иначе говоря, игрок 1 должен получить 54,40 доллара, а игрок 2 – 45,60 доллара.

Решение учитывает, что фактически полезность денег у игрока 2 убывает быстро, а у игрока 1 медленно. В результате получается, что игрок 2 стремится получить хоть что-то и при сделке может уступить игроку 1.