Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление и оптимизация / Novikov - Refleksiya i upravleniye 2013

.pdf
Скачиваний:
59
Добавлен:
02.09.2019
Размер:
3.17 Mб
Скачать

его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определе- нии исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.

Набор действий xτ*, τ Î Σ+, назовем информационным равно-

весием, если выполнены следующие условия:

 

1.

структура информированности I имеет конечную сложность;

2. λ, μ Σ+ Iλ = Iμ Þ xλ* = xμ*;

 

 

 

3.

" i Î N, " σ Î Σ

 

 

 

 

 

(1) x*

Arg max f

σi

, x*

,..., x*

, x , x*

..., x*

) .

σi

i

 

σi1

σi,i−1

i

σi,i+1

σi,n

 

 

xi X i

 

 

 

 

 

 

 

 

Первое условие в определении информационного равновесия означает, что в рефлексивной игре участвует конечное число реаль- ных и фантомных агентов.

Второе условие отражает требование того, что одинаково ин- формированные агенты выбирают одинаковые действия.

И, наконец, третье условие отражает рациональное поведение агентов каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее действия других агентов, которые оказываются рациональными с точки зре- ния рассматриваемого агента в рамках имеющихся у него представ- лений о других агентах.

Необходимость третьего условия в определении информацион- ного равновесия, по-видимому, не вызывает сомнений. Приведем два примера, показывающих важность первых двух условий.

Примеры 2.3.1-2.3.2. В этих примерах участвуют два агента с целевыми функциями следующего вида:

f (θ , x , x ) = - x )x -

x2

 

 

(θ , x , x

) = - x )x

 

 

x2

1

,

f

2

2

-

2

,

1

1

2

2

1

2

 

 

1

2

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где xi Î Â1, i = 1, 2. Различие лишь в структурах информированно- сти.

Пример 2.3.1. Пусть структура информированности имеет сле- дующий вид (напомним, что в силу аксиомы автоинформированно- сти можно не рассматривать элементы с идущими подряд одинако- выми индексами):

θ1 = 1, θ12 = 3, θ121 = 5, θ1212 = 7, …; θ2 = 2, θ21 = 4, θ212 = 6, θ2121 = 8, … .

61

Она имеет бесконечную сложность. Система уравнений (1) в данном случае принимает следующий вид:

x1 = 1 – x12,

x2 = 2 – x21,

x12 = 3 – x121,

x21 = 4 – x212,

x121 = 5 – x1212,

x212 = 6 – x2121,

x1212 = 7 – x12121,

x2121 = 8 – x21212,

и т.д.;

и т.д.

Видно, что в системе счетное число уравнений, причем решений у нее бесконечно много произвольно выбирая значения x1 и x2, можно выразить через них остальные переменные. ∙

Пример 2.3.2. Пусть структура информированности имеет сле- дующий вид: θσ = 1 для любого σ Σ+. Если при этом условие 2 определения информационного равновесия не выполнено, то в сис- теме (1) оказывается счетное число уравнений:

x1 = 1 – x12,

x2 = 1 – x21,

x12 = 1 – x121,

x21 = 1 – x212,

x121 = 1 – x1212,

x212 = 1 – x2121,

x1212 = 1 – x12121,

x2121 = 1 – x21212,

и т.д.;

и т.д.

И здесь, как и в примере 2.3.1, решений бесконечно много произвольно выбирая значения x1 и x2, можно выразить через них остальные переменные. ∙

В соответствии с условием 2, для определения информационно- го равновесия требуется решить, казалось бы, бесконечное (счетное) число уравнений и получить столько же значений xτ*. Однако оказы- вается, что на самом деле число уравнений и значений конечно.

Утверждение 2.2.6. Если информационное равновесие xτ*, τ Σ+, существует, то оно состоит из не более чем ν попарно раз- личных действий, а в системе (1) содержится не более чем ν попарно различных уравнений.

Доказательство. Пусть xτ*, τ Σ+, – информационное равнове- сие. Тогда из конечности структуры информированности и условия 2 сразу следует, что попарно различных чисел xτ* не более ν.

Рассмотрим две любые тождественные структуры информиро- ванности: Iλ = Iμ. Соответственно, имеем θλ = θμ и xλ* =xμ*. Далее, для любого i N справедливо Iλi = Iμi, следовательно, xλi* = xμi*. Поэтому два уравнения системы (1), у которых в левой части стоят действия xλ* и xμ* , тождественно совпадают. ∙

62

Таким

образом, для нахождения информационного равновесия

xτ*, τ Σ+,

достаточно записать ν условий (1) для каждого из ν

попарно различных значений xτ*, отвечающих попарно различным структурам информированности Iτ.

Если все агенты являются одинаково информированными, то

сложность структуры информированности минимальна и равна числу агентов. В этом случае система (1) переходит в определение равновесия Нэша, а информационное равновесие в равновесие Нэша.

Итак, в случае, когда все реальные агенты являются одинаково информированными (то есть рефлексивная реальность является общим знанием), информационное равновесие переходит в равнове- сие Нэша (фантомных агентов «не возникает»). Однако и в общем

случае между информационным равновесием и равновесием Нэша

существует тесная связь.

 

 

 

 

 

Пусть имеется структура информированности I конечной слож-

ности ν с базисом { Iτ 1 , …, Iτ ν }. Тогда в информационном равнове-

сии

участвуют

реальные

и

фантомные

агенты из

множества

Ξ = {τ1, …, τν},

каждый

из

которых

выбирает

действие

{ xτ 1

, …, xτ ν } соответственно,

xτ l Xω (τ l

) , l {1, …, ν} – здесь и

далее в настоящем разделе будем обозначать ω(σ) последний индекс в последовательности σ, где σ Σ+.

 

 

Запишем целевую функцию каждого из агентов из множества Ξ

следующим образом:

 

 

 

 

 

 

(2) ϕτ l

( xτ 1 , …,

xτ ν ) =

fω (τ l ) (θτ l

, xσ 1 , …,

xσ ν ),

 

 

где

Iτ l i =

Iσ i ,

σi Ξ для

всех

i N, l {1, …, ν}. Заметим, что

Iσ

τ l

= Iτ ω( ) = I

 

l

, поэтому соотношение (2) можно записать более

 

ω (

 

)

l

τ l

 

τ

 

 

 

 

 

 

 

 

подробно в следующем виде:

 

 

 

 

(3) ϕ

τ l

(x

1 ,..., x l 1

, x l , x l 1 ,..., x ) =

 

 

 

 

 

 

τ

 

τ

 

τ

τ +

τν

 

 

 

 

 

 

 

 

 

 

 

 

 

= f ω (

) (θτ l

, xσ1 ,...,xσ

, xτ

, xσ

,...,xσ n) .

 

 

 

 

 

 

 

 

 

 

τ l

 

 

ω (τ l )−1

l

ω (τ l )−1

Содержательно соотношения (2) и (3) означают следующее: целевая функция, которую τl -агент l Ξ) максимизирует в рефлексивной игре, субъективно зависит от его представлений о параметре θ, от

63

его действия и от действий (n – 1) агента из множества Ξ. Иными словами, функция ϕτl существенно зависит лишь от переменных

{ xτ 1 , …, xτ ν } (и от величины θτl как от параметра), причем эта зависимость совпадает с функцией f i , где i = ω(τl). Поэтому функ- ция ϕτ l «наследует» свойства функции fω (τ1 ) .

Несколько забегая вперед, приведем следующий пример. Пусть граф рефлексивной игры (см. следующий раздел) выглядит как на Рис. 9, а целевые функции реальных агентов fi(θ, x1, x2, x3), xi Xi, i {1, 2, 3}. Тогда в информационном равновесии участвуют пять агентов из множества Ξ = {1, 2, 3, 31, 32} со следующими целевыми функциями:

ϕ1(x1, x2, x3, x31, x32) = f11, x1, x2, x3); ϕ2(x1, x2, x3, x31, x32) = f22, x1, x2, x3); ϕ3(x1, x2, x3, x31, x32) = f33, x31, x32, x3); ϕ31(x1, x2, x3, x31, x32) = f131, x31, x32, x3); ϕ32(x1, x2, x3, x31, x32) = f232, x31, x32, x3).

С учетом соотношения (3) система уравнений (2) для определе- ния информационного равновесия (xτ*1 , ..., xτ*ν ) представима в виде:

xτ*l

= arg max ϕτ l

*

,..., xτ*l −1

, xτl

, xτ*l+1 ,..., xτ*ν ) ,

(xτl 1

 

x X ω (τ

)

 

 

 

 

τ l

l

 

 

 

 

 

где l пробегает все значения от 1 до ν. Нетрудно видеть, что это не что иное, как система соотношений для определения равновесия Нэша в игре с одинаковой информированностью τl агентов, l {1,…,ν}. Это обстоятельство позволяет применять к информаци- онному равновесию (соответствующим образом модифицировав) достаточные условия существования, известные для равновесия Нэша.

Например, известен следующий факт (см. [41, с. 74]): если в не- прерывной игре множества действий Xi выпуклые подмножества линейных метрических пространств, для каждого агента целевая функция fi непрерывна по всем переменным и строго вогнута по переменной xi, то в этой игре существует равновесие Нэша в чистых стратегиях.

64

Этот факт можно переформулировать, получив достаточное ус-

ловие существования информационного равновесия в рефлексивной игре.

Утверждение 2.2.7. Пусть в рефлексивной игре со структурой информированности конечной сложности множества действий Xi выпуклые подмножества линейных метрических пространств, для каждого агента целевая функция fi(θ, x1, …, xn) при любом θ Θ непрерывна по всем переменным и строго вогнута по переменной xi. Тогда в этой игре существует информационное равновесие.

Доказательство. Непрерывность по всем аргументам функции fi и ее строгая вогнутость по переменной xi означает непрерывность по всем аргументам функций ϕτ l (где τl Ξ, ω(τl) = i), определяемых

соотношениями (3), и строгую вогнутость каждой из них по xτl .

Поэтому утверждение сразу вытекает из приведенного выше факта

[41, с. 74]. ∙

Как нетрудно убедиться, требуемыми свойствами обладают це- левые функции из примеров 2.4.1-2.4.3. Поэтому информационное

равновесие для рефлексивных игр с этими функциями существует для любых структур информированности конечной сложности.

Информационное равновесие (см. (1)) является достаточно гро- моздкой конструкцией, и сразу увидеть связь между информацион-

ной структурой и информационным равновесием зачастую бывает затруднительно. Удобным языком описания взаимной информиро- ванности агентов и выразительным средством анализа свойств ин- формационного равновесия является граф рефлексивной игры, к описанию которого мы и переходим.

2.4. ГРАФ РЕФЛЕКСИВНОЙ ИГРЫ

Если структура информированности имеет конечную слож- ность, то можно построить граф рефлексивной игры, наглядно показывающий взаимосвязь между действиями агентов (как реаль- ных, так и фантомных), участвующих в равновесии.

Вершинами этого ориентированного графа являются действия xτ, τ Σ+, отвечающие попарно нетождественным структурам ин-

65

формированности Iτ, или компоненты структуры информированно- сти qτ, или просто номер t реального или фантомного агента, t Î S+.

Между вершинами проведены дуги по следующему правилу: к каждой вершине xσi проведены дуги от (n – 1) вершин, отвечающих структурам Iσij, j Î N \ {i}. Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.

Подчеркнем, что граф рефлексивной игры соответствует систе- ме уравнений (2.3.1) (то есть определению информационного равно- весия), в то время как решения ее может и не существовать.

Итак, граф GI рефлексивной игры ГI (см. определение рефлек- сивной игры в предыдущем разделе), структура информированности которой имеет конечную сложность, определяется следующим образом:

-вершины графа GI соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетож- дественным структурам информированности;

-дуги графа GI отражают взаимную информированность аген- тов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом.

Если в вершинах графа GI изображать представления соответст- вующего агента о состоянии природы, то рефлексивная игра ГI с конечной структурой информированности I может быть задана

кортежем ГI = {N, (Xi)i N, fi(×)i N, GI}, где N множество реальных агентов, Xi множество допустимых действий i-го агента,

fi(×): Q ´ X® Â1 его целевая функция, i Î N, GI граф рефлексив- ной игры.

Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа GI, а не дерева информационной структуры.

Рассмотрим несколько примеров нахождения информационного равновесия.

Примеры 2.4.1-2.4.3. В этих примерах участвуют три агента с целевыми функциями следующего вида:

fi (θ , x1, x2 , x3 ) = (θ − x1 x2 x3 )xi x2i2 ,

где xi ³ 0, i Î N = {1, 2, 3}; q Î Q = {1, 2}.

66

Содержательно, xi объем выпуска продукции i-ым агентом, θ – спрос на производимую продукцию. Тогда первое слагаемое в целе-

вой функции может интерпретироваться как произведение цены на объем продаж выручка от продаж (см. модели олигополии Курно в [1, 233, 243]), а второе слагаемое как затраты на производство.

Для краткости будем называть агента, считающего, что спрос низкий (θ = 1), пессимистом, а считающего, что спрос высокий (θ = 2) – оптимистом. Таким образом, в примерах 2.4.1-2.4.3 ситуа- ции различаются лишь вследствие различных структур информиро- ванности.

Пример 2.4.1. Пусть первые два агента оптимисты, а третий пессимист, причем все трое одинаково информированы. Тогда, в соответствии с утверждением 2.2.5, для любого σ Σ выполняются

тождества Iσ1 = I1, Iσ2 = I2, Iσ3 = I3.

В соответствии со свойством 2 определения информационного равновесия, аналогичные соотношения выполняются для равновес- ных действий xσ*.

Видно, что любая структура информированности тождественна одной из трех, образующих базис: {I1, I2, I3}. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 8.

x1

x2

x3

Рис. 8. Граф рефлексивной игры в примере 2.4.1

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

67

ìx* =

2 - x2* - x3*

,

 

ì

x

*

=

1

 

,

 

 

 

 

 

 

 

 

 

 

 

ï

1

3

 

 

 

 

ï

 

2

 

 

 

 

 

 

1

 

 

 

ï

 

2 - x*

- x*

 

 

ï

 

 

 

1

 

 

ï

 

 

 

ï

 

 

 

 

 

íx2* =

1

3

,

 

íx2*

=

 

 

,

3

 

2

 

ï

 

 

 

 

ï

 

 

 

 

 

ï

 

*

*

 

 

 

ï

 

*

= 0.

 

ïx3* =

1- x1

- x2

,

 

ïx3

 

3

 

 

 

 

 

 

î

 

 

 

 

 

î

 

 

 

 

 

 

Таким образом, действия агентов в ситуации информационного равновесия будут следующими: x1* = x2* = 1/2, x3* = 0. ∙

Пример 2.4.2. Пусть первые два агента оптимисты, а третий пессимист, который считает всех трех агентов одинаково информи- рованными пессимистами. Первые два агента одинаково информи- рованы, причем оба они адекватно информированы о третьем агенте.

Имеем: I1 ~ I2, I1 > I3, I2 > I3, I1 ~3 I2 ~3 I3. Граф рефлексивной иг- ры изображен на Рис. 9.

x1

x2

x3

x31

x32

Рис. 9. Граф рефлексивной игры в примере 2.4.2

Эти условия можно записать в виде следующих тождеств, имеющих место для любого σ Σ (воспользуемся соответствующи- ми определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

I12σ = I, I13σ = I, I21σ = I, I23σ = I, I3σ1 = I31, I3σ2 = I32, I3σ3 = I3.

Аналогичные соотношения выполняются для равновесных дей- ствий xσ*. Левые части этих тождеств показывают, что любая струк- тура Iσ при |σ|>2 тождественна некоторой структуре Iτ, |τ|<|σ|. По-

68

этому глубина структуры I не превосходит двух и, следовательно, она имеет конечную сложность. Правые части показывают, что базис образуют следующие структуры: {I1, I2, I3, I31, I32} (нетрудно убедиться, что они попарно различны).

Таким образом, сложность данной структуры информированно- сти равна пяти, а глубина равна двум.

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

ì

x

*

=

 

2 - x*

- x*

 

 

ì

 

 

 

9

 

 

 

ï

 

 

 

 

 

2

 

3

,

 

 

x

*

=

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

3

 

 

 

 

 

 

ï

 

20

 

ï

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

ï

 

 

 

 

2 - x*

- x*

 

 

ï

 

 

 

9

 

 

 

ïx2*

=

 

 

 

 

1

 

3

,

 

 

ïx2*

=

 

 

,

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

ï

 

 

 

 

 

 

 

 

 

 

 

 

 

ï

 

 

 

 

 

 

 

 

1- x

*

- x

*

 

 

 

ï

 

 

 

1

 

 

 

 

ï

 

 

 

31

32

 

 

ï

 

 

 

 

 

 

 

íx3*

=

 

 

 

 

 

 

,

 

íx3*

=

 

 

 

,

 

 

 

 

 

 

3

 

 

5

 

ï

 

 

 

 

 

 

 

 

 

 

 

 

ï

 

 

 

 

 

 

 

ï

 

 

 

 

1- x*

 

- x*

 

 

ï

 

*

 

1

 

 

 

ï

x*

=

 

 

 

32

 

3

,

 

ï

x31

=

 

 

 

 

,

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

31

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

ï

 

 

 

 

 

 

 

 

 

 

 

 

ï

 

 

 

 

 

 

 

 

 

 

 

 

1- x31* - x3*

 

 

 

 

 

 

 

1

 

 

 

ïx*

=

,

 

ïx32*

=

.

 

 

 

 

 

 

 

ï

 

32

 

 

 

 

 

3

 

 

 

 

 

ï

 

 

 

5

 

 

 

î

 

 

 

 

 

 

 

 

 

 

 

 

î

 

 

 

 

 

 

Таким образом, действия реальных агентов в ситуации инфор- мационного равновесия будут следующими: x1* = x2* = 9/20, x3* = 1/5. ∙

Пример 2.4.3. Пусть все трое агентов оптимисты, первый и вто- рой взаимно информированы, второй и третий также взаимно ин- формированы. По мнению первого агента, третий считает всех троих одинаково информированными пессимистами; также и первый агент, по мнению третьего, считает всех троих одинаково информи- рованными пессимистами.

Имеем: I1 >< I2, I2 >< I3, I1 ~13 I2 ~13 I3, I1 ~31 I2 ~31 I3.

Эти условия можно записать в виде следующих тождеств, имеющих место для любого σ Σ (воспользуемся соответствующи- ми определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

I12σ = I, I13σ1 = I131, I13σ2 = I132, I13σ3 = I13, I21σ = I,

I23σ = I, I31σ1 = I31, I31σ2 = I312, I31σ3 = I313, I32σ=I.

69

Аналогичные соотношения выполняются для равновесных дей- ствий xσ*.

Левые части этих тождеств показывают, что любая структура Iσ при |σ| > 3 тождественна некоторой структуре Iτ, |τ| < |σ|. Поэтому глубина структуры I не превосходит трех и, следовательно, она имеет конечную сложность. Правые части тождеств показывают, что в базис могут входить лишь следующие структуры информирован-

ности: I1, I2, I3, I31, I13, I131, I132, I312, I313.

Далее, для любого σ Σ справедливы соотношения

θ131σ = θ31σ = θ313σ = θ13σ = θ123σ = θ213σ = 1, из которых вытекают тож-

дества I131 = I31, I313 = I13, I123 = I213.

Таким образом, базис образуют следующие попарно различные

структуры: {I1, I2, I3, I31, I13, I132}. Cложность данной структуры ин- формированности равна шести, а глубина равна трем. Граф соответ-

ствующей рефлексивной игры изображен на Рис. 10.

x2

x1

x3

x13

x31

x132

Рис. 10. Граф рефлексивной игры в примере 2.4.3

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

70