Добавил:

vv_sokol Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Академия Государственной противопожарной службы МЧС России

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Управление и оптимизация / Novikov - Refleksiya i upravleniye 2013

.pdf

Скачиваний:

Добавлен:

02.09.2019

Размер:

3.17 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 427 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определе- нии исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.

Набор действий xτ*, τ Î Σ+, назовем информационным равно-

весием, если выполнены следующие условия:
1.	структура информированности I имеет конечную сложность;
2. λ, μ Σ+ Iλ = Iμ Þ xλ* = xμ*;
3.	" i Î N, " σ Î Σ
(1) x*	Arg max f	(θ	σi	, x*	,..., x*	, x , x*		..., x*	) .
σi	i		σi	σi1	σi,i−1	i	σi,i+1	σi,n
	xi X i

Первое условие в определении информационного равновесия означает, что в рефлексивной игре участвует конечное число реаль- ных и фантомных агентов.

Второе условие отражает требование того, что одинаково ин- формированные агенты выбирают одинаковые действия.

И, наконец, третье условие отражает рациональное поведение агентов – каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее действия других агентов, которые оказываются рациональными с точки зре- ния рассматриваемого агента в рамках имеющихся у него представ- лений о других агентах.

Необходимость третьего условия в определении информацион- ного равновесия, по-видимому, не вызывает сомнений. Приведем два примера, показывающих важность первых двух условий.

Примеры 2.3.1-2.3.2. В этих примерах участвуют два агента с целевыми функциями следующего вида:

f (θ , x , x ) = (θ - x )x -					x2				(θ , x , x		) = (θ - x )x			x2
f (θ , x , x ) = (θ - x )x -					1	,	f	2	(θ , x , x		) = (θ - x )x	2	-	2	,
1	1	2	2	1	2			2	1	2	1	2		2
					2									2

где xi Î Â1, i = 1, 2. Различие лишь в структурах информированно- сти.

Пример 2.3.1. Пусть структура информированности имеет сле- дующий вид (напомним, что в силу аксиомы автоинформированно- сти можно не рассматривать элементы с идущими подряд одинако- выми индексами):

θ1 = 1, θ12 = 3, θ121 = 5, θ1212 = 7, …; θ2 = 2, θ21 = 4, θ212 = 6, θ2121 = 8, … .

Она имеет бесконечную сложность. Система уравнений (1) в данном случае принимает следующий вид:

x1 = 1 – x12,	x2 = 2 – x21,
x12 = 3 – x121,	x21 = 4 – x212,
x121 = 5 – x1212,	x212 = 6 – x2121,
x1212 = 7 – x12121,	x2121 = 8 – x21212,
и т.д.;	и т.д.

Видно, что в системе счетное число уравнений, причем решений у нее бесконечно много – произвольно выбирая значения x1 и x2, можно выразить через них остальные переменные. ∙

Пример 2.3.2. Пусть структура информированности имеет сле- дующий вид: θσ = 1 для любого σ Σ+. Если при этом условие 2 определения информационного равновесия не выполнено, то в сис- теме (1) оказывается счетное число уравнений:

x1 = 1 – x12,	x2 = 1 – x21,
x12 = 1 – x121,	x21 = 1 – x212,
x121 = 1 – x1212,	x212 = 1 – x2121,
x1212 = 1 – x12121,	x2121 = 1 – x21212,
и т.д.;	и т.д.

И здесь, как и в примере 2.3.1, решений бесконечно много – произвольно выбирая значения x1 и x2, можно выразить через них остальные переменные. ∙

В соответствии с условием 2, для определения информационно- го равновесия требуется решить, казалось бы, бесконечное (счетное) число уравнений и получить столько же значений xτ*. Однако оказы- вается, что на самом деле число уравнений и значений конечно.

Утверждение 2.2.6. Если информационное равновесие xτ*, τ Σ+, существует, то оно состоит из не более чем ν попарно раз- личных действий, а в системе (1) содержится не более чем ν попарно различных уравнений.

Доказательство. Пусть xτ*, τ Σ+, – информационное равнове- сие. Тогда из конечности структуры информированности и условия 2 сразу следует, что попарно различных чисел xτ* не более ν.

Рассмотрим две любые тождественные структуры информиро- ванности: Iλ = Iμ. Соответственно, имеем θλ = θμ и xλ* =xμ*. Далее, для любого i N справедливо Iλi = Iμi, следовательно, xλi* = xμi*. Поэтому два уравнения системы (1), у которых в левой части стоят действия xλ* и xμ* , тождественно совпадают. ∙

Таким	образом, для нахождения информационного равновесия
xτ*, τ Σ+,	достаточно записать ν условий (1) для каждого из ν

попарно различных значений xτ*, отвечающих попарно различным структурам информированности Iτ.

Если все агенты являются одинаково информированными, то

сложность структуры информированности минимальна и равна числу агентов. В этом случае система (1) переходит в определение равновесия Нэша, а информационное равновесие – в равновесие Нэша.

Итак, в случае, когда все реальные агенты являются одинаково информированными (то есть рефлексивная реальность является общим знанием), информационное равновесие переходит в равнове- сие Нэша (фантомных агентов «не возникает»). Однако и в общем

случае между информационным равновесием и равновесием Нэша

существует тесная связь.
	Пусть имеется структура информированности I конечной слож-
ности ν с базисом { Iτ 1 , …, Iτ ν }. Тогда в информационном равнове-
сии	участвуют	реальные	и	фантомные	агенты из	множества
Ξ = {τ1, …, τν},		каждый	из	которых	выбирает	действие
{ xτ 1	, …, xτ ν } соответственно,			xτ l Xω (τ l	) , l {1, …, ν} – здесь и

далее в настоящем разделе будем обозначать ω(σ) последний индекс в последовательности σ, где σ Σ+.

Запишем целевую функцию каждого из агентов из множества Ξ

следующим образом:

(2) ϕτ l

( xτ 1 , …,

xτ ν ) =

fω (τ l ) (θτ l

, xσ 1 , …,

xσ ν ),

где

Iτ l i =

Iσ i ,

σi Ξ для

всех

i N, l {1, …, ν}. Заметим, что

Iσ

τ l

= Iτ ω( ) = I

, поэтому соотношение (2) можно записать более

ω (

)

τ l

подробно в следующем виде:

(3) ϕ

τ l

1 ,..., x l 1

, x l , x l 1 ,..., x ) =

−

τ +

τν

= f ω (

) (θτ l

, xσ1 ,...,xσ

, xτ

, xσ

,...,xσ n) .

τ l

ω (τ l )−1

Содержательно соотношения (2) и (3) означают следующее: целевая функция, которую τl -агент (τl Ξ) максимизирует в рефлексивной игре, субъективно зависит от его представлений о параметре θ, от

его действия и от действий (n – 1) агента из множества Ξ. Иными словами, функция ϕτl существенно зависит лишь от переменных

{ xτ 1 , …, xτ ν } (и от величины θτl как от параметра), причем эта зависимость совпадает с функцией f i , где i = ω(τl). Поэтому функ- ция ϕτ l «наследует» свойства функции fω (τ1 ) .

Несколько забегая вперед, приведем следующий пример. Пусть граф рефлексивной игры (см. следующий раздел) выглядит как на Рис. 9, а целевые функции реальных агентов – fi(θ, x1, x2, x3), xi Xi, i {1, 2, 3}. Тогда в информационном равновесии участвуют пять агентов из множества Ξ = {1, 2, 3, 31, 32} со следующими целевыми функциями:

ϕ1(x1, x2, x3, x31, x32) = f1(θ1, x1, x2, x3); ϕ2(x1, x2, x3, x31, x32) = f2(θ2, x1, x2, x3); ϕ3(x1, x2, x3, x31, x32) = f3(θ3, x31, x32, x3); ϕ31(x1, x2, x3, x31, x32) = f1(θ31, x31, x32, x3); ϕ32(x1, x2, x3, x31, x32) = f2(θ32, x31, x32, x3).

С учетом соотношения (3) система уравнений (2) для определе- ния информационного равновесия (xτ*1 , ..., xτ*ν ) представима в виде:

xτ*l	= arg max ϕτ l			*	,..., xτ*l −1	, xτl	, xτl+1 ,..., xτν ) ,
xτ*l	= arg max ϕτ l			(xτl 1	,..., xτ*l −1	, xτl	, xτl+1 ,..., xτν ) ,
	x X ω (τ		)	−
	τ l	l

где l пробегает все значения от 1 до ν. Нетрудно видеть, что это не что иное, как система соотношений для определения равновесия Нэша в игре с одинаковой информированностью τl –агентов, l {1,…,ν}. Это обстоятельство позволяет применять к информаци- онному равновесию (соответствующим образом модифицировав) достаточные условия существования, известные для равновесия Нэша.

Например, известен следующий факт (см. [41, с. 74]): если в не- прерывной игре множества действий Xi – выпуклые подмножества линейных метрических пространств, для каждого агента целевая функция fi непрерывна по всем переменным и строго вогнута по переменной xi, то в этой игре существует равновесие Нэша в чистых стратегиях.

Этот факт можно переформулировать, получив достаточное ус-

ловие существования информационного равновесия в рефлексивной игре.

Утверждение 2.2.7. Пусть в рефлексивной игре со структурой информированности конечной сложности множества действий Xi – выпуклые подмножества линейных метрических пространств, для каждого агента целевая функция fi(θ, x1, …, xn) при любом θ Θ непрерывна по всем переменным и строго вогнута по переменной xi. Тогда в этой игре существует информационное равновесие.

Доказательство. Непрерывность по всем аргументам функции fi и ее строгая вогнутость по переменной xi означает непрерывность по всем аргументам функций ϕτ l (где τl Ξ, ω(τl) = i), определяемых

соотношениями (3), и строгую вогнутость каждой из них по xτl .

Поэтому утверждение сразу вытекает из приведенного выше факта

[41, с. 74]. ∙

Как нетрудно убедиться, требуемыми свойствами обладают це- левые функции из примеров 2.4.1-2.4.3. Поэтому информационное

равновесие для рефлексивных игр с этими функциями существует для любых структур информированности конечной сложности.

Информационное равновесие (см. (1)) является достаточно гро- моздкой конструкцией, и сразу увидеть связь между информацион-

ной структурой и информационным равновесием зачастую бывает затруднительно. Удобным языком описания взаимной информиро- ванности агентов и выразительным средством анализа свойств ин- формационного равновесия является граф рефлексивной игры, к описанию которого мы и переходим.

2.4. ГРАФ РЕФЛЕКСИВНОЙ ИГРЫ

Если структура информированности имеет конечную слож- ность, то можно построить граф рефлексивной игры, наглядно показывающий взаимосвязь между действиями агентов (как реаль- ных, так и фантомных), участвующих в равновесии.

Вершинами этого ориентированного графа являются действия xτ, τ Σ+, отвечающие попарно нетождественным структурам ин-

формированности Iτ, или компоненты структуры информированно- сти qτ, или просто номер t реального или фантомного агента, t Î S+.

Между вершинами проведены дуги по следующему правилу: к каждой вершине xσi проведены дуги от (n – 1) вершин, отвечающих структурам Iσij, j Î N \ {i}. Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.

Подчеркнем, что граф рефлексивной игры соответствует систе- ме уравнений (2.3.1) (то есть определению информационного равно- весия), в то время как решения ее может и не существовать.

Итак, граф GI рефлексивной игры ГI (см. определение рефлек- сивной игры в предыдущем разделе), структура информированности которой имеет конечную сложность, определяется следующим образом:

-вершины графа GI соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетож- дественным структурам информированности;

-дуги графа GI отражают взаимную информированность аген- тов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом.

Если в вершинах графа GI изображать представления соответст- вующего агента о состоянии природы, то рефлексивная игра ГI с конечной структурой информированности I может быть задана

кортежем ГI = {N, (Xi)i N, fi(×)i N, GI}, где N – множество реальных агентов, Xi – множество допустимых действий i-го агента,

fi(×): Q ´ X’ ® Â1 – его целевая функция, i Î N, GI – граф рефлексив- ной игры.

Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа GI, а не дерева информационной структуры.

Рассмотрим несколько примеров нахождения информационного равновесия.

Примеры 2.4.1-2.4.3. В этих примерах участвуют три агента с целевыми функциями следующего вида:

fi (θ , x1, x2 , x3 ) = (θ − x1 − x2 − x3 )xi − x2i2 ,

где xi ³ 0, i Î N = {1, 2, 3}; q Î Q = {1, 2}.

Содержательно, xi – объем выпуска продукции i-ым агентом, θ – спрос на производимую продукцию. Тогда первое слагаемое в целе-

вой функции может интерпретироваться как произведение цены на объем продаж – выручка от продаж (см. модели олигополии Курно в [1, 233, 243]), а второе слагаемое – как затраты на производство.

Для краткости будем называть агента, считающего, что спрос низкий (θ = 1), пессимистом, а считающего, что спрос высокий (θ = 2) – оптимистом. Таким образом, в примерах 2.4.1-2.4.3 ситуа- ции различаются лишь вследствие различных структур информиро- ванности.

Пример 2.4.1. Пусть первые два агента оптимисты, а третий – пессимист, причем все трое одинаково информированы. Тогда, в соответствии с утверждением 2.2.5, для любого σ Σ выполняются

тождества Iσ1 = I1, Iσ2 = I2, Iσ3 = I3.

В соответствии со свойством 2 определения информационного равновесия, аналогичные соотношения выполняются для равновес- ных действий xσ*.

Видно, что любая структура информированности тождественна одной из трех, образующих базис: {I1, I2, I3}. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 8.

Рис. 8. Граф рефлексивной игры в примере 2.4.1

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

ìx* =

2 - x2* - x3*

2 - x*

- x*

íx2* =

íx2*

= 0.

ïx3* =

1- x1

- x2

ïx3

Таким образом, действия агентов в ситуации информационного равновесия будут следующими: x1* = x2* = 1/2, x3* = 0. ∙

Пример 2.4.2. Пусть первые два агента оптимисты, а третий – пессимист, который считает всех трех агентов одинаково информи- рованными пессимистами. Первые два агента одинаково информи- рованы, причем оба они адекватно информированы о третьем агенте.

Имеем: I1 ~ I2, I1 > I3, I2 > I3, I1 ~3 I2 ~3 I3. Граф рефлексивной иг- ры изображен на Рис. 9.

x31

x32

Рис. 9. Граф рефлексивной игры в примере 2.4.2

Эти условия можно записать в виде следующих тождеств, имеющих место для любого σ Σ (воспользуемся соответствующи- ми определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

I12σ = I2σ, I13σ = I3σ, I21σ = I1σ, I23σ = I3σ, I3σ1 = I31, I3σ2 = I32, I3σ3 = I3.

Аналогичные соотношения выполняются для равновесных дей- ствий xσ*. Левые части этих тождеств показывают, что любая струк- тура Iσ при |σ|>2 тождественна некоторой структуре Iτ, |τ|<|σ|. По-

этому глубина структуры I не превосходит двух и, следовательно, она имеет конечную сложность. Правые части показывают, что базис образуют следующие структуры: {I1, I2, I3, I31, I32} (нетрудно убедиться, что они попарно различны).

Таким образом, сложность данной структуры информированно- сти равна пяти, а глубина равна двум.

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

ì	x	*	=		2 - x*			- x*					ì				9
ï							2		3		,			x	*	=					,
											,				*
	1						3						ï				20
ï							3						ï	1			20
ï					2 - x*			- x*					ï				9
ïx2*			=				1		3		,		ïx2*			=					,
							3
																	20
ï													ï				20
ï				1- x			*	- x		*			ï				1
ï				1- x			31	- x		32			ï				1
íx3*			=				31			32		,	íx3*			=			,
íx3*			=				3					,	íx3*			=	5		,
ï							3						ï				5
ï					1- x*				- x*				ï		*		1
ï	x*		=				32			3		,	ï	x31		=				,
							32			3							5

		31					3
ï							3						ï
ï						1- x31* - x3*							ï					1
ïx*			=									,	ïx32*			=		1		.


ï		32					3						ï				5
î							3						î				5

Таким образом, действия реальных агентов в ситуации инфор- мационного равновесия будут следующими: x1* = x2* = 9/20, x3* = 1/5. ∙

Пример 2.4.3. Пусть все трое агентов оптимисты, первый и вто- рой взаимно информированы, второй и третий также взаимно ин- формированы. По мнению первого агента, третий считает всех троих одинаково информированными пессимистами; также и первый агент, по мнению третьего, считает всех троих одинаково информи- рованными пессимистами.

Имеем: I1 >< I2, I2 >< I3, I1 ~13 I2 ~13 I3, I1 ~31 I2 ~31 I3.

I12σ = I2σ, I13σ1 = I131, I13σ2 = I132, I13σ3 = I13, I21σ = I1σ,

I23σ = I3σ, I31σ1 = I31, I31σ2 = I312, I31σ3 = I313, I32σ=I2σ.

Аналогичные соотношения выполняются для равновесных дей- ствий xσ*.

Левые части этих тождеств показывают, что любая структура Iσ при |σ| > 3 тождественна некоторой структуре Iτ, |τ| < |σ|. Поэтому глубина структуры I не превосходит трех и, следовательно, она имеет конечную сложность. Правые части тождеств показывают, что в базис могут входить лишь следующие структуры информирован-

ности: I1, I2, I3, I31, I13, I131, I132, I312, I313.

Далее, для любого σ Σ справедливы соотношения

θ131σ = θ31σ = θ313σ = θ13σ = θ123σ = θ213σ = 1, из которых вытекают тож-

дества I131 = I31, I313 = I13, I123 = I213.

Таким образом, базис образуют следующие попарно различные

структуры: {I1, I2, I3, I31, I13, I132}. Cложность данной структуры ин- формированности равна шести, а глубина равна трем. Граф соответ-

ствующей рефлексивной игры изображен на Рис. 10.

x13

x31

x132

Рис. 10. Граф рефлексивной игры в примере 2.4.3

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

<<< < Предыдущая 1 2 3 4 5 67 / 427 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Управление и оптимизация

#
02.09.2019720.85 Кб51Baktolov - Zadachi raspredeleniya resursov 2002.pdf
#
02.09.20191.37 Mб59Borzdova - Informatsionniye tekhnologii v biznese 2012.pdf
#
02.09.20191.92 Mб120Kislinskikh - Istoriya upravlencheskoy misli 2015.pdf
#
02.09.20193.36 Mб57Larichev - Teoriya i metodi prinyatiya resheniy 2000.pdf
#
02.09.2019539.06 Кб48Novikov - Mekhanizmi upravleniya obrazovatelnikh sistem 2001.pdf
#
02.09.20193.17 Mб59Novikov - Refleksiya i upravleniye 2013.pdf
#
02.09.20193.38 Mб52Novikov - Teoriya upravleniya organizatsionnimi sistemami 2005.pdf
#
02.09.20191.28 Mб49Novikov - Vvedeniye v upravleniye obrazovatelnimi sistemami 2009.pdf
#
02.09.20192.13 Mб50Osnovi informatsionnikh i komputernikh tekhnologiy 2011.pdf
#
02.09.20191.72 Mб51Osnovi menedzhmenta i organizatsionnoe povedeniye.pdf
#
02.09.20191.08 Mб53Ryazanov - Teoriya upravleniya sotsialno-ekonomicheskimi sistemami 2010.pdf