Добавил:

vv_sokol Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Академия Государственной противопожарной службы МЧС России

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Управление и оптимизация / Novikov - Refleksiya i upravleniye 2013

.pdf

Скачиваний:

Добавлен:

02.09.2019

Размер:

3.17 Mб

Скачать

☆

<<< < Предыдущая 15 16 17 18 19 20 21 22 23 24 25 2627 / 4227 28 29 30 31 32 33 34 35 36 37 38 39 > Следующая >>>

Мотивационному управлению соответствует изменение пара- метров {λi}, которые могут интерпретироваться как внутренние (внутрифирменные, трансфертные и т.д.) цены. Примеры подобного управления приведены в [93, 112] как для задач планирования (когда центр назначает цены на основании сообщений агентов о неизвест- ных ему эффективностях их деятельности), так и для задач стимули- рования (когда доход агента рассматривается как вознаграждение, получаемое от центра).

Информационному управлению соответствует целенаправлен- ное изменение центром информации, используемой агентами при принятии решений. Действительно, величины (3)–(5) могут быть вычислены и центром, и агентами на основании имеющейся у них априори информации. При этом оценка состояния природы – рыноч- ная цена θ – входит в них параметрически, следовательно, в зависи- мости от информированности участника системы, вычисляемые им значения параметров (3)-(5) могут различаться.

Пусть рыночная цена неизвестна агентам или известна неточно.

Информационное регулирование в рассматриваемой модели за-

ключается в сообщении центром агентам оценки θ0 Θ состояния природы (то есть центр использует однородную стратегию). В силу принципа доверия (который, как отмечалось выше, заключается в том, что агенты полностью доверяют сообщенной центром инфор- мации и используют ее при принятии своих решений) агенты выбе- рут действия {x*i(θ0)}, определяемые (4), что приведет к суммарному действию X(θ0), определяемому (3).

Пусть Φ(x, θ) – целевая функция центра, θ0 – его информация о состоянии природы (будем считать, что информация верна). Тогда задача информационного регулирования заключается в максимиза- ции сообщением θ* Θ гарантированного значения целевой функ- ции центра на множестве равновесных при данном сообщении со- стояний агентов:

(6)Φ(x*(θ* ), θ0) → max .

θ*Ω

Активный прогноз в рассматриваемой модели заключается в сообщении центром агентам информации о будущих значениях результатов их деятельности – например, о суммарном действии.

Пусть X* 1+ – сообщение центра. Тогда, воспользовавшись (5), агенты могут однозначно восстановить значение состояния

261

природы, на которое должен бы был ориентироваться центр, рассчи- тывая на сообщенное им суммарное действие.

Задача активного прогнозирования заключается в максимизации сообщением X* значения целевой функции центра на множестве равновесных при данном сообщении состояний агентов:

(7) Φ(x*(Θ(X*)), q0) ® max .

X * 1+

При известных зависимостях (3)–(5) задачи (6) и (7) являются стандартными задачами оптимизации.

Отметим, что в данном примере эффективности активного про- гноза и информационного регулирования одинаковы, так как оценка

состояния природы восстанавливается по результату деятельности однозначно.

Рассмотрим случай, когда затраты каждого агента возрастают по действиям других агентов (этому соответствует знак «минус» в знаменателе функции затрат (2)).

Пусть центру достоверно известно, что внешняя цена q0 равна единице, агенты знают лишь, что q Θ = [0; 3]. Будем считать, что целевая функция центра определяется суммарным доходом 1×X за вычетом суммарных затрат агентов.

Тогда задача (6) имеет вид:

(8) X(q) – c1(x*(q), r1) – c2(x*(q), r2) → max ,

θ [0;3]

где X(q) и x*(q) определяются соответственно выражениями (3) и (4). Предполагая, что агенты одинаковы (r1 = r2 = 1) и подставляя

(3) и (4) в (8), получим, что целевая функция центра следующим образом зависит от его сообщения:

(9) Φ(x*(q), q) = θ (4 −θ ) .

4 + θ

Максимум выражения (9) на отрезке [0; 3] достигается в точке q* = 4 ( 2 – 1). Следовательно, решение задачи информационного регулирования – сообщение центром агентам оценки q*. Отметим, что эта оценка отличается от «истинной» оценки q0 = 1, то есть центру выгодно искажать информацию.

Небезынтересно рассмотреть вопрос о том, каковы будут выиг-

рыши агентов в случае единичной истинной цены и сообщения

центра q* = 4 ( 2 – 1). Нетрудно убедиться, что выигрыш каждого из них будет меньше ожидаемого, но больше того выигрыша, кото-

262

рый он получил бы в случае сообщения центром истинной цены. Вывод несколько парадоксальный – агентам выгодно, чтобы от них скрыли истинное значение цены! Объясняется это тем, что равнове- сие Нэша не является в данном случае Парето-оптимальным, и центр своим сообщением «сдвигает» точку информационного равновесия к Парето-оптимуму.

Рассмотрим теперь задачу активного прогнозирования (7). Ее решение заключается в вычислении на основании информации о θ* по выражению (5) величины X(θ*) и сообщение ее агентам в качестве прогноза X0 их суммарных действий. Легко подсчитать, что сообще- ние центром X0 = 2 (2 – 2 ) побуждает агентов восстановить оценку θ* состояния природы и выбрать требуемые для центра действия.

Если бы центру было невыгодно искажать информацию, то это значило бы, что именно сообщение агентам истинного состояния

природы побуждает их прийти в наиболее выгодное для центра состояние. Другими словами, совпадение θ* и θ0 является частным случаем и может рассматриваться как «случайное».

Отметим, что целевая функция центра при единичной истинной

цене имеет вид

				x2		x2
Φ(x,1) = x + x	2	−		1	−	2	.

1			2	− x2		2 − x1

Максимум этой функции на множестве 0 ≤ x1 < 2, 0 ≤ x2 < 2 дос-

тигается в точках x1 = x2 = 2 – 2 , которые и достигаются при по- мощи описанных информационных воздействий – информационного регулирования и приводящего к тому же результату активного про- гноза (для того, чтобы в этом убедиться, достаточно найти максимум целевой функции центра по всем парам (x1, x2)). Поэтому это управ- ление, состоящее в формировании структуры информированности единичной глубины, является оптимальным на множестве всех структур информированности. Это означает, в частности, что фор-

мирование центром более сложных структур информированности агентов (т. е. осуществление рефлексивного управления) не дает увеличения эффективности по сравнению с информационным регу- лированием и активным прогнозом.

263

4.9.КОНКУРЕНЦИЯ НА РЫНКЕ

Внастоящем разделе рассматривается модель, в которой цена на продукцию агентов зависит от суммарного объема производства.

В качестве неопределенного параметра выступают характеристики агентов (их эффективности). Рассмотрена задача активного прогно- зирования, когда центр, стремясь минимизировать рыночную цену, сообщает агентам суммарный объем производства (т. е. сумму их действий). Оказывается, что при некоторых предположениях сооб- щение точного прогноза минимизирует цену.

Если в разделе 4.8 рынок был ненасыщен и подразделения рас-

сматриваемой фирмы могли продавать на рынке любое количество продукции по фиксированной цене, которая являлась неопределен- ным параметром (состоянием природы), то в данной модели предпо-

лагается, что спрос задан экзогенно в виде X(l), где X – суммарный выпуск (суммарное действие агентов), а l – рыночная цена. Если X(×)

– строго монотонно убывающая непрерывная функция, то существу- ет обратная ей функция l(X), отражающая зависимость рыночной цены от предложения, которая также строго монотонно убывает и непрерывна.

Предположим, что агентам объективно не известны эффектив- ности (параметры функций затрат) друг друга. Однако для каждого i N i-й агент знает свой тип ri, имеет представления о типах оппо- нентов rij, j N, и считает известный ему набор типов общим знани- ем. Иными словами, информационная структура игры задается

соотношениями riσj = rij, i, j N, s Σ.

Целевая функция j-го агента с точки зрения i-го агента есть:

	x2
(1) fj(x, rij) = l(X) xj –	j	, i, j N,
(1) fj(x, rij) = l(X) xj –	2r	, i, j N,
	ij

где x = (x1, x2, …, xn) X’ – вектор действий агентов, имеющих сепа-

рабельные затраты cj(x) = x2 / 2 rj, j N.

Каждый агент считает, что играет в игру с общим знанием. Из условий равновесия получаем действия агентов:

(2) x*ij =	rij λ(X )	, i, j N.
	− λ'(X )r
1
	ij

Далее рассмотрим два варианта конкретизации функции l(X).

264

Пусть λ(X) = λ0 – γ X, λ0, γ > 0. Тогда если подставить λ(X) в (2), получаем:

(3) x*ij =		rij λ0			, i, j N,
(3) x*ij =	(1 + γr )(1+ γα			)	, i, j N,
	(1 + γr )(1+ γα			)
		ij	i
где		rij
(4) αi = å		rij	, i N.
(4) αi = å		1+ γr	, i N.
	j N	ij

Исследуем информационное равновесие для случая двух аген- тов (n = 2) при условии, что центр осуществляет активный прогноз. Пусть при этом r1 = r2 = λ0 = γ =1.

Из (3) получаем, что суммарное действие в зависимости от

предположений агентов о типе партнера равно

(5) X(r12, r21) =	2 + α1 +	α2	,
	2(1+ α1)(1	+ α2 )

где α1 = ½ + r12 / (1+r12), α2 = ½ + r21 / (1 + r21).

Пусть задача центра заключается в обеспечении суммарного действия равного X. Рассмотрим, какой прогноз X0 решает эту зада- чу.

С точки зрения первого агента, которому сообщен прогноз X0, целевые функции выглядят следующим образом:

f1(x1, x2) = (1 – x1 – x2) x1 –		x2
		1	,
	2		,
	2
f2(x1, x2) = (1 – x1 – x2) x2 –		x22	,
f2(x1, x2) = (1 – x1 – x2) x2 –	2r		,
	2r
	2

где параметр r2 ему неизвестен. Для нахождения равновесия Нэша первый агент приравнивает к нулю производные этих функций, что приводит (с учетом прогноза) к следующей системе уравнений:

ì1- x2 - 3x1 = 0,
ï			æ	1				ö
ï			æ					ö
ï			ç		+			÷	= 0,
í1			ç				2	÷
í1	- x1 - ç r						2	÷ y2
ï			è 2					ø
ïx + x		2	= X		0	.
î	1	2			0

Эта система имеет единственное решение					3X 0 −1
x1 =	1- X0	, x2 =	3X0 -1	, r2 =		.

	2		2		3 − 5X 0

265

Заметим, что по смыслу ситуации эти три значения должны быть положительны. Это накладывает естественное ограничение на

возможные сообщения центра: 13 < X0 < 53 .

В итоге получаем, что равновесная стратегия первого агента та-

кова: x* = 1− X0		. Рассуждая аналогично с	точки зрения второго
1	2
	2			1− X0 .
агента, получаем его равновесную стратегию:			x2* =	1− X0 .
				2

Таким образом, сообщая прогноз X0, центр добивается суммар- ного действия X = x1* + x2* = 1− X 0 . Очевидно, единственным точным

прогнозом центра в описываемой ситуации является X0 = ½.

Пусть теперь зависимость цены от суммарного действия двух агентов задается соотношением λ(X) = 1/X. Тогда целевые функции

агентов имеют вид

f1(x1, x2) =		x			x2	, f2(x1, x2) =		x				x2
		1		–	1				2		–	2	.
		1		–					2		–		.
	x	+ x	2		2		x	+ x		2		2r
1			2				1			2		2

Дифференцируя эти функции по соответствующим переменным и приравнивая производные к нулю, найдем равновесные стратегии агентов:

r r

x* =

1 2

r ,

x* =

1 2

r .

Предположим, что r1 = r2 =1,

и каждому агенту известен свой

тип, но неизвестен тип другого агента, то есть первому агенту неиз- вестно значение r2, а второму – значение r1.

Будем считать, что центр стремится минимизировать цену, со- общая агентам ее прогноз. Выясним, какой прогноз является опти- мальным (то есть минимизирующим реальное значение цены).

Если центр сообщает прогноз цены λ, то первый агент может

определить тип второго агента

из уравнения

= x1 + x2

r1r2

r2 .

1 λ

Имеем: r2

, откуда x1

1+ 1

λ +1

λ2

266

Повторяя эти же рассуждения для второго агента, получаем его

равновесную стратегию:	x2* =	λ		.
		λ2	+1

Таким образом, при сообщении центром прогноза цены λ ис- тинное значение цены Λ окажется следующим:

Λ(λ) =		1	=	λ2 +1 .
Λ(λ) =	x* + x*		=	λ2 +1 .
	x* + x*			2λ
1		2

Легко видеть, что минимум функции Λ(λ) достигается в точке λ = 1. Это значение и будет оптимальным. При этом Λ(1) = 1, то есть оптимальный прогноз центра является точным прогнозом, а агенты получают именно те выигрыши, на которые рассчитывали при выбо- ре стратегии.

4.10.АККОРДНАЯ ОПЛАТА ТРУДА

Внастоящем разделе рассматривается модель, которая отражает ситуацию, в которой вознаграждение коллектива агентов за работу имеет следующий вид: каждый агент получает фиксированное воз- награждение, если агрегированный результат деятельности агентов (например, сумма их действий) превышает заданный норматив; вознаграждение равно нулю, если норматив не выполнен.

Агенты имеют иерархию представлений о нормативе. Помимо общего знания рассматриваются следующие варианты:

– представления агентов о нормативе попарно различны; тогда либо никто из агентов не работает, либо один агент выполняет весь объем работ;

– если структура информированности имеет глубину два, и каж- дый из агентов субъективно считает, что играет в игру с асиммет- ричным общим знанием, то множество возможных равновесных

ситуаций максимально и совпадает со множеством индивидуально рациональных действий;

– если структура информированности имеет глубину два, и на ее нижнем уровне имеет место симметричное общее знание, то и в этом случае множество информационных равновесий является макси- мально возможным.

267

Полученные результаты полностью подтверждают интуитивно правдоподобный качественный вывод: в коллективе работников совместная работа возможна (является равновесием) лишь в том случае, когда имеется общее знание о том, какой объем работ необ- ходимо выполнить для получения вознаграждения. Кроме того,

незначительное изменение информационной структуры приводит к существенному изменению информационного равновесия.

Интересно, что в рассматриваемой ниже модели возможно сле- дующее стабильное информационное равновесие: каждый агент считает, что именно за счет его усилий выполнен весь объем работ и это всем известно (и даже является общим знанием).

Рассмотрим организационную систему, состоящую из центра и n агентов, осуществляющих совместную деятельность.

Стратегией i-го агента является выбор действия yi Î Xi = 1+ ,

i Î N, стратегией центра – выбор системы стимулирования, опреде-

ляющей размер вознаграждения каждого агента в зависимости от результата их совместной деятельности. Предположим, что техноло- гия взаимодействия агентов такова, что для достижения требуемого результата необходимо, чтобы сумма их действий была не меньше заданной величины θ Î Q. В этом случае i-й агент получает от цен- тра фиксированное вознаграждение σi, i Î N, в случае же å yi < θ

i N

вознаграждение каждого агента равно нулю.

Реализация действия yi ³ 0 требует от i-го агента затрат ci(y, ri), где ri > 0 – его тип (параметр, описывающий индивидуальные харак- теристики), i Î N.

Относительно функций затрат агентов предположим, что ci(y, ri)

– непрерывная возрастающая по yi и убывающая по ri функция,

причем

" y-i Î X-i = ∏X j , " ri > 0 ci(0, y-i, ri) = 0, i Î N.

j N \{i}

Описанную модель взаимодействия будем далее называть игрой «Аккордная оплата труда».

Определим множество индивидуально рациональных действий агентов:

IR = {y Î X' = ∏ Xi | " i Î N σi ³ ci(ri)}.

i N

268

Если затраты агентов сепарабельны, то есть затраты ci(yi, ri) ка- ждого агента зависят только от его собственных действий и не зави-

сят от действий других агентов, получаем, что IR = ∏[0; yi+ ], где

		i N
yi+ = max {yi ³ 0 \| ci(yi, ri) £ si}, i Î N.
Обозначим
Y(q) = {y Î X' \| å yi = q}, Y*(q) = Arg	min	å ci ( y, ri ) .
i N	y Y (θ )	i N

Рассмотрим последовательно различные варианты информиро- ванности агентов о значении параметра q Î Q. Как мы увидим, даже небольшое усложнение структуры информированности может суще- ственно изменить множество информационных равновесий рассмат- риваемой рефлексивной игры.

Вариант I. Предположим, что значение q Î Q является общим знанием. Тогда равновесием игры агентов является параметрическое равновесие Нэша, принадлежащее множеству

(1) EN(q) = IR Ç Y(q).

Определим также множество эффективных по Парето действий агентов:

(2) Par(q) = IR Ç Y*(q).

Так как " q Î Q Y*(q) Í Y(q), то из (1) и (2) следует, что множе- ство эффективных по Парето действий является одним из равнове- сий Нэша. Но множество равновесий Нэша может оказаться шире –

в частности, при q ³ max yi+ оно всегда содержит вектор нулевых

i N

действий.

Пусть функции затрат агентов являются функциями затрат типа Кобба–Дугласа: ci(yi, ri) = ri j(yi / ri), где j(×) – гладкая монотонно возрастающая выпуклая функция, удовлетворяющая равенству j(0) = 0.

Тогда (см., например [112]) эффективной по Парето является

единственная точка: y*(q) = { yi* (q)}, где yi* (q) = q ri / årj , i Î N.

j N

Вычислим yi+ = ri j -1(si / ri), i Î N, тогда при

(7) si ³ ri j(q / årj ), i Î N,

j N

множество Парето не пусто.

269

Множества равновесий Нэша в игре n = 2 агентов для двух зна- чений θ: θ2 > θ1 приведены на Рис. 72 (точка (0; 0) является равнове- сием Нэша в обоих случаях).

θ2

θ1

2 EN(θ2) EN(θ1) y*(θ2)

y*(θ1)

tg(α) = r2/r1

y1+

θ1

θ2

Рис. 72. Параметрическое равновесие Нэша игры агентов

Итак, мы рассмотрели простейший вариант информированности агентов, соответствующий ситуации, когда значение параметра θ Θ является общим знанием. Рассмотрим следующий (в порядке возрастания сложности структуры информированности агентов) вариант информированности, в рамках которого общим знанием являются индивидуальные представления {θi} агентов о значении параметра θ Θ.

Вариант II. Предположим, что представления агентов о неопре- деленном параметре попарно различны, но при этом являются об- щим знанием. Иными словами, имеет место асимметричное общее знание.

Не ограничивая общности, занумеруем агентов таким образом, чтобы их представления возрастали: θ1 < … < θn. Структура возмож-

270

<<< < Предыдущая 15 16 17 18 19 20 21 22 23 24 25 2627 / 4227 28 29 30 31 32 33 34 35 36 37 38 39 > Следующая >>>

Соседние файлы в папке Управление и оптимизация

#
02.09.2019720.85 Кб51Baktolov - Zadachi raspredeleniya resursov 2002.pdf
#
02.09.20191.37 Mб59Borzdova - Informatsionniye tekhnologii v biznese 2012.pdf
#
02.09.20191.92 Mб120Kislinskikh - Istoriya upravlencheskoy misli 2015.pdf
#
02.09.20193.36 Mб57Larichev - Teoriya i metodi prinyatiya resheniy 2000.pdf
#
02.09.2019539.06 Кб48Novikov - Mekhanizmi upravleniya obrazovatelnikh sistem 2001.pdf
#
02.09.20193.17 Mб59Novikov - Refleksiya i upravleniye 2013.pdf
#
02.09.20193.38 Mб52Novikov - Teoriya upravleniya organizatsionnimi sistemami 2005.pdf
#
02.09.20191.28 Mб49Novikov - Vvedeniye v upravleniye obrazovatelnimi sistemami 2009.pdf
#
02.09.20192.13 Mб50Osnovi informatsionnikh i komputernikh tekhnologiy 2011.pdf
#
02.09.20191.72 Mб51Osnovi menedzhmenta i organizatsionnoe povedeniye.pdf
#
02.09.20191.08 Mб53Ryazanov - Teoriya upravleniya sotsialno-ekonomicheskimi sistemami 2010.pdf