Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление и оптимизация / Voronin - Matematicheskiye modeli organizatsiy 2008

.pdf
Скачиваний:
61
Добавлен:
02.09.2019
Размер:
4.06 Mб
Скачать

совокупность стратегий центра и агента (различают как явные, то есть зафиксированные с юридической точки зрения (большинство страховых и долговых контрактов являются явными), так и неявные, то есть не заключаемые формально или подразумеваемые контракты (в ряде случаев таковыми являются трудовые контракты), контракты.

Так как результат деятельности агента, значение которого определяет полезности участников ОС, зависит от неопределенных параметров, то будем считать, что при принятии решений они усредняют свои полезности по известному распределению вероятностей и выбирают стратегии, максимизирующие соответствующую ожидаемую полезность.

Оптимальным является контракт, который наиболее выгоден для центра (максимизирует его целевую функцию), при условии, что агенту взаимодействие с центром также выгодно. Последнее означает, что с точки зрения агента, как и в рассмотренной в разделе 3.1 модели, одновременно должны выполняться два условия – условие участия и условие индивидуальной рациональности.

Исторически первые работы по теории контрактов появились в начале 70-х годов прошлого века как попытка объяснения в результате анализа теоретико-игровых моделей наблюдаемого противоречия между результатами макроэкономических теорий и фактическими данными по безработице и инфляции в развитых странах.

Одно из «противоречий» заключалось в следующем. Существуют три «типа» заработной платы: рыночная заработная плата (резервная полезность, на которую может рассчитывать данный работник), эффективная заработная плата (та заработная плата, которая максимизирует эффективность деятельности работника с точки зрения предприятия; в большинстве случаев эффективная заработная плата определяется из условия равенства предельного продукта, производимого работником, и предельных затрат этого работника) и фактическая заработная плата (та зарплата, которую получает работник). Статистические данные свидетельствовали, что фактическая зарплата не равна эффективной заработной плате.

В первых моделях теории контрактов рассматривались задачи определения оптимального числа нанимаемых работников при учете только ограничения участия и фиксированных стратегиях центра, затем появились работы, посвященные методам решения задач

191

управления (задач синтеза оптимальных контрактов), сформулированных с учетом и ограничения участия, и условия согласованности, затем акцент сместился на изучение более сложных моделей, описывающих многоэлементные и динамические модели, возможность перезаключения контрактов и т.д. (см. обзор в [38]).

С точки зрения эффектов страхования [7, 38] (перераспределения риска) интересен следующий сделанный в теории контрактов вывод: различие между эффективной и фактической зарплатой качественно может быть объяснено тем, что нейтральный к риску центр страхует несклонных к риску работников от изменений величины заработной платы в зависимости от состояния природы: стабильность заработной платы обеспечивается за счет того, что в благоприятных1 ситуациях величина вознаграждения меньше эффективной заработной платы, зато в неблагоприятных ситуациях она выше той, которая могла бы быть без учета перераспределения риска2. Приведем пример, иллюстрирующий это утверждение.

Пусть у агента имеются два допустимых действия: A = {y1; y2},

и возможны два результата: A0

= {z1; z2}, P =

 

p

1 − p

 

 

 

,

1

 

 

 

 

p

p

 

 

 

 

½ < p ≤ 1. Содержательно, результат деятельности агента в большинстве случаев (так как p > ½) «совпадает» с соответствующим действием.

Обозначим затраты агента по выбору первого и второго действия c1 и c2 соответственно, c2 ³ c1; ожидаемый доход центра от выбора первого и второго действия – H1 и H2 соответственно; стимулирование агента за первый и второй результат деятельности – s1 и s2 соответственно; целевую функцию центра, представляющую

1На деятельность предприятий и, следовательно, на величину заработной платы, оказывают влияние как внешние макропараметры (сезонные колебания, периоды экономического спада и подъема, мировые цены и т.д.), так и микропараметры (состояние здоровья работника и т.д.).

2Быть может, именно важностью этого вывода обусловлено то, что в работах по теории контрактов рассматриваются практически только модели с внешней вероятностной неопределенностью (в детерминированном случае, или в случае неопределенности при нейтральном к риску агенте, эффекты страхования, естественно, пропадают, и фактическая заработная плата равна эффективной).

192

собой разность между доходом и стимулированием – Φ, целевую функцию агента, представляющую собой разность между стимулированием и затратами – f.

Задача центра заключается в назначении системы стимулирования, которая максимизировала бы ожидаемое значение его целевой функции1 EΦ при условии, что выбираемое агентом действие максимизирует ожидаемое значение Ef его собственной целевой функции.

Допустим, что агент нейтрален к риску (то есть его функция полезности, отражающая отношение к риску, линейна), и рассмотрим какую систему стимулирования центр должен использовать, чтобы побудить агента выбрать действие y1. В предположении равенства нулю резервной полезности задача поиска минимальной системы стимулирования, реализующей действие y1, имеет вид (первое ограничение является ограничением согласованности стимулирования, второе – ограничением индивидуальной рациональности агента):

(1) p σ1 + (1 – p) σ2 min

σ1 ³0,σ 2 ³0

(2) p σ1 + (1 – p) σ2 – c1 ³ p σ2 + (1 – p) σ1 – c2

(3) p σ1 + (1 – p) σ2 – c1 ³ 0.

Задача (1)-(3) является задачей линейного программирования. Множество значений стимулирования, удовлетворяющих усло-

виям (2) и (3), заштриховано на Рис. 3.16, его подмножество, на котором достигается минимум выражения (1), выделено жирной линией (линия уровня функции (1), отмеченная на Рис. 3.16 пунктирной линией, имеет тот же наклон, что и отрезок2 А1B1, направление возрастания отмечено стрелкой).

1Символ «E» обозначает оператор математического ожидания.

2Отметим, что наличие множества решений при нейтральных к риску центре и агенте является характерной чертой задач теории контрактов. В то же время, введение строго вогнутой функции полезности агента (отражающей его несклонность к риску) приводит к единственности решения – см. ниже.

193

σ2

A1

с1 /(1-p)

C1

(c2 - с1)/(2p-1)

B1 σ1

0

с1

/p

 

Рис. 3.16. Реализация центром действия y1 при нейтральном к риску агенте

Для определенности в качестве решения (в рамках гипотезы благожелательности) выберем из отрезка C1B1 точку С1, характеризуемую следующими значениями:

(4)σ1 = [p c1 – (1 – p) c2] / (2 p – 1),

(5)σ2 = [p c2 – (1 – p) c1] / (2 p – 1).

Легко проверить, что ожидаемые затраты центра на стимулирование Eσ(y1) по реализации действия y1 равны c1, то есть

(6) Eσ(y1) = с1.

Предположим теперь, что центр хочет реализовать действие y2. Решая задачу, аналогичную (1)-(3), получаем (см. точку С2 на Рис. 3.17):

(7)σ1 = [p c1 – (1 – p) c2] / (2 p – 1),

(8)σ2 = [p c2 – (1 – p) c1] / (2 p – 1),

(9)Eσ(y2) = с2.

На втором шаге центр выбирает, какое из допустимых действий ему выгоднее реализовать, то есть какое действие максимизирует разность между доходом и ожидаемыми затратами центра на стимулирование по его реализации. Таким образом, ожидаемое значение целевой функции центра при заключении оптимального контракта равно Φ* = max {H1 – c1, H2 – c2}.

194

min
v1 ³0, v2 ³0

σ2

A2

с2 /p

C2

(c2 - с1)/(2p-1)

σ1

B2

0

с2

/(1-p)

 

Рис. 3.17. Реализация центром действия y2 при нейтральном к риску агенте

Исследуем теперь эффекты страхования в рассматриваемой модели. Пусть агент не склонен к риску, то есть оценивает неопределенные величины своего дохода в соответствии со строго возрастающей строго вогнутой функцией полезности u(×). Так как от случайной величины – результата деятельности агента – зависит его вознаграждение (значение функции стимулирования), то предположим, что целевая функция агента имеет вид:

(10) f(s(×), z, y) = u(s(z)) – c(y).

Обозначим1 v1 = u(s1), v2 = u(s2), u-1(×) – функция, обратная к функции полезности u(×) агента, и предположим, что функция полезности неотрицательна и в нуле равна нулю.

Пусть центр заинтересован в побуждении агента к выбору действия y1. Задача стимулирования в рассматриваемой модели примет вид (первое ограничение является ограничением согласованности стимулирования, второе – ограничением индивидуальной рациональности агента):

(11) p u-1(v1) + (1 – p) u-1(v2) ®

1 Подобная замена переменных, позволяющая линеаризовать систему ограничений, используется в так называемом двушаговом методе решения задачи теории контрактов.

195

(12)p v1 + (1 – p) v2 c1 ³ p v2 + (1 – p) v1 – c2

(13)p v1 + (1 – p) v2 – c1 ³ 0.

Заметим, что линейные неравенства (12)-(13) совпадают с нера-

венствами (2)-(3) с точностью до переобозначения переменных. На Рис. 3.18 заштрихована область допустимых значений переменных v1 и v2. Линия уровня функции (11) (которая является выпуклой в силу вогнутости функции полезности агента) обозначена пунктиром.

В случае строго вогнутой функции полезности агента (при этом, очевидно, целевая функция (11) строго выпукла) внутреннее решение задачи условной оптимизации (11)-(13) единственно и имеет следующий вид (в качестве примера возьмем функцию полезности u(t) = b ln(1 + g t), где b и g – положительные константы):

(14)v1 = c1 + (c1 c2) (1 – p) / (2 p – 1),

(15)v2 = c1 + (c2 c1) p / (2 p – 1).

 

v2

 

с1 /(1-p)

A1

 

 

 

 

C1

 

(c2 - с1)/(2p-1)

 

 

 

 

v1

0

B1

с1

/p

 

Рис. 3.18. Реализация центром действия y1 при несклонном к риску агенте

Легко проверить, что в рассматриваемом случае при использовании системы стимулирования (14)-(15) ожидаемая полезность агента от выплат со стороны центра равна затратам агента по выбору первого действия, то есть

(16) Ev = c1.

196

Аналогично можно показать, что, если центр побуждает агента выбирать второе действие, то ожидаемая полезность агента от выплат со стороны центра в точности равна затратам агента по выбору второго действия.

Из (14)-(15) видно, что в случае несклонного к риску агента, побуждая его выбрать первое действие, центр «недоплачивает» в случае реализации первого результата деятельности (v1 £ c1) и «переплачивает» в случае реализации второго результата деятельности (v2 ³ c1), причем при предельном переходе к детерминированному случаю1 (чему соответствует p ® 1) имеет место: v1 ® c1.

Графически эффект страхования в рассматриваемой модели для случая реализации первого действия отражен на Рис. 3.19, на котором изображены линейная (определенная с точностью до аддитивной константы) функция полезности агента un(×) и его строго вогнутая функция полезности ua(×).

 

v

B

u ( )

u (

)

v2

 

a σ

n σ

 

 

 

D

 

 

c1

E

F

 

 

 

 

 

 

 

 

A

C

 

 

 

 

v1

 

 

 

 

σ

 

 

 

 

 

0

σ1 Eσa

Eσn

σ2

 

 

 

Рис. 3.19. Эффект страхования

 

 

 

 

при реализация центром действия y1

 

 

 

1 Отметим, что все модели с неопределенностью должны удовлетворять принципу соответствия: при «стремлении» неопределенности к «нулю» (то есть при предельном переходе к соответствующей детерминированной системе) все результаты и оценки должны стремиться к соответствующим результатам и оценкам, полученным для детерминированного случая. Например, выражения (14)-(15) при p = 1 переходят в решения, оптимальные в детерминированном случае.

197

Так как отрезок AB лежит выше и/или левее отрезка CD, а ожидаемая полезность агента в обоих случаях равна c1, то при несклонности агента к риску ожидаемые выплаты Esa меньше, чем ожидаемые выплаты Esn, соответствующие нейтральному к риску агенту (см. точки E и F на Рис. 3.19).

3.8.2. Механизмы стимулирования в условиях внешней неопределенности (непрерывная модель)

В предыдущем разделе была рассмотрена дискретная модель стимулирования в условиях внешней вероятностной неопределенности (термин «дискретная» означает, что множество возможных значений неопределенного параметра, а также возможных значений действий и результатов деятельности агента конечно). Ниже рассматривается непрерывная модель, в которой множества допустимых действий и результатов деятельности агента составляют положительную полуось.

Закон Парето и распределение Парето. Известен так назы-

ваемый закон Парето (иногда его называют «закон 80 / 20», на жаргоне – «пивной закон», в соответствии с которым 20 % людей выпивают 80 % пива), отражающий неравномерность распределения характеристик экономических и социальных явлений и процессов

[25]:

-20 % населения владеют 80 % капиталов (первоначальная формулировка самого В. Парето [55]);

-80 % стоимости запасов на складе составляет 20 % номенклатуры этих запасов;

-80 % прибыли от продаж приносят 20 % покупателей;

-20 % усилий приносят 80 % результата;

-80 % проблем обусловлены 20 % причин;

-за 20 % рабочего времени работники выполняют 80 % работы;

-80 % работы выполняют 20 % работников и т.д.

«Формализацией» закона Парето является распределение Парето случайной величины z ³ y > 0, характеризуемое двумя параметрами – минимально возможным значением y и показателем степени

α > 0:

198

(5) a =

(1) p(a, y, z) =

a æ y ö1+α

ç

 

÷ .

 

 

y è z ø

Плотности распределения (1) соответствует интегральная функция распределения

æ

y ö

α

(2) F(a, y, z) = 1- ç

 

÷ .

 

è

z ø

 

Распределение Парето обладает свойством самоподобия: распределение значений, превышающих величину z0 ³ y, также является распределением Парето:

0

0

0

a

æ z0

ö1+α

(3) " z ³ y

p(a, z , z) = p(a, y, z) / (1 – F(a, y, z )) =

 

 

ç

 

÷

 

0

 

z

ç

z

÷ .

 

 

 

 

è

ø

Для распределения Парето существуют только моменты, порядка, меньшего, чем степень a. Например, математическое ожидание случайной величины z с распределением (1) существует при a > 1 и равно

α

(4) E z = a -1 y,

где «E» – символ математического ожидания. Отметим, что с ростом a распределение «вырождается» и математическое ожидание

(4) стремится к y. Это свойство распределения Парето используется в следующих разделах для иллюстрации принципа соответствия – при предельном переходе от случая вероятностной неопределенности к детерминированному случаю.

Кроме того, в рамках предположения о том, что случайная величина распределена по Парето, зная математическое ожидание E z и минимальное значение y, можно легко вычислить параметр распределения a (см. (4)):

Ez . Ez - y

Приведем формальную интерпретацию «закона 80 / 20». Предположим, что z – характеристика эффективности агента, а рассматриваемое распределение определяет количество агентов с разной

~

~

эффективностью. Определим z

такое, что Prob {z £ z

} = 0.8:

 

 

199

1

~z = (0.2)α z0 . Далее определим суммарную эффективность «элиты»:

+∞

α−1

α

 

ò~ zp(z0 ,α)dz = (0.2) α

 

z0

,

α −1

z

 

 

 

 

которая должна составлять 80 % от эффективности всего коллектива

E z:

α−1

α

 

 

 

α

 

(0.2) α

 

 

z

 

=0.8

 

 

z0.

α −1

0

α −1

 

 

 

 

Получаем, что показатель степени a, при котором распределение Парето описывает закон Парето, должен быть равен 1.161. Аналогичным образом можно определить, что при a = 2 20 % коллектива будут обладать 45 % общей эффективности и т.д.

Описав свойства распределения Парето, перейдем к постановке и решению задачи стимулирования в условиях внутренней неопределенности о типах агентов, описываемых распределением Парето.

Постановка задачи стимулирования. Рассмотрим задачу сти-

мулирования, в которой присутствует внешняя вероятностная неопределенность – результат деятельности агента z является случайной величиной, распределение которой зависит от его действия y.

Будем считать, что агент выбирает действие y ³ 0, которое под влиянием внешней среды приводит к реализации результата деятельности z ³ 0. Пусть задана плотность распределения вероятности p(z, y) – вероятность реализации результата деятельности z при выборе агентом действия y.

Предположим, что на момент принятия решений участники (центр и агент) не знают результата деятельности, а имеют лишь информацию о распределении p(z, y) и используют ожидаемую полезность для устранения неопределенности, т.е. целевыми функциями участников являются математические ожидания соответствующих функций полезности: функции полезности центра

~

~

и

функции

полезности

агента

Φ (z, y) = H(y) σ (z)

~

~

где

u(×) – функция полезности,

~

f

(z, y) = u(σ (z)) – c(y),

σ (z) –

функция стимулирования, H(y) – функция дохода центра, c(y) – функция затрат агента, относительно которой предположим, что она

200