Управление и оптимизация / Voronin - Matematicheskiye modeli organizatsiy 2008
.pdfЕсли qi – представления i-го агента о неопределенном парамет- ре, а qii – представления i-го агента о собственном представлении, то естественно считать, что qii = qi. Иными словами, i-й агент правиль- но информирован о собственных представлениях, а также считает, что таковы и другие агенты и т. д. Формально это означает, что выполнена аксиома автоинформированности, которую далее будем предполагать выполненной:
" i Î N " τ, σ Î S qτiiσ = qτiσ .
Эта аксиома означает, в частности, что, зная qτ для всех t Î S+, таких что |t| = g, можно однозначно найти qτ для всех t Î S+, таких что |t| < g.
Наряду со структурами информированности Ii, i Î N, можно рассматривать структуры информированности Iij (структура инфор- мированности j-го агента в представлении i-го агента), Iijk и т.д.
Отождествляя структуру информированности с характеризуемым ею агентом, можно сказать, что, наряду с n реальными агентами (i- агентами, где i Î N) со структурами информированности Ii, в игре участвуют фантомные агенты (τ-агенты, где t Î S+, |τ| ³ 2) со структурами информированности Iτ = {qτσ}, s Î S, существующие в сознании реальных агентов.
Определим фундаментальное для дальнейших рассмотрений понятие тождественности структур информированности. Структуры информированности Iλ и Iμ (l, m Î S+) называются тождественны- ми, если выполнены два условия:
1.qλσ = qμσ для любого s Î S;
2.последние индексы в последовательностях λ и μ совпадают.
Будем обозначать тождественность структур информированно- сти следующим образом: Iλ = Iμ .
Понятие тождественности структур информированности позво- ляет определить их важное свойство – сложность. Заметим, что наряду со структурой I имеется счетное множество структур Iτ , t Î S+, среди которых можно при помощи отношения тождествен- ности выделить классы попарно нетождественных структур. Коли-
чество этих классов естественно считать сложностью структуры информированности.
Будем говорить, что структура информированности I имеет ко- нечную сложность n = n(I), если существует такой конечный набор
111
попарно нетождественных структур { Iτ1 , Iτ 2 , …, Iτν }, τl Σ+, l {1, …, ν}, что для любой структуры Iσ , σ Σ+, найдется тожде- ственная ей структура Iτ l из этого набора. Если такого конечного
набора не существует, будем говорить, что структура I имеет беско- нечную сложность: ν(I) = ∞.
Структуру информированности, имеющею конечную слож- ность, будем называть конечной (еще раз отметим, что при этом дерево структуры информированности все равно остается бесконеч- ным). В противном случае структуру информированности будем называть бесконечной.
Ясно, что минимально возможная сложность структуры инфор-
мированности в точности равна числу участвующих в игре реальных агентов (напомним, что по определению тождественности структур информированности они попарно различаются у реальных агентов).
Любой набор (конечный или счетный) попарно нетождествен- ных структур Iτ, τ Σ+, такой, что любая структура Iσ, σ Σ+, тож- дественна одной из них, назовем базисом структуры информиро- ванности I.
Если структура информированности I имеет конечную слож- ность, то можно определить максимальную длину последовательно- сти индексов γ такую, что, зная все структуры Iτ, τ Σ+, |τ| =γ, мож- но найти и все остальные структуры. Эта длина в определенном смысле характеризует ранг рефлексии, необходимый для описания структуры информированности.
Будем говорить, что структура информированности I, ν(I) < ∞,
имеет конечную глубину γ = γ (I), если
1.для любой структуры Iσ, σ Σ+, найдется тождественная ей структура Iτ, τ Σ+, |τ| ≤γ ;
2.для любого целого положительного числа ξ, ξ <γ , существует
структура |
Iσ, σ Σ+, не |
тождественная никакой из |
структур Iτ, |
τ Σ+, |τ| =ξ . |
|
|
|
Если |
ν(I) = ∞, то и |
глубину будем считать |
бесконечной: |
γ(I) = ∞.
Понятия сложности и глубины структуры информированности игры можно рассматривать τ-субъективно. В частности, глубина
112
структуры информированности игры с точки зрения t-агента, t Î S+, называется рангом рефлексии t-агента.
Если задана структура I информированности игры, то тем са-
мым задана и структура информированности каждого из агентов (как реальных, так и фантомных). Выбор t-агентом своего действия xτ в рамках гипотезы рационального поведения определяется его структурой информированности Iτ , поэтому, имея перед собой эту структуру, можно смоделировать его рассуждения и определить это его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определе- нии исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.
Набор действий xτ*, t Î S+, назовем информационным равнове-
сием [33], если выполнены следующие условия:
1.структура информированности I имеет конечную слож- ность n;
2.λ, μ Σ Iλi = Iμi Þ xλi* = xμi*;
3." i Î N, " s Î S
(1) |
x* |
Arg max f |
(θ |
σi |
, x* |
,..., x* |
, x |
, x* |
..., x* |
) . |
|
σi |
i |
|
σi1 |
σi,i−1 |
i |
σi,i+1 |
σi,n |
|
|
|
|
xi Xi |
|
|
|
|
|
|
|
|
Первое условие в определении информационного равновесия означает, что в рефлексивной игре участвует конечное число реаль- ных и фантомных агентов.
Второе условие отражает требование того, что одинаково ин- формированные агенты выбирают одинаковые действия.
И, наконец, третье условие отражает рациональное поведение агентов – каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее дейст- вия других агентов, которые оказываются рациональными с точки зрения рассматриваемого агента в рамках имеющихся у него пред- ставлений о других агентах.
Удобным инструментом исследования информационного рав- новесия является граф рефлексивной игры, в котором вершины соответствуют реальным и фантомным агентам, и в каждую верши- ну-агента входят дуги (их число на единицу меньше числа реальных агентов), идущие из вершин-агентов, от действий которых в субъек- тивном равновесии зависит выигрыш данного агента.
113
Рассмотрим ряд иллюстративных примеров [33], обобщающих Пример 2.1 на случай нетривиальной взаимной информированности агентов. В этих примерах участвуют три агента с целевыми функ- циями следующего вида:
(2) fi (θ, x1 , x2 , x3 ) = (θ − x1 − x2 − x3 )xi − x2i2 ,
где xi ³ 0, i Î N = {1, 2, 3}; q Î W = {1, 2}.
Содержательно, xi – объем выпуска продукции i-ым агентом, q
– спрос на производимую продукцию. Тогда первое слагаемое в
целевой функции может интерпретироваться как произведение цены на объем продаж – выручка от продаж (см. модели олигополии Курно в [10]), а второе слагаемое – как затраты на производство.
Для краткости будем называть агента, считающего, что спрос низкий (q = 1), пессимистом, а считающего, что спрос высокий (q = 2) – оптимистом. Таким образом, во всех трех приведенных
ниже примерах ситуации различаются лишь вследствие различных структур информированности.
Пример 2.16. Пусть первые два агента оптимисты, а третий – пессимист, причем все трое одинаково информированы. Сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 2.3.
x1
x2 |
x3 |
Рис. 2.3. Граф рефлексивной игры в примере 2.16
Подставив (2) в (1), получим, что для нахождения информаци- онного равновесия надо решить следующую систему уравнений:
114
ìx* = |
2 - x2* - x3* |
, |
ì |
x |
* |
= |
1 |
|
, |
||||
|
|
||||||||||||
|
|
|
|
|
|
|
|
||||||
ï |
1 |
3 |
|
|
|
ï |
|
|
|
||||
ï |
|
|
|
|
1 |
|
2 |
|
|
||||
|
|
|
|
ï |
|
|
|
|
|
||||
ï |
|
2 - x* |
- x* |
|
|
|
|
|
1 |
|
|
||
|
|
|
ï |
|
|
|
|
|
|||||
íx2* = |
1 |
3 |
|
|
, |
íx2* |
= |
|
|
, |
|||
3 |
|
|
2 |
|
|||||||||
ï |
|
|
|
|
ï |
|
|
|
|
|
|||
ï |
|
1- x* |
- x* |
|
|
ïx |
* |
= 0. |
|
||||
ïx3* = |
1 |
2 |
|
, |
ï |
|
3 |
|
|
|
|
||
3 |
|
|
|
|
|
|
|
|
|||||
î |
|
|
|
|
|
î |
|
|
|
|
|
|
Таким образом, действия агентов в ситуации информационного равновесия будут следующими: x1* = x2* = 1/2, x3* = 0. ∙
Пример 2.17. Пусть первые два агента оптимисты, а третий – пессимист, который считает всех трех агентов одинаково информи- рованными пессимистами. Первые два агента одинаково информи- рованы, причем оба они адекватно информированы о третьем аген- те. Cложность данной структуры информированности равна пяти, а глубина равна двум. Граф рефлексивной игры изображен на Рис. 2.4.
x1 |
x2 |
x3
x31 |
x32 |
Рис. 2.4. Граф рефлексивной игры в примере 2.17
Подставив (2) в (1), получим, что для нахождения информаци- онного равновесия надо решить следующую систему уравнений:
115
ì |
x |
* |
= |
|
2 - x* |
- x* |
|
|
ì |
|
|
|
9 |
|
|
|
|||||||||
ï |
|
|
|
|
|
2 |
|
3 |
, |
|
|
x |
* |
= |
|
|
, |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
1 |
|
|
|
|
|
3 |
|
|
|
|
|
|
ï |
|
20 |
|
|||||||||
ï |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
||||||||
ï |
|
|
|
|
2 - x* |
- x* |
|
|
ï |
|
|
|
9 |
|
|
|
|||||||||
ïx2* |
= |
|
|
|
|
1 |
|
3 |
, |
|
|
ïx2* |
= |
|
|
, |
|||||||||
|
|
|
|
3 |
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
20 |
|
|||||||||||||||
ï |
|
|
|
|
|
|
|
|
|
|
|
|
|
ï |
|
|
|
|
|
||||||
|
|
|
1- x |
* |
- x |
* |
|
|
|
ï |
|
|
|
1 |
|
|
|
|
|||||||
ï |
|
|
|
31 |
32 |
|
|
ï |
|
|
|
|
|
|
|
||||||||||
íx3* |
= |
|
|
|
|
|
|
, |
|
íx3* |
= |
|
|
|
, |
|
|
||||||||
|
|
|
|
3 |
|
|
5 |
|
|||||||||||||||||
ï |
|
|
|
|
|
|
|
|
|
|
|
|
ï |
|
|
|
|
|
|
|
|||||
ï |
|
|
|
|
1- x* |
|
- x* |
|
|
ï |
|
* |
|
1 |
|
|
|
||||||||
ï |
x* |
= |
|
|
|
32 |
|
3 |
, |
|
ï |
x31 |
= |
|
|
|
|
, |
|
||||||
|
|
|
|
|
5 |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||
|
31 |
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|||||||
ï |
|
|
|
|
|
|
|
|
|
|
|
|
ï |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
1- x31* - x3* |
|
|
|
|
|
|
|
1 |
|
|
|
||||||||
ïx* |
= |
, |
|
ïx32* |
= |
. |
|
||||||||||||||||||
|
|
|
|||||||||||||||||||||||
|
|
|
|||||||||||||||||||||||
ï |
|
32 |
|
|
|
|
|
3 |
|
|
|
|
|
ï |
|
|
|
5 |
|
|
|
||||
î |
|
|
|
|
|
|
|
|
|
|
|
|
î |
|
|
|
|
|
|
Таким образом, действия реальных агентов в ситуации инфор- мационного равновесия будут следующими (отметим, что с измене-
нием информированности изменились и равновесные действия агентов):
x1* = x2* = 9/20, x3* = 1/5. ∙
Пример 2.18. Пусть все трое агентов оптимисты, первый и вто- рой взаимно информированы, второй и третий также взаимно ин- формированы. По мнению первого агента, третий считает всех троих одинаково информированными пессимистами; также и пер- вый агент, по мнению третьего, считает всех троих одинаково ин- формированными пессимистами. Cложность данной структуры информированности равна шести, а глубина равна трем. Граф соот- ветствующей рефлексивной игры изображен на Рис. 2.5.
116
x2
x1 |
x3 |
x13 |
x31 |
x132
Рис. 2.5. Граф рефлексивной игры в примере 2.18
Подставив (2) в (1), получим, что для нахождения информаци- онного равновесия надо решить следующую систему уравнений:
ì |
|
|
|
* |
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
ïx1* = |
2 - x2 |
- x13 |
, |
|
|
ìx* |
= |
17 |
|
, |
|||||||||||||
3 |
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
35 |
|
|||||||||||||||||
ï |
|
|
|
|
|
|
|
|
|
|
ï |
1 |
|
|
|
||||||||
ï |
|
|
|
2 - x* |
- x* |
|
|
ï |
|
|
12 |
|
|
||||||||||
ïx2* |
= |
1 |
|
3 |
, |
|
|
ïx2* |
= |
|
, |
||||||||||||
3 |
|
|
|
|
|||||||||||||||||||
|
|
|
|
35 |
|
||||||||||||||||||
ï |
|
|
|
|
|
|
|
|
|
|
ï |
|
|
|
|
||||||||
|
|
|
* |
|
* |
|
|
|
|
ï |
|
|
17 |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
ïx* |
= |
2 - x31 |
- x2 |
, |
|
|
ïx* |
= |
|
, |
|||||||||||||
3 |
|
|
|
|
|
|
35 |
|
|||||||||||||||
ï |
3 |
|
|
|
|
|
|
|
|
|
ï |
3 |
|
|
|
||||||||
í |
|
|
|
|
|
1- x132* - x13* |
|
í |
|
|
|
1 |
|
|
|
||||||||
ïx* |
|
= |
|
|
, |
|
ïx31* |
= |
|
, |
|
||||||||||||
|
|
|
|
|
5 |
|
|||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||
ï |
31 |
|
|
3 |
|
|
|
|
|
|
ï |
|
|
|
|
|
|
||||||
ï |
|
|
|
|
1- x31* - x132* |
|
|
ï |
|
|
|
1 |
|
|
|
||||||||
ïx* |
|
= |
|
, |
|
ïx13* |
= |
, |
|
||||||||||||||
|
|
|
5 |
|
|||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||
ï |
13 |
|
|
3 |
|
|
|
|
|
|
ï |
|
|
|
|
|
|||||||
ï |
|
|
|
* |
* |
|
|
ï |
* |
|
|
1 |
|
|
|||||||||
ïx* |
|
= |
1- x31 |
- x13 |
, |
|
ïx132 = |
|
|
|
|
. |
|||||||||||
|
|
5 |
|
||||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||
ï |
132 |
|
|
|
|
|
3 |
|
|
|
|
|
|
î |
|
|
|
|
|
||||
î |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
117
Таким образом, действия реальных агентов в ситуации инфор- мационного равновесия будут следующими: x1* = x3* = 17/35, x2* = 12/35. ∙
В заключение настоящего раздела подчеркнем, что наличие мо- дели рефлексивной игры позволяет определить условия существо- вания и свойства информационного равновесия, а также конструк-
тивно и корректно сформулировать задачу рефлексивного управления, заключающуюся в поиске управляющим органом такой информационной структуры, что реализующееся в ней информаци- онное равновесие наиболее выгодно с его точки зрения – см. под- робности в [32].
2.4. Игры и оргструктуры
Выше мы рассмотрели основные понятия теории игр, перейдя от игр, в которых агенты выбирают свои действия одновременно (игра Г0 в нормальной форме или в форме характеристической функции) к иерархическим играм, в которых последовательность ходов фиксирована – первым делает ход центр, а затем – агент. Можно усложнять модель и дальше, переходя ко всё более сложным играм. Опишем общую картину (см. Рис. 2.6), которая позволяет увидеть логику перехода от более простых к более сложным зада- чам, чтобы сложная задача могла быть декомпозирована на простые.
Если имеется один субъект, принимающий решения (Рис. 2.6а), то он описывается с точки зрения гипотезы рационального поведе- ния (см. раздел 2.1.1) как стремящийся максимизировать свою целевую функцию. Далее можно усложнить модель и рассмотреть несколько субъектов на одном уровне (Рис. 2.6б), описав их взаимо- действие игрой Г0 в нормальной форме (см. раздел 2.3.1). Если ввести иерархию, то для двух субъектов (Рис. 2.6в) их взаимодейст-
вие описывается игрой Гi , где i = 1, 2 или 3 (см. раздел 2.3.2).
Представим себе, что имеется структура «один начальник – не- сколько подчиненных» (Рис. 2.6г). Взаимодействие агентов, нахо-
дящихся на одном уровне, можно описывать игрой Г0 . Взаимодей- ствие «начальник-подчиненный» описывается игрой Гi . Тогда
118
условно такую структуру можно представить игрой Гi , определен- ной на игре Г0 , условно обозначив ее Гi(Г0).
…
ГРП |
Г0 |
Г i , i = 1,2,3 |
Гi (Г0 ) |
а) |
б) |
в) |
г) |
Г0 (Гi (Г0 )) |
Г0 (Гi (...Гi (Г0 )...)) |
д) |
е) |
Рис. 2.6. Игры и оргструктуры
Далее, пусть есть несколько начальников (центров) и несколько подчиненных – агентов (Рис. 2.6д). На нижнем уровне агенты игра-
ют игру Г0 . Над ними центры играют иерархическую игру Гi , но центры, в свою очередь, разыгрывают на своем уровне игру Г0 .
Итого, получили игру Г0(Гi(Г0)).
Можно взять более сложную структуру с более сложным взаи- модействием (Рис. 2.6е). Это будет иерархическая игра между уров- нями, и «обычная» игра на каждом из уровней: Г0 (Гi (...Гi (Г0 )...)) .
Основная идея заключается в том, чтобы декомпозировать сложную структуру (игру) на набор более простых и воспользовать- ся результатами исследования последних. Оказывается, что между играми и структурами существует глубокая связь – момент приня-
119
тия субъектом решений определяет его «место» в организационной иерархии (см. подробности в [29]).
Далее мы поговорим о классификации задач управления орга- низационными системами, а затем в последующих главах начнем
рассматривать последовательно задачи управления для структур Рис. 2.6в-Рис. 2.6д, а затем и задачи синтеза самих организационных структур.
2.5. Классификация задач управления организационными системами
Описанные выше в настоящей главе модели принятия решений служат основой построения моделей функционирования организа- ционных систем. Перед тем как рассматривать те или иные кон- кретные классы таких моделей (см. последующие главы настоящей работы), приведем систему классификаций задач управления орга- низационными системами [31].
С точки зрения системного анализа любая система задается пе- речислением ее состава, структуры и функций. С учетом целена- правленности поведения участников организационных систем (ОС), их функции описываются в рамках моделей принятия решений – см.
выше. Поэтому модель организационной системы определяется заданием [31] (см. Рис. 2.7, а также описание игр в разделах 2.3.1 и 2.3.3):
-состава ОС (участников, входящих в ОС, то есть ее элемен-
тов);
-структуры ОС (совокупности информационных, управляю- щих, технологических и других связей между участниками ОС);
-множеств допустимых действий (ограничений и норм дея-
тельности) участников ОС, отражающих, в том числе, институцио- нальные, технологические и другие ограничения и нормы их совме- стной деятельности;
-предпочтений участников ОС (см. раздел 2.1);
-информированности – той информации о существенных па- раметрах, которой обладают участники ОС на момент принятия решений о выбираемых стратегиях;
120