Управление и оптимизация / Novikov - Refleksiya i upravleniye 2013
.pdfоперируя исключительно математическими (и, в частности, теорети- ко-игровыми) моделями. Это обусловлено в первую очередь тем, что
процесс усвоения человеком той или иной информации в очень большой степени обусловлен факторами социально- психологического порядка. Как отмечено в [51, с. 81], «секрет высо- коэффективного информационного управления – обращение к бес- сознательному, в использовании приемов снятия барьеров воспри-
ятия и преодоления естественной толерантности человека к восприятию нового».
Понятно, с какими трудностями связана формализация этого процесса, когда речь идет о принятии решения умным и рациональ-
ным агентом (intelligent ratoinal decision-maker [243, p. 1]) – «глав-
ным героем» работ по теории игр. Все разработанные на данный момент концепции решения игры основываются, явно или неявно, на уже существующей к моменту начала игры структуре информиро- ванности28. Что было «до начала игры», как сложилась та или иная информированность – этот вопрос остается за рамками обсуждения. По-видимому, здесь проходит некая граница между реальным чело- веком и модельным «умным рациональным агентом».
Отдавая себе отчет в тех ограничениях, которые присущи мате- матическому моделированию человеческого поведения (и, в частно- сти, теоретико-игровому подходу к информационному управлению), рассмотрим возможные виды информационных воздействий.
В [138, с. 133] приведена следующая классификация информа- ционных воздействий:
(1)входные данные – «сухие» факты;
(2)входные данные – логически обоснованные выводы, анали- тические суждения, опирающиеся на определенный набор фактов;
(3)входные данные – эмоционально окрашенные утверждения, опирающиеся на «хорошо/плохо», «морально/аморально», «нравст- венно/безнравственно» и т. п.
Согласно [140, с. 203], новая информация, на основании которой агенты принимают решения, делится на
(4)жесткую, содержащую только реальные данные и факты;
28 Не являются исключением и многошаговые игры, где в ходе разыгрывания игры может происходить изменение информированности участников (в том числе в силу информационного обмена между ними) – ведь и у многошаговой игры существует некий начальный момент и, соответственно, начальная информированность участ- ников.
121
(5) мягкую, которая включает прогнозы и оценки.
Очевидна аналогия между пунктами (1) и (4), а также (2) и (5). О них речь пойдет несколько ниже, а сейчас остановимся подробнее на пункте (3).
Впункте (3) речь идет, по сути дела, об этическом аспекте ин- формации и, соответственно, об этическом аспекте тех или иных решений. По-видимому, единственной пока попыткой формального описания этого аспекта являются работы В.А. Лефевра [76, 80, 82], а также других авторов, развивающих предложенную им модель этического выбора – см. [149, 150, 178] и др. В этих работах предпо- лагается, что принимающий решение агент осуществляет рефлексию первого рода [101, 121], т. е. занимает позицию наблюдателя по отношению к своему поведению, своим мыслям и чувствам. В агенте существует несколько соотнесенных друг с другом уровней, в част- ности, уровень, «отвечающий» за этический аспект выбора. Итого- вое решение агента определяется как влиянием внешней среды, так и состоянием этих уровней.
Втеории игр (а также и в данной работе) агент понимается как индивид, т. е. «неделимый», и осуществляет рефлексию второго рода – относительно принятия решений оппонентами. Поэтому, оставив пункт (3) за рамками наших рассмотрений, обратимся к пунктам (1), (4) и (2), (5).
Структура информированности i-го агента (см. раздел 2.1) включает в себя представления:
–о состоянии природы (θi);
–о представлениях оппонентов (θiσ , σ Σ+).
Сообщение как первого, так и второго может быть элементом информационного воздействия. Иными словами, центр может сооб- щить агенту (агентам) информацию как о состоянии природы (т. е. о значении неопределенного параметра), так и о представлениях оп- понентов.
Соответственно, мы получаем следующие виды информацион- ных воздействий:
(i)информационное регулирование;
(ii)информационное управление.
Они примерно соответствуют пунктам (1), (4).
Что касается пунктов (2), (5), то им примерно соответствует та- кой вид информационного воздействия, как
122
(iii) активный прогноз,
представляющий собой сообщение информации о будущих значени- ях неких параметров, зависящих от состояния природы и действий агентов [117].
В последующих разделах мы рассмотрим указанные три вида информационных воздействий (i–iii) более подробно.
Простейшим случаем информационного воздействия является следующий: центр собрал вместе всех агентов и во всеуслышание
сообщил им значение неизвестного параметра – величину ~ . В
θ θ
этом случае естественно предположить, что образовавшаяся струк- тура информированности игры имеет глубину 1 и состоит из единст-
венного элемента ~ , т. е. для любых i N и σ Σ выполняется
θ
равенство θiσ = ~ . Иными словами, общим знанием среди агентов
θ
становится то, что неопределенный параметр равен ~ .
θ
Такое информационное регулирование называется однород-
ным [36, 117]. Предположение о том, что при сообщении центром
единственной величины ~ она становится общим знанием, назовем
θ
предположением П0. Собственно говоря, предположение П0 означа- ет, что агенты доверяют центру, и это является общим знанием.
Более сложным случаем информационного регулирования явля- ется следующий: центр сообщает i-му агенту θi – значение неизвест- ного параметра θ. В этом случае примем предположение П1, со- стоящее в том, что образовавшаяся структура информированности игры состоит из n элементов и при этом для любых i N и σ Σ выполняется равенство θiσ = θi. Иными словами, каждый i-й агент считает общим знанием, что неопределенный параметр равен θi. Образующаяся при этом структура информированности имеет, вообще говоря, глубину 2.
Такое информационное регулирование называется неодно-
родным [36, 117]. Ясно, что однородное информационное регулиро- вание является частным случаем неоднородного (при этом
~
θ1 = θ2 = ... = θn = θ и структура информированности имеет глуби-
ну 1).
Пусть теперь центр сообщает i-му агенту не только значение неизвестного параметра, но и то, что о значении параметра думают другие агенты. Таким образом, i-му агенту сообщается набор чисел θij (j = 1, 2, …, n) – представлений о неизвестном параметре каждого
123
j-го агента. Примем в этом случае предположение П2, состоящее в следующем: i-й агент считает, что каждый j-й агент, j¹i, субъективно считает значение неопределенного параметра θij общим знанием. В
этом случае образовавшаяся структура информированности игры имеет глубину 3 и любых i, j Î N, j¹i, и σ Î S выполняется равенство
θijσ = θij.
Эта ситуация является примером информационного управле-
ния.
Рассмотрим иллюстративный пример. В [162, с. 235] описан психологический эксперимент, проведенный изучавшим психоло- гию бизнесменом, владельцем компании, импортирующей в США говядину. «Торговые агенты позвонили, как обычно, постоянным клиентам компании – закупщикам говядины для супермаркетов и других точек, торгующих продуктами в розницу, и одним из трех способов предложили им сделать заказ. Одни клиенты услышали предложение, сделанное в стандартной форме. Другим клиентам дополнительно была предоставлена информация о том, что поставки
импортной говядины будут сокращены в ближайшие несколько месяцев. Третья группа клиентов получила те же сведения, что и вторая группа, а также информацию о том, что мало кто узнает о предстоящем сокращении поставок, так как эти сведения поступили из надежного, но засекреченного источника.
… По сравнению с клиентами, которым было сделано торговое предложение в стандартной форме, те клиенты, которым было также сказано о дефиците говядины, заказали ее в два раза больше… Кли- енты, которые решили, что владеют «исключительной» информаци- ей… приобрели в шесть раз больше говядины, чем клиенты, кото- рым было сделано торговое предложение в стандартной форме».
В этом примере (более подробно он рассмотрен в разделе 4.73)
отчетливо видно осуществление информационного регулирования («поставки импортной говядины будут сокращены») и рефлексивно- го управления («поставки импортной говядины будут сокращены… мало кто узнает о предстоящем сокращении поставок»).
Ряд модельных примеров осуществления информационного ре- гулирования и рефлексивного управления приведен в главе 6. Отме- тим, что более детальная классификация и исследование рефлексив-
ного управления представляется перспективным направлением дальнейших исследований.
124
В заключение данного раздела отметим, что на сегодняшний день существует несколько трактовок терминов «рефлексия» и «информационное управление» или «рефлексивное управление». В том числе, в рамках подходов школы В.А. Лефевра (см. [69, 78, 81, 149, 178] и др.), подходов «методологической школы» [4, 38, 179], подходов «психолого-педагогического» направления [98, 145, 155] и др., «рефлексивности по Дж. Соросу» [44-46, 147] и многих других (см., например, труды ежегодного симпозиума «Рефлексивные про- цессы и управление» под руководством В.А. Лефевра и В.Е. Лепского, а также одноименный журнал).
Вернемся теперь к вопросу, каким образом центр может форми- ровать те или иные структуры информированности. Для этого в качестве примера приведем модель так называемых простых сооб- щений [139], для которых удается охарактеризовать множество реализуемых ими структур информированности.
Простые сообщения. Простое сообщение заключается в сле-
дующем. Агенты в некотором составе собираются, и центр29 сооб- щает им значение неопределенного параметра θ Θ. Делается пред- положение, что все собравшиеся верят сообщенной им информации. Кроме этого, каждый видит, что его сосед теперь тоже осведомлен об этом значении неопределенного параметра, а также что тот видит, что другой сосед осведомлен и т.д. Т.е. тот факт, что сообщение о
значении неопределенного параметра воспринимается на веру всеми присутствующими при этом сообщении агентами, является общим знанием среди этих агентов.
Более формально простое сообщение означает следующее. Для множества агентов G N определим
G% = {σ Σ | в σ содержатся индексы только из G}.
Под простым информационным воздействием (простым сооб-
щением), обозначаемым s ≡ G[θ], где G N, а θ Θ, будем понимать
присваивание элементам структуры информированности θσ значения
θ для каждой непустой последовательности индексов σ G% . Агенты могут так собираться не один раз, а несколько, причем в
разных составах, и сообщения о значении неопределенного парамет- ра могут быть различными. При этом делается предположение, что агенты, которые уже были на предыдущих «собраниях», верят вновь
29 Центром, который делает сообщение, может быть, в частности один из агентов.
125
сообщенной информации. Тогда скажем, что процедура простых сообщений заключается в том, что центр формирует структуру ин-
формированности путем выбора конечной последовательности простых информационных воздействий
П ≡ {s1, s2,…, sk} ≡ {si} ≡ {Gi[θi]},
где Gi N, θi Θ, которые последовательно изменяют структуру
информированности по описываемому в определении простого сообщения закону.
Исследуем вопрос о том, все ли возможные структуры инфор- мированности может таким образом создать центр, а если не все, то какие, как их можно описать, какой они могут быть глубины, слож- ности и т.д. Начнем со следующего утверждения.
Утверждение 2.12.1. Для любой последовательности П найдется такая, которая формирует ту же структуру информированности и для которой при q < m Gq не является подмножеством Gm.
Доказательство. Суть утверждения 2.12.1 состоит в том, что не имеет смысла вызывать на отдельное «собрание» маленькую группу
«раньше» большой, которая ту включает. Если Gq Gm, то G%q G%m .
А это значит, что всем элементам структуры информированности, измененным простым информационным воздействием Gq[θq], будет присвоено новое значение воздействием Gm[θm]. Делаем вывод, что в таком случае можно не прибегать к воздействию Gq[θq] вообще, и будет сформирована та же структура информированности. Из после- довательности воздействий {si} удалим sq и так же поступим во всех подобных случаях. Полученная последовательность будет обладать свойствами, указанными в формулировке утверждения. ●
Заметим, что если все множество агентов N не было на общем собрании, то останется неопределенным хотя бы элемент θ12…n в структуре информированности. Поэтому будем всегда в дальнейшем полагать, что G1 = N, т. е. первая вызванная группа агентов – все множество N. Также мы будем всегда полагать, что последователь- ность П удовлетворяет утверждению 2.12.1 (при q < m Gq не является подмножеством Gm), из которого и следует целесообразность собра- ния самой большой группы агентов первой.
Теперь, что очевидно из определения простого информационно- го воздействия, можно утверждать, что заданная последовательность
простых информационных воздействий П однозначным образом формирует некоторую структуру информированности IП.
126
Наряду с объективной последовательностью П рассмотрим субъективные последовательности Пσ для σ Î Σ+, которые имеют место с точки зрения реальных или фантомных агентов. Если какого то сообщения si не было с точки зрения агента σ (он не был на соот- ветствующем «собрании»), то в последовательности Пσ поставим на i-м месте символ пустого множества Æ, в противном случае помес-
тим туда сообщение si и будем условно писать Πσi = si. Заметим, что
при сделанных нами предположениях всегда выполнено Πσ1 = s1.
Определим операцию пересечения для последовательностей простых информационных воздействий Пσ Ç Пσ'. Это тоже последо- вательность сообщений, причем (Пσ Ç Пσ')i = si в том и только в том
случае, если Πσi = si и Πσi ' = si, в противном случае на i-м месте
поставим значок Æ. Т.е. эту операцию можно определить как поэле- ментное пересечение по правилам:
si Ç si = si ; si Ç Æ = Æ Ç si = Æ Ç Æ = Æ.
Определим последовательность сообщений Пj, которую видит реальный агент j Î N, следующим образом: Πij = si, если j Î Gi, и
Πij = Æ в противном случае. Мы тем самым предполагаем, что агент
знает о существовании только тех совещаний, на которых он присут- ствовал.
Теперь определим, что такое, например, П12, т. е. последова- тельность сообщений, которую «видит» второй агент с точки зрения первого. Сюда надо отнести те совещания из П1, на которых присут-
ствовал также второй агент, т. е.: Π12i = si, если {1, 2} Í Gi, и Π12i = Æ в противном случае. Легко видеть, что П12 = П1 Ç П2.
Обобщим это определение до Пσ для произвольного σ Î Σ+. Обозначим Mσ Í N – тех агентов, которые присутствуют в последо- вательности индексов σ Î Σ+. Тогда для каждой σ Î Σ+ определим
Пσ = I П j .
j Mσ
Выше мы отмечали, что заданная последовательность простых
информационных воздействий П однозначным образом формирует некоторую структуру информированности IП. Это утверждение
127
позволяет сделать вывод о том, что если какие-либо два агента (ре- альных или фантомных) λ и μ видели одну и ту же последователь- ность сообщений, т. е. Пλ = Пμ, то в их сознании сформируется одна и та же структура информированности, т. е. Iλi = Iμi для любого i Î N.
Это есть определение одинаковой информированности агентов λ и μ (см. раздел 2.2). Сформулируем это как утверждение.
Утверждение 2.12.2. Пусть λ, μ Î Σ+. Тогда если Пλ = Пμ, то агенты λ и μ одинаково информированы, (т. е. Iλi = Iμi для любого i Î N).
Обратное в общем случае неверно, т.к. некоторые сообщения могут не изменять информированность. Приведем пример.
Пример 2.12.1. Пусть N = {1, 2}, s1 = {1, 2}[5], s2 = {1}[5].
Структура информированности тривиальная, все элементы в ней равны одному и тому же значению 5, т. е. θσ = 5 " σ Î Σ+. Поэтому имеем, что I1i = I2i " i Î N, т. е. агенты 1 и 2 одинаково информиро-
ваны. Но в то же время П = П1 = {s1, s2} ¹ П2 = {s1, Æ}. ●
Если Mλ = Mμ, то в силу определения Пλ = Пμ, а значит, агенты λ и μ одинаково информированы. А пример 2.12.1 демонстрирует, что утверждение (Mλ ¹ Mμ Þ агенты λ и μ не являются одинаково ин- формированными) в общем случае не имеет места. Но верно сле-
дующее
Утверждение 2.12.3. Пусть λ, μ Î Σ+. Если Mλ ¹ Mμ, то существу- ет такая последовательность простых сообщений П, при которой агенты λ и μ не будут одинаково информированными.
Доказательство. Mλ ¹ Mμ означает, что $ i Î N: i Ï Mλ Ç Mμ. Пусть для определенности i Î Mλ, но i Ï Mμ. Тогда рассмотрим следующую последовательность простых сообщений П = {s1, s2},
где s1 = N[θ1], s2 = Mλ[θ2], причем θ1 ¹ θ2. В этом случае θλi = θ2, а
θμi = θ1. А это означает, что Iλi ¹ Iμi, т. е. агенты λ и μ не являются одинаково информированными. ●
Можно немного конкретизировать это утверждение, показав, что при определенных условиях сообщения, которые «видит» агент λ, но не «видит» агент μ, могут сделать их неодинаково информиро- ванными. Самое простое – потребовать, чтобы во всех сообщениях все значения неопределенного параметра θi были попарно различны. Но мы немного ослабим это требование.
128
Утверждение 2.12.4. Пусть λ, μ Î Σ+. Пусть, далее, $ si = Gi[θi]:
Mλ Í Gi, Mμ Ë Gi и Ø$ sk = Gk[θk]: Mμ È Gi Í Gk и θk = θi. Тогда агенты λ и μ не являются одинаково информированными.
Доказательство. Обозначим Gi \ Mλ = P. Тогда возьмем произ- вольного агента σ Î Σ такого, что Mσ = P (если P = Æ, то σ – пустая последовательность). Покажем неравенство θλλσ ¹ θμλσ. Т.к. Mλλσ = Mλ È Mλ È Mσ = Gi, и мы рассматриваем только такие последо- вательности сообщений, когда сначала вызываются более крупные группы, а затем лишь более мелкие, то результат присваивания θλσ = θi сообщением si останется не измененным последующими сообщениями (уже не будет вызвана группа, которая включает в себя Gi). Для того чтобы было θμλσ = θi, необходимо чтобы
$ sk = Gk[θk]: Mμλσ Í Gk и θk = θi. Но Mμλσ = Mμ È Mλ È Mσ = Mμ È Gi, и
не существование такого сообщения потребовано в условии утвер- ждения. ●
Подытожить рассуждения можно следующим образом. Для слу- чая простых сообщений условие Mλ = Mμ и только оно является гарантией того, что агенты λ и μ окажутся одинаково информиро- ванными. Это наталкивает на формулировку еще одного определе- ния, которое станет главной темой следующего подраздела.
Граф миров. Будем говорить, что агенты λ Î Σ+ и μ Î Σ+ при- надлежат одному миру (из одного мира), если они заведомо одина- ково информированы при любой последовательности сообщений Π.
Подмножество множества реальных и фантомных агентов W Í Σ+ назовем миром, если для любых λ, μ Î W справедливо Iλ ~ Iμ при любой последовательности сообщений Π.
Из утверждений 2.12.2 и 2.12.3 следует следующее Утверждение 2.12.5. Агенты λ Î Σ+ и μ Î Σ+ принадлежат одно-
му миру при использовании процедуры простых сообщений тогда и только тогда, когда Mλ = Mμ.
Для процедуры простых сообщений будем говорить, что данно- му миру соответствует множество Z Í N, если Z = Mλ, где λ – один из агентов этого мира. Удобно обозначать мир соответствующим ему множеством Z и говорить, что, например, в мире {1, 2} содержатся агенты 12, 21, 121, 212, 1212, 2121, … .
Число различных миров – число непустых подмножеств множе- ства реальных агентов N, т. е. 2n – 1, что есть конечное число. Теперь можно говорить о конечной сложности структуры информированно-
129
сти, сформированной с помощью простых сообщений, т.к. легко убедиться в том, что в базисе структуры информированности может находиться лишь конечное число элементов. Для этого нужно пока- зать, что число попарно нетождественных структур информирован- ности конечно. Для этого сформулируем тривиальное
Утверждение 2.12.6. Если фантомные агенты λ, μ Σ+ из одного мира и ω(λ) = ω(μ) (т. е. они оканчиваются на один и тот же индекс),
то Iλ = Iμ.
Доказательство. Если агенты из одного мира, они заведомо оди- наково информированы. В частности это означает, что Iλω(λ) = Iμω(μ). Но в последовательностях индексов λ ω(λ) и μ ω(μ) последние два индекса одинаковые, и они «схлопываются» по аксиоме автоинфор-
мированности: Iλω(λ) = Iλ = Iμ = Iμω(μ). ●
Теперь можно ограничить сверху число попарно нетождествен- ных структур информированности в каждом конкретном мире.
Утверждение 2.12.7. Пусть λ Σ+, тогда среди структур инфор- мированности, соответствующим агентам из мира Mλ, попарно не- тождественных найдется не больше мощности множества Mλ, кото- рое в свою очередь не больше n.
Доказательство. Если агент σ принадлежит данному миру, то по
определению в записи σ должны быть использованы все индексы из множества Mλ и только они. В частности последний индекс в после- довательности σ может быть тоже лишь из множества Mλ, поэтому из утверждения 6 сразу вытекает справедливость утверждения 2.12.7. ● Утверждение 2.12.8. При использовании простых сообщений формируется структура информированности I, которая имеет глуби- ну γ(I) ≤ n и конечный базис, количество элементов в котором огра-
n
ничено сверху числом åCnk k = 2n−1 n . При этом существует после-
k =1
довательность простых сообщений Π, при которой эти оценки достигаются.
Доказательство. Множество Mλ (λ Σ+) есть подмножество множества N, в котором n элементов, k – мощность множества Mλ. В зависимости от λ Σ+ k {1, 2, …, n}. Как известно, число различ-
ных подмножеств мощности k множества мощности n есть Cnk .
130