Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление и оптимизация / Novikov - Refleksiya i upravleniye 2013

.pdf
Скачиваний:
51
Добавлен:
02.09.2019
Размер:
3.17 Mб
Скачать

Российская академия наук Институт проблем управления

Д.А. НОВИКОВ, А.Г. ЧХАРТИШВИЛИ

РЕФЛЕКСИЯ

И

УПРАВЛЕНИЕ

(математические модели)

ББК 22.18 Н 73

УДК 519

НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Рефлексия и управле-

ние: математические модели. – М.: Издательство физико-

математической литературы, 2013. – 412 с. ISBN 978-5-94052-226-3

Монография члена-корреспондента РАН Д.А. Новикова и д.ф.-м.н. А.Г. Чхартишвили посвящена обсуждению современных подходов к математическому моделированию рефлексивных процессов в управлении. Рассматриваются рефлек- сивные игры, описывающие взаимодействие субъектов (агентов), принимающих решения на основании иерархии представлений, во-первых, о существенных пара- метрах (информационная рефлексия), во-вторых о принципах принятия решений оппонентами (стратегическая рефлексия), а также представлений о представлениях и т.д.

Анализ поведения фантомных агентов, существующих в представлениях других реальных или фантомных агентов, и свойств информационной (и рефлексивной) структур, отражающих взаимную информированность реальных и фантомных агентов, позволяет предложить в качестве решения игры информационное (соответственно, рефлексивное) равновесие, которые являются обобщением ряда известных концеп- ций равновесия в некооперативных играх и в моделях коллективного поведения.

Модели информационной и стратегической рефлексии дают возможность:

-описывать и изучать поведение рефлексирующих субъектов;

-исследовать зависимость выигрышей агентов от рангов их рефлексии;

-ставить и решать задачи информационного и рефлексивного управления в ор- ганизационных, экономических, социальных и других системах, в военном деле и т.д. (в книге рассмотрены около 30 примеров прикладных задач из перечисленных облас- тей);

-единообразно описывать многие явления, связанные с рефлексией: скрытое управление, информационное управление через СМИ, рефлексию в психологии, художественных произведениях и др.

Книга адресована специалистам в области принятия решений и управления сис- темами междисциплинарной природы, а также студентам вузов и аспирантам.

Рецензенты: д.т.н., проф. В.Н. Бурков, д.т.н., проф. А.В. Щепкин

© Д.А.Новиков, А.Г. Чхартишвили, 2012

2

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ....................................................................................

5

ГЛАВА 1. РЕФЛЕКСИЯ В ПРИНЯТИИ РЕШЕНИЙ.........

30

1.1. Индивидуальное принятие решений.............................................

30

1.2. Интерактивное принятие решений: игры и равновесия..............

32

1.3. Общие подходы к описанию информационной и стратегической

рефлексии...............................................................................................

40

ГЛАВА 2. ИНФОРМАЦИОННАЯ РЕФЛЕКСИЯ И

 

УПРАВЛЕНИЕ............................................................................

49

2.1. Информационная рефлексия в играх двух лиц............................

49

2.2. Информационная структура игры.................................................

53

2.3. Информационное равновесие........................................................

60

2.4. Граф рефлексивной игры...............................................................

65

2.5. Регулярные структуры информированности ...............................

71

2.6. Ранг рефлексии и информационное равновесие..........................

79

2.7. Стабильные информационные равновесия ..................................

92

2.8. Истинные и ложные равновесия ...................................................

95

2.9. Случай наблюдаемых действий агентов ......................................

98

2.10. Рефлексивные игры и байесовы игры ......................................

103

2.11. Информационное управление ...................................................

111

2.12. Моделирование информационных воздействий......................

120

2.14. Трансформация структур информированности.......................

142

2.15. Согласованное информационное управление..........................

147

2.16. Рефлексия в механизмах планирования ...................................

159

ГЛАВА 3. СТРАТЕГИЧЕСКАЯ РЕФЛЕКСИЯ И

 

УПРАВЛЕНИЕ..........................................................................

167

3.1. Стратегическая рефлексия в играх двух лиц .............................

167

3.2. Рефлексия в биматричных играх и игры рангов........................

174

3.3. Ограниченность ранга рефлексии...............................................

194

3.4. Рефлексивные структуры и рефлексивное управление ............

196

ГЛАВА 4. ПРИКЛАДНЫЕ МОДЕЛИ

 

ИНФОРМАЦИОННОГО И РЕФЛЕКСИВНОГО

 

УПРАВЛЕНИЯ..........................................................................

212

4.1. Скрытое управление.....................................................................

213

4.2. СМИ и информационное управление.........................................

223

4.3. Рефлексия в психологии ..............................................................

227

3

4.3.1. Психология шахматного творчества ..................................

227

4.3.2. Трансакционный анализ ......................................................

230

4.3.3. Окно Джохари.......................................................................

232

4.3.4. Модель этического выбора..................................................

233

4.4. Рефлексия в художественных произведениях ...........................

235

4.5. Рефлексивные игры поиска .........................................................

243

4.6. Производитель и посредник ........................................................

250

4.7. «Принцип дефицита» ...................................................................

254

4.8. Совместное производство............................................................

257

4.9. Конкуренция на рынке.................................................................

264

4.10. Аккордная оплата труда.............................................................

267

4.11. Продавец и покупатель ..............................................................

276

4.12. Заказчик и исполнитель .............................................................

281

4.13. Коррупция ...................................................................................

284

4.14. Биполярный выбор .....................................................................

286

4.15. Активная экспертиза ..................................................................

291

4.16. Олигополия Курно: информационная рефлексия....................

300

4.17. Распределение ресурса...............................................................

303

4.18. Страхование ................................................................................

307

4.19. Реклама товара............................................................................

314

4.20. Предвыборная борьба.................................................................

317

4.21. Конкурс........................................................................................

319

4.22. Явные и скрытые коалиции в рефлексивных играх................

322

4.23. Активный прогноз ......................................................................

334

4.24. Социальные сети.........................................................................

340

4.25. Управление толпой.....................................................................

348

4.26. Метод рефлексивных разбиений...............................................

352

4.26.1. Диффузная бомба ...............................................................

353

4.26.2. Игра полковника Блотто ....................................................

368

4.26.3. Олигополия Курно: стратегическая рефлексия...............

376

4.26.4. Задача о консенсусе............................................................

380

4.26.5. Активная экспертиза ..........................................................

383

4.26.6. Транспортные потоки и эвакуация ...................................

384

4.26.7. Фондовый рынок ................................................................

387

ЗАКЛЮЧЕНИЕ.........................................................................

393

ЛИТЕРАТУРА...........................................................................

395

4

Пескари привольно резвятся, в этом их радость!

Ты же не рыба, откуда тебе знать, в чем ее радость?

Ты же не я, откуда тебе знать, что я знаю, а чего не знаю?

Из даосской притчи

Дело, разумеется, в том, достопочтенный архиепископ, что вы верите в то, во что вы верите, потому что вы были так воспитаны.

Может быть, и так. Но остается фактом, что и вы верите в то, что я верю в то, во что я верю, потому что я был так воспитан, по той причине, что вы были так воспитаны.

Из книги Д. Майерса «Социальная психология»

ВВЕДЕНИЕ

Настоящая работа посвящена изложению современных подхо- дов к математическому моделированию рефлексии в управлении, в том числе такому классу теоретико-игровых моделей, как рефлек- сивные игры, описывающие взаимодействие субъектов, принимаю- щих решения на основании иерархии представлений о существен- ных параметрах, представлений о представлениях и т.д.

Рефлексия. Одним из фундаментальных свойств бытия челове- ка является то, что наряду с природной объективной») реально- стью существует ее отражение в сознании. При этом между природ- ной реальностью и ее образом в сознании (будем считать этот образ частью особой рефлексивной реальности) существует неизбежный зазор, несовпадение.

Целенаправленное изучение этого феномена традиционно свя- зано с термином «рефлексия», которому «Философский словарь» [157] дает следующее определение: «РЕФЛЕКСИЯ (лат. reflexio – обращение назад). Термин, означающий отражение, а также иссле- дование познавательного акта».

Термин «рефлексия» введен Дж. Локком; в различных философ- ских системах (у Дж. Локка, Г. Лейбница, Д. Юма, Г. Гегеля и др.) он имел различное содержание. Систематическое описание рефлек- сии с точки зрения психологии началось в 60-е годы XX века (школа В.А. Лефевра). Кроме того, следует отметить, что существует пони- мание рефлексии в другом значении, имеющем отношение к рефлек- су – «реакции организма на возбуждение рецепторов» [146; с. 1122].

5

В настоящей работе используется первое (философское) определе- ние рефлексии.

Для прояснения понимания сути рефлексии рассмотрим сначала ситуацию с одним субъектом. У него есть представления о природ- ной реальности, но он может и осознавать (отражать, рефлексиро- вать) эти представления, а также осознавать осознание этих пред- ставлений и т.д. Так формируется рефлексивная реальность. Рефлексия субъекта относительно своих собственных представле- ний о реальности, принципах своей деятельности и т.д. называется

авторефлексией или рефлексией первого рода. Отметим, что в большинстве гуманитарных исследований речь идет, в первую оче- редь, об авторефлексии, под которой в философии понимается про- цесс размышления индивида о происходящем в его сознании [101].

Рефлексия второго рода имеет место относительно представле- ний о реальности, принципах принятия решений, авторефлексии и т.д. других субъектов.

Ранги рефлексии. Для того чтобы описывать рефлексивные «отражения», в психологии используется, в частности, следующий подход [101]. Рассмотрим взаимоотношения между тремя элемента- ми, изображенными на Рис. 1 – субъектом деятельности (С), объек- том его деятельности (О) и другими субъектами (Д). Стрелки на рисунке условно обозначают отдельные акты «размышления» («от- ражения»).

С

О Д

Рис. 1. Варианты оценки

Описывать отношения между элементами можно последова- тельностью букв «С», «О» или «Д», причем порядок их следования соответствует тому, кто что «отражает» или кто о чем рефлексирует

6

(объект деятельности предполагается «пассивным» и рефлексиро- вать не может).

Отношения первого порядка (нулевой ранг рефлексии, имеет место оценка):

СО оценка субъектом результатов своей деятельности (само-

оценка результатов);

СС оценка субъектом самого себя (самооценка себя как лич- ности);

СД оценка субъектом других субъектов людей (как лично- стей);

ДО оценка другими субъектами (людьми) результатов дея- тельности субъекта;

ДС оценка субъекта (как личности) другими субъектами (людьми).

Этими пятью отношениями исчерпываются возможные комби- нации отношений первого порядка (объект в силу своей пассивности не способен к оценке, самооценку других субъектов (ДД) мы не рассматриваем).

Отношения, изображенные на Рис. 1, могут стать предметом размышлений субъекта деятельности, а также и других субъектов. Возникает рефлексия первого ранга.

Отношения второго порядка (рефлексия первого ранга). Здесь необходимо разделить:

- авторефлексию (рефлексию первого рода), которой соответст- вуют последовательности, начинающиеся с «СС», то есть относя- щиеся к размышлениям субъекта о его самооценке, его самооценке его результатов:

ССО размышления субъекта о самооценке результатов;

ССС размышления субъекта о его самооценке;

и

- рефлексию второго рода (все остальные последовательности): СДО размышления субъекта об оценке другими субъектами результатов его деятельности что другие думают о результатах

моей деятельности); СДС размышления субъекта об оценке его самого другими

субъектами что другие думают обо мне»); ДСС размышления других субъектов о самооценке субъекта;

7

ДСО размышления других субъектов о самооценке субъек- том результатов своей деятельности;

ДСД размышления других субъектов об оценке их субъек-

том.

Отношения третьего порядка (рефлексия второго ранга). Здесь уже вариантов больше. Приведем некоторые из них: СДСО раз-

мышления субъекта о размышлениях других субъектов о самооценке субъектом своих результатов что другие думают о том, как я оце- ниваю свои результаты»); ДСДО размышления других субъектов о

размышлениях субъекта об оценке другими субъектами результатов его деятельности и т.д.

Аналогично описываются и другие, более высокие ранги реф- лексии.

Примеры. Приведем примеры рефлексии второго рода, иллю- стрирующие, что во многих случаях правильные собственные умо- заключения можно сделать, лишь если занять позицию других субъ- ектов и проанализировать их возможные рассуждения.

Первым примером является классическая «задача о грязных ли- цах» (Dirty Face Game) [215], иногда ее называют «задачей о мудре- цах и колпаках» [42] или «о мужьях и неверных женах» [243]. Опи- шем ее, следуя [42, с. 46].

«Представим себе, что в купе вагона Викторианской эпохи на- ходятся Боб и его племянница Алиса. У каждого испачкано лицо. Однако никто не краснеет от стыда, хотя любой Викторианский пассажир покраснел бы, зная, что другой человек видит его грязным. Отсюда мы делаем вывод, что никто из пассажиров не знает, что его лицо грязное, хотя каждый видит грязное лицо своего компаньона.

В это время в купе заглядывает Проводник и объявляет, что в купе находится человек с грязным лицом. После этого Алиса по- краснела. Она поняла, что лицо у нее испачкано. Но почему она поняла это? Разве Проводник не сообщил то, что она уже знала?

Проследим цепочку рассуждений Алисы. Алиса: Предположим, мое лицо чистое. Тогда Боб, зная, что кто-то из нас грязный, должен сделать вывод, что грязный он, и покраснеть. Раз он не краснеет, значит, моя посылка про мое чистое лицо ложная, мое лицо грязное и я должна покраснеть.

Проводник добавил к информации, известной Алисе, информа- цию о знаниях Боба. До этого она не знала, что Боб знает, что кто-то

8

из них испачкан. Короче, сообщение проводника превратило знание о том, что в купе есть человек с грязным лицом, в общее знание».

Второй хрестоматийный пример – «задача о скоординированной атаке» (Coordinated Attack Problem) [217]; существуют близкие к ней задачи об оптимальном протоколе обмена информацией – Electronic Mail Game [252] и др. (см. обзоры в [208, 218, 261]).

Ситуация выглядит следующим образом. На вершинах двух холмов расположены две дивизии, а в долине расположился против- ник. Одержать победу можно, только если обе дивизии нападут на противника одновременно. Генерал командир первой дивизии посылает генералу командиру второй дивизии гонца с сообщени- ем: «Атакуем на рассвете». Так как гонец может быть перехвачен противником, то первому генералу необходимо дождаться от второ- го генерала сообщения о том, что первое сообщение получено. Но так как второе сообщение также может быть перехвачено противни- ком, то второму генералу необходимо получить от первого подтвер- ждение, что тот получил подтверждение. И так далее до бесконечно- сти. Задача заключается в том, чтобы определить, после какого числа сообщений (подтверждений) генералам имеет смысл атаковать противника. Вывод следующий в описанных условиях скоордини- рованная атака невозможна, а выходом является использование вероятностных моделей [240, 241].

Третья классическая задача – «задача о двух брокерах» (см. так- же модели спекуляций в [126]). Предположим, что у двух брокеров, играющих на фондовой бирже, имеются собственные экспертные системы, которые используются для поддержки принятия решений. Случается так, что сетевой администратор нелегально копирует обе экспертные системы и продает каждому брокеру экспертную систе- му своего оппонента. После этого администратор пытается продать каждому из них следующую информацию – «У вашего оппонента есть ваша экспертная система». Потом администратор пытается продать информацию: «Ваш оппонент знает, что у вас есть его экс- пертную систему», и т.д. Вопрос заключается в том, как брокерам следует использовать информацию, получаемую от администратора, а также какая информация на какой итерации является существен- ной?

Завершив рассмотрение примеров рефлексии второго рода, об- судим, в каких ситуациях рефлексия является существенной. Если

9

единственный рефлексирующий субъект является экономическим агентом, который стремится максимизировать свою целевую функ- цию, выбирая одно из этически допустимых действий, то природная реальность входит в целевую функцию как некий параметр, а ре- зультаты рефлексии (представления о представлениях и пр.) аргу- ментами целевой функции не являются. Тогда можно сказать, что авторефлексия «не нужна», так как она не изменяет действия, выби- раемого агентом.

Заметим, что зависимость действий субъекта от рефлексии мо- жет иметь место в ситуации, когда действия этически неравноценны, то есть наряду с утилитарным аспектом существует деонтологиче- ский (этический) – см. [176, 228, 229]. Однако экономические реше- ния, как правило, этически нейтральны, поэтому рассмотрим взаи- модействие нескольких субъектов.

Если субъектов несколько (ситуация принятия решения являет- ся интерактивной), то в целевую функцию каждого субъекта входят действия других субъектов, то есть эти действия являются частью природной реальности (хотя сами они, разумеется, обусловлены рефлексивной реальностью). При этом рефлексия (и, следовательно, исследование рефлексивной реальности) становится необходимой.

Перед тем как рассматривать основные подходы к математическому моделированию эффектов рефлексии, опишем кратко взаимосвязь двух базовых для настоящей работы категорий – «рефлексия» и «управление».

Рефлексия и управление. Прежде всего, определим суть кате- гории «управление». Управление – «элемент, функция организован- ных систем различной природы: биологических, социальных, техни- ческих, обеспечивающая сохранение их определенной структуры, поддержание режима деятельности, реализацию программы, цели деятельности. [146, с. 1252; 157, с. 704]»; управление – «воздействие на управляемую систему с целью обеспечения требуемого ее пове-

дения» [112, с. 9].

Обсудим качественно общую постановку задачи управления.

Пусть имеется субъект управления и управляемая система (объект управления в терминах теории управления техническими система- ми, – или управляемый субъект). Состояние управляемой системы зависит от внешних воздействий, воздействий (управления) со сто- роны управляющего органа и, быть может (если субъект управления

10