Анализ примеров седьмого раздела позволяет констатировать,
что наличие рефлексирующих агентов может изменять групповое поведение самым разным образом.
Вмодели «Олигополия Курно» при определенном диапазоне значений начальный действий агентов можно реализовать эффек-
тивные по Парето или равновесные по Нэшу уровни производства за счет введения агентов первого и второго рангов рефлексии.
Вмодели «Задача о консенсусе» введение рефлексирующих агентов расширяет множество векторов действий, выбираемых агентами, и приводит к росту значения критерия эффективности.
Вмодели «Активная экспертиза» наличие рефлексирующих агентов даже первого ранга существенно расширяет диапазон воз- можных результатов экспертизы. Второй ранг рефлексии позволяет реализовать равновесие Нэша.
Вмодели «Транспортные потоки и модель эвакуации» наличие рефлексирующих агентов первого ранга позволяет достичь мини- мального (оптимального с «централизованной» точки зрения) вре- мени эвакуации.
Вмодели «Фондовый рынок» показано, что изменить ситуацию (по сравнению с нерефлексивным принятием решений) может толь- ко определенная «критическая масса» рефлексирующих агентов.
Взаключение отметим, что, во-первых, в моделях раздела 4.26
почти не рассматривались агенты со вторым и более высокими рангами рефлексии (либо они превышают максимальный целесооб- разный ранг, либо соответствующие модели получаются слишком сложными для получения аналитических выводов).
Во-вторых, считалось, что агенты любого ранга рефлексии дос- таточно «интеллектуальны» – они выбирают действия, стремясь максимизировать свои целевые функции. Можно допустить наличие
именее интеллектуальных агентов – агентов-имитаторов (условно, обладающих минус первым рангом рефлексии), действия которых определяются известной функцией от текущих или прошлых дейст- вий других агентов (примеры: выбор действия, равного среднему арифметическому действий остальных агентов; или агентов, связан- ных с данным; или некоторого другого фиксированного агента). Наверное, такие модели могут адекватно описывать такое явление как диффузия инноваций и др.
В-третьих, явно недостаточное внимание уделено условиям ста- бильности.
В-четвертых, представляется перспективным установление со-
ответствия и совместное развитие метода рефлексивных разбиений с теорией когнитивных иерархий, (в которой рангам рефлексии соот- ветствуют когнитивные уровни, и используется вероятностная мо- дель – игрок некоторого уровня считает остальных распределенны-
ми по более низким уровням в соответствии с распределением Пуассона) – направлением, активно развиваемым в эксперименталь- ной экономике и поведенческой теории игр – см., например, [188, 194] и обзор в разделе 3.4.
Кроме того, задачи управления, поиска максимального целесо- образного ранга рефлексии и др. можно и нужно ставить и решать в рамках и других (отличных от рассмотренных выше) модификаций предложенной рефлексивной модели коллективного поведения, что представляется перспективным направлением будущих исследова- ний. В первую очередь, это – задачи активного прогноза (см. [117] и раздел 4.23), в рамках которого агенты по информации центра о будущем состоянии системы «восстанавливают» текущее состояние и на основании этой новой информации принимают решения. Здесь введение рефлексивных разбиений выглядит очень многообещаю- щим.
ЗАКЛЮЧЕНИЕ
В настоящей работе рассмотрены рефлексивные игры, описы- вающие интерактивное взаимодействие агентов, которые принимают
решения на основе иерархии своих представлений о существенных параметрах, представлениях других агентов и т.д.
Ключевыми понятиями являются следующие (см. подробности
икорректные определения выше):
-фантомный агент – агент, существующий в представлении
реального или другого фантомного агента и наделяемый в рамках этих представлений определенной информированностью;
-информационная структура – граф, отражающий взаимную информированность агентов (реальных и фантомных);
-рефлексивная структура – совокупность субъективных реф-
лексивных разбиений агентов (субъективное рефлексивное разбие-
ние – представления агента о разбиении всех агентов на ранги стра- тегической рефлексии);
-информационное равновесие – равновесие рефлексивной иг-
ры (то есть обобщение равновесия Нэша на случай некооперативной игры реальных и фантомных агентов при заданной структуре ин- формированности);
-рефлексивное равновесие – совокупность действий агентов,
являющихся наилучшими ответами на предполагаемые в рамках существующей рефлексивной структуры действия оппонентов;
-информационное управление – поиск допустимой информа-
ционной структуры, которой соответствует наилучшее (с точки зрения управляющего органа) информационное равновесие.
-рефлексивное управление – поиск допустимой рефлексивной структуры, которой соответствует наилучшее (с точки зрения управ- ляющего органа) рефлексивное равновесие.
С точки зрения теории игр рассмотренная в настоящей работе концепция информационного равновесия охватывает ситуации принятия игроками решений на основе иерархии в общем случае несогласованных представлений о взаимной информированности и является обобщением равновесия Нэша.
С точки зрения теории коллективного поведения рассмотренная в настоящей работе концепция рефлексивного равновесия охватыва-
ет ситуации принятия игроками решений на основе иерархии в
общем случае несогласованных представлений о принципах приня- тия оппонентами решений и является обобщением моделей когни- тивных иерархий и др.
Кроме того, предложенные подходы к моделированию инфор- мационной и стратегической рефлексии, во-первых, охватывает, то есть позволяют единообразно описывать как частные случаи, многие прикладные задачи (скрытое управление, информационное управле- ние через СМИ, рефлексию в психологии и художественных произ- ведениях и др. – см. четвертую главу настоящей работы).
Во-вторых, в рамках построенной модели появляется возмож- ность исследования зависимости информационного и/или рефлек- сивного равновесия и выигрышей агентов от структур информиро- ванности и/или рефлексивных структур (в том числе – рангов рефлексии) и, в частности, определения максимального целесооб- разного в той или иной ситуации ранга рефлексии (см. разделы 2.6 и 3.2).
В-третьих, имея зависимость информационного (рефлексивно- го) равновесия от структуры информированности (рефлексивной структуры), можно ставить и решать задачи соответственной ин- формационного и рефлексивного управления – определения той структуры информированности (рефлексивной структуры), при которой система оказывается в требуемом информационном (реф- лексивном) равновесии.
Многочисленные прикладные модели из самых разных областей свидетельствуют о продуктивности предложенного подхода к опи-
санию рефлексии в управлении.
В качестве стратегической задачи будущих исследований мож-
но назвать интеграцию моделей информационной и стратегической рефлексии, то есть построение языка единообразного совместного описания информационных и рефлексивных структур.
ЛИТЕРАТУРА
1 Автономов В.С. Модель человека в экономической науке. – СПб.: Экономическая школа, 1998. – 230 с.
2 Адельсон-Вельский Г.М., Арлазаров В.Л., Донской М.В. Про- граммирование игр. – М.: Наука, 1978. – 255 с.
3Айзекс Р. Дифференциальные игры. – М.: Мир, 1967. – 479 с.
4Анисимов О.С. Методология: функции, сущность, становление. –
М.: РАГС, 1996. – 380 с.
5Аткинсон Р. Человеческая память и процесс обучения. – М.: Про-
гресс, 1980. – 528 с.
6Беленький В.З., Волконский В.А., Иванков С.А. и др. Итератив- ные методы в теории игр и программировании. – М.: Физматлит, 1974. – 240 c.
7Беляков С.А., Борисов В. И., Шумов В.В. Введение в пограномет- рику. – М: Пограничная академия ФСБ России, 2012. – 667 с.
8Берн Э. Игры, в которые играют люди. Люди, которые играют в игры. – М.: Прогресс, 1988. – 400 с.
9Бестужев-Лада И.В. Окно в будущее. – М.: Мысль, 1970. – 269 с.
10Бирштейн Б.И., Боршевич В.И. Стратагемы рефлексивного управ-
ления в западной и восточных культурах // Рефлексивные процессы и управление. 2002. Т. 2. № 1. С. 27 – 44.
11 Бирштейн Б.И., Боршевич В.И. Теория рефлексивности Дж. Сороса: опыт критического анализа // Рефлексивные процессы и управление. 2001. № 1. С. 88 – 101.
12Бреер В.В. Теоретико-игровые модели конформного коллективно- го поведения // Автоматика и телемеханика. 2012. № 10. С. 111 –
13Бреер В.В., Новиков Д.А. Модели управления толпой // Проблемы управления. 2012. № 2. С. 38 – 44.
14Бреер В.В., Новиков Д.А. Пороговая модель коррупционного поведения // Системы управления и информационные технологии. 2011. № 3. С. 73 – 75.
15Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы стимулиро- вания в вероятностных моделях социально-экономических систем // Автоматика и Телемеханика. 1993. № 11. С. 3 – 30.
16Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы функциони- рования социально-экономических систем с сообщением информа- ции // Автоматика и Телемеханика. 1996. № 3. С. 3 – 25.
17 Бурков В.Н., Заложнев А.Ю., Кулик О.С., Новиков Д.А. Механиз- мы страхования в социально-экономических системах. – М.: ИПУ РАН, 2001. – 109 с.
18 Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. – М.: Наука, 1981. – 384 с.
19 Бурков В.Н., Коргин Н.А., Новиков Д.А. Введение в теорию управления организационными системами. – М.: Либроком, 2009. – 264 с.
20 Бурков В.Н., Новиков Д.А. Как управлять проектами. – М.: Син-
тег, 1997. – 188 с.
21 Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. – М.: Синтег, 1999. – 128 с.
22 Бухарин С.Н., Цыганов В.В. Методы и технологии информацион- ных войн. – М.: Академический проект, 2007. – 382 с.
23 Бэндлер Р., Гриндер Д. Структура магии. – СПб.: Издательство
«Белый кролик», 1996. – 496 с.
24 Бэндлер Р., Гриндер Д. Из лягушек – в принцы (нейро- лингвистическое программирование). – Екатеринбург, 1998. – 206 с. 25 Варшавский В.И., Поспелов Д.А. Оркестр играет без дирижера. –
М.: Наука, 1989. – 208 с.
26 Васин А.А., Гурвич В.А. Коалиционные ситуации равновесия в метаиграх / Вестник МГУ. Вычислительная математика и киберне-
тика. 1980. № 3. С. 38 – 44.
27 Васин А.А. Некооперативные игры в природе и обществе. – М.:
МАКС Пресс, 2005. – 412 c.
28Вилкас Э.Й. Оптимальность в играх и решениях. – М.: Наука. 1990. – 256 с.
29Вишнев С.М. Основы комплексного прогнозирования. – М.:
Наука, 1977. – 289 с.
30Воеводин А.И. Стратагемы – стратегии войны, манипуляции, обмана. – М.: Белые альвы, 2002. – 256 с.
31Волгин Л.Н. Принцип согласованного оптимума. – М.: Советское радио, 1977. – 144 с.
32Выборнов Р.А. Модели и методы управления организационными системами с коррупционным поведением участников. – М.:ИПУ РАН, 2006. – 110 с.
33Выборнов Р.А., Чхартишвили А.Г. Рефлексивная модель корруп- ции // Современные сложные системы управления (HTCS’2004):
Материалы IV международной конференции. – Тверь: ТГТУ, 2004. –
С. 186 – 189.
34Гермейер Ю.Б. Игры с непротивоположными интересами. – М.:
Наука, 1976. – 327 с.
35Гонтарев А.В., Чхартишвили А.Г. О явных и скрытых коалициях в рефлексивных играх // Управление большими системами. 2009. №
26.С. 47 – 63.
36Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели при- нятия решений в эколого-экономических системах. – М.: Радио и связь, 1982. – 144 с.
37Грачев Г., Мельник И. Манипулирование личностью: организа- ция, способы и технологии информационно-психологического воз- действия. – М.: Институт философии РАН, 1999. – 235 с.
38Громыко Ю.В. Оргдеятельностные игры и развитие образования / Технология прорыва в будущее. – М.: Независимый методологиче- ский университет, 1992. – 191 с.
39 Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Социальные сети: модели информационного влияния, управления и противобор- ства. – М.: Физматлит, 2010. – 228 с.
40Губанов Д.А., Чхартишвили А.Г. О стратегической рефлексии в биматричных играх // Управление большими системами. 2008. № 21.
С. 49 – 57.
41Губко М.В., Новиков Д.А. Теория игр в управлении организаци- онными системами. – М.: Синтег, 2002. – 148 с.
42Данилов В.И. Лекции по теории игр. – М.: Российская экономи- ческая школа, 2002. – 140 с.
43Доценко Е.Л. Психология манипуляции: феномены, механизмы и защита. – М.: ЧеРо, 2000. – 344 с.
44Ерешко Ф.И., Лохныгина Ю.В. Рефлексивные стратегии в систе- мах управления / Труды Юбилейной международной научно- практической конференции «Теория активных систем». – М.: Син-
тег, 1999. С. 211 – 213.
45Ерешко Ф.И., Лохныгина Ю.В. Исследование моделей рефлек- сивных стратегий в управляемых системах. – М.: ВЦ РАН, 2001. –
37с.
46Ерешко Ф.И. Моделирование рефлексивных стратегий в управ- ляемых системах. – М.: ВЦ РАН, 2001. – 37 с.
47Ермаков Н.С., Иващенко А.А., Новиков Д.А. Модели репутации и норм деятельности. – М.: ИПУ РАН, 2005. – 67 с.
48Зимбардо Ф., Ляйппе М. Социальное влияние. – СПб.: Питер, 2000. – 448 с.
49Зинченко В.И., Новиков Д.А., Старостенко В.В. Об одной теоре- тико-игровой модели фондового рынка // Тр. IV междунар. конф. «Современные сложные системы управления». – Тверь, ТГТУ, 2004.
С. 294 – 297.
50 Зинченко В.П. Рефлексивные процессы в интернет- взаимодействиях (на примере шахматных игр) // Рефлексивные процессы и управление. 2002. Т. 2. № 1. С. 90 – 95.
51Информационное общество: Информационные войны. Информа- ционное управление. Информационная безопасность / Под ред. М.А. Вуса. – СПб.: Издательство С.-Петербургского университета, 1999. – 212 с.
52Кабаченко Т.С. Методы психологического воздействия. – М.: Педагогическое общество России, 2000. – 544 с.
53Казанцев С.Б., Новиков Д,А., Чхартишвили А.Г. Об условиях стационарности линейных рефлексивных отображений // Системы управления и информационные технологии. 2004. № 5. С. 20 – 22.
54Калашников А.О. Модели и методы организационного управле- ния информационными рисками корпораций. – М.: Эгвес, 2011. –
312с.
55Каляев И.А., Гайдук А.Р., Капустян С.Г. Модели и алгоритмы коллективного управления в группах роботов. – М.: Физматлит, 2009. – 280 с.
56Канеман Д., Словик П., Тверски А. Принятие решений в неопре- деленности. – Харьков: Гуманитарный центр, 2005. – 632 c.
57Карнеги Д. Как завоевывать друзей и оказывать влияние на лю-
дей. – М.: Прогресс, 1989. – 720 с.
58Ким Д.П. Методы поиска и преследования подвижных объектов.
– М.: Наука, 1989. – 336 с.
59Клыков Ю.И. Ситуационное управление большими системами. –
М.: Энергия, 1974. – 136 с.
60Козелецкий Ю. Психологическая теория решений. – М.: Про-
гресс, 1979. – 504 с.
61Кононенко А.Ф., Халезов А.Д., Чумаков В.В. Принятие решений в условиях неопределенности. – М.: ВЦ АН СССР, 1991. – 197 с.
62Корепанов В.О. Модели рефлексивного группового поведения и управления. – М.: ИПУ РАН, 2011. – 133 с.
63 Корепанов В.О., Новиков Д.А. Задача о диффузной бомбе // Проблемы управления. 2011. № 5. С. 66 – 73.
64Корепанов В.О., Новиков Д.А. Метод рефлексивных разбиений в моделях группового поведения и управления // Проблемы управле-
ния. 2011. № 1. С. 21 – 32.
65Корепанов В.О., Новиков Д.А. Рефлексивная игра полковника Блотто // Системы управления и информационные технологии. 2012.
№ 1. С. 55 – 62.
66Крогиус Н.В. Личность в конфликте. – Саратов: СГУ, 1976. –
144с.
67Крогиус Н.В. О психологии шахматного творчества. – М.: Физ- культура и спорт, 1969. – 96 с.
68Крогиус Н.В. Психология шахматного творчества. – М.: Физ- культура и спорт, 1981. – 183 с.
69Крылов В.Ю. Методологические и теоретические проблемы математической психологии. – М.: Янус-К, 2000. – 376 с.
70Кузнецов Н.А., Кульба В.В., Микрин Е.А и др. Информационная безопасность систем организационного управления. Теоретические основы. – М.: Наука, 2006. Т.1 – 495 с. Т.2 – 437 с.
71Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр.
– М.: МГУ, 1984. – 104 с.
72Кукушкин Н.С. Роль взаимной информированности сторон в играх двух лиц с непротивоположными интересами // ЖВМ и МФ. 1972. Т. 12. № 4. С. 1029 – 1034.
73Кульба В.В., Малюгин В.Д., Шубин А.Н., Вус М.А. Введение в информационное управление. – С.Пб.: Изд-во С.-Петербургского Университета, 1999. – 116 с.
74Лезина З.М. Манипулирование выбором вариантов: теория аген- ды // Автоматика и телемеханика. 1985. № 4. С. 5 – 22.
75Лепа Р.Н. Модели рефлексивного управления в экономике. – Донецк, Институт экономики промышленности НАН, 2012. – 380 с.
76Лефевр В.А. Алгебра совести. – М.: «Когито-Центр», 2003. –
426с.
77Лефевр В.А. Исходные идеи логики рефлексивных игр / Мате- риалы конференции «Проблемы исследования систем и структур». – М.: Издание АН СССР, 1965.
78Лефевр В.А. Конфликтующие структуры. – М.: Советское радио, 1973. – 158 с.
79Лефевр В.А. Космический субъект. – М.: Институт психологии РАН, 1997.
80Лефевр В.А. Логика рефлексивных игр и рефлексивное управле- ние / Принятие решений человеком. – Тбилиси: Мецниереба, 1967.
81Лефевр В.А. Рефлексия. – М.: «Когито-Центр», 2003. – 496 с
82Лефевр В.А. Формула человека. Контуры фундаментальной психологии. – М.: Прогресс, 1991. – 108 с.
83Лефевр В.А. Элементы логики рефлексивных игр // Проблемы инженерной психологии. Вып. 4. Ленинград, 1966. С. 273 – 299.
84Лефевр В.А. Лекции по теории рефлексивных игр. – М.: «Когито-
Центр», 2009. – 218 с.
85Лысаков А.В., Новиков Д.А. Договорные отношения в управле- нии проектами. – М.: ИПУ РАН, 2004. – 100 с.
86Льюс Р., Райфа Х. Игры и решения. – М.: Изд-во Иностр. Лит., 1961 – 642 с.
87Лэйнг Р. Я и другие. – М.: Эксмо-пресс, 2002. – 304 с.
88Майерс Д. Социальная психология. – СПб.: Питер, 1998. – 688 с.
89Малинецкий Г.Г., Потапов А.Б. Современные проблемы нели- нейной динамики. – М.: Едиториал УРСС, 2002. – 360 с.
90Малишевский А.В. Качественные модели в теории сложных систем. – М.: Наука, 1998. – 528 с.
91Малявин В.В. (перевод с кит.) Тридцать шесть стратагем. – М.: Белые альвы, 2000. – 192 с.
92Мартино Д. Технологическое прогнозирование. – М.: Прогресс, 1977. – 591 с.
93Механизмы управления / Под ред. Д.А. Новикова. – М: ЛЕНАНД, 2011. – 192 с.
94Микрин Е.А., Кульба В.В., Косяченко С.А. и др. Информацион- ное обеспечение систем организационного управления. Часть 1. Методологические основы организационного управления. – М.: Издательство физико-математической литературы, 2011. – 464 с.
95Миркин Б.Г. Проблема группового выбора. – М.: Наука, 1974. –
256с.
96Модели и методы анализа и синтеза сценариев развития социаль- но-экономических систем / Под ред В.Л. Шульца, В.В. Кульбы. – М.:
Наука, 2012. Том 1. – 304 с. Том 2. – 358 с.
97Мулен Э. Кооперативное принятие решений: аксиомы и модели.
– М.: Мир, 1991. – 485 с.