Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие-20007.docx
Скачиваний:
52
Добавлен:
19.03.2015
Размер:
1.04 Mб
Скачать

Лекция 9 Динамические модели принятия решений

Ранее исследовались статические модели принятия решений в сложных системах, в том числе иерархических системах управления (ИСУ).

Однако особый интерес представляет изучение динамических систем. В этом случае возникает целый ряд специфических проблем. Их решение позволяет делать качественные выводы, которые не могли быть получены при исследовании статических моделей принятия решений. Дело в том, что динамике экономического (производственного) процесса, как правило, сопутствует динамика процесса принятия решений. «Развёртка» этого процесса во времени позволяет своевременно и эффективно использовать приток дополнительной информации и адаптироваться к изменению условий производства. В результате у центра и элементов ИСУ появляются новые, значительно более эффективные возможности влиять на выбор управлений элементами нижних уровней, направлять и контролировать их деятельность.

Слабоустойчивые совместные решения по ю. Б. Гермейеру

Пусть задана исходная игра

Г,i

Для этой игры определим следующие величины (минимаксные выигрыши):

Введем стратегии наказания:

И определим множества :

, i

Множество D – взаимовыгодное множество, при выборе управления из этого множества игроки получают выигрыш, не меньший, чем их минимаксный результат.

Пусть D - совместный выбор, являющийся результатом неформального компромисса.

Введём обозначения:

,

Замечание 1. Очевидно, имеет место цепочка неравенств:

Определение. Ситуация называетсяслабоустойчивым совместным решением по Ю. Б. Гермейеру, если выполняются неравенства

(1)

Таким образом, построение устойчивой ситуации проводится при условии дальнейшего повторения игры, что приводит к возможности наказания игрока, отклонившегося от выбора, соответствующего равновесной ситуации.

Полученное решение состоит из двух компонент:

1) Стационарное решение ;

  1. Реализация минимума функции в последующихповторениях, если игрокнарушил соглашение по выбору

При этом предполагается, что результаты предыдущих повторений становятся известными к следующему повторению, а выигрыши игроков определяются в виде суммы выигрышей в повторениях игры.

Замечание 2. В случае получаем классическое определение ситуации равновесия по Нэшу:

Замечание 3. Так как , то из определенияполучим

то есть ,i

Следовательно , то есть компромиссное решение может быть выбрано только из взаимовыгодного множества.

Динамическая модель принятия решений с непрерывным временем

Рассмотрим повторяющуюся игру с непрерывным временем

проистекающую на отрезке t[0,1].

Множество выборов игроков содержат функции

(t):[0,1] →,

а функции выигрыша определяются сверткой по времени следующего вида:

Здесь, как и ранее

На функции накладываются условия измеримости (интегрируемости) так, что интегралы (2) существуют.

Построим и изучим свойства ситуаций равновесия на классе стратегий

где

По определению положим прито есть в начальной момент, когда нет предыстории, может быть выбрана любая точка из исходного множества

Содержательно использование такой стратегии соответствует следующей информированности игроков: каждый игрок в момент времени знает предысторию – действия партнеров до этого момента.

Замечание 4. Здесь информированность игроков друг о друге соответствует в статике нереализуемой паре

но в динамике противоречие снимается тем, что речь идет о взаимной информированности в предшествующий принятию решения момент времени.

Итак, будем изучать ситуацию равновесия в информационном расширении исходной динамической игры, а именно, в игре

где множества определяются функциями,

пара стратегий проектируется в пару управлений ((t),(t)):

((t),(t)),

а выигрыши вычисляются по правилу:

Выберем элемент и построим стратегии вида:

Теорема. Набор образуют ситуацию равновесия в игре.

Доказательство. Набор таких стратегий очевидно реализует (проектируется) ситуацию , следовательно, каждый игрок получает выигрыш

Пусть теперь , а, то есть игрок 2 пытается получить больший выигрыш, отклонившись от равновесной стратегии. Пусть- время начала отступления игрока 2 от выбранной стратегии

Тогда выигрыш игрока 2 при любой стратегии оценивается следующей цепочкой неравенств:

,

то есть отклонение не увеличивает выигрыш игрока 2.

Аналогично показывается, что игроку 1 также невыгодно отклоняться от равновесной стратегии. Теорема доказана.

Следствие. Необходимым и достаточным условием существования ситуации равновесия в изучаемой игре является условие

D(взаимовыгодное множество D не пусто).

Упражнение. Показать, что , если в статической антагонистической игре с функцией выигрышаилисуществует седловая точка.

Замечание 5. Седловая точка всегда существует на классе смешанных стратегий. При этом равновесные стратегии можно выбрать таким образом, что стохастика проявится только в стратегиях наказания, которые некогда не реализуются в силу предположений о рациональном поведении игроков.

Замечание 6. Можно вместо стационарных стратегий использовать нестационарные траекторииудовлетворяющие условию

Это позволяет, например, в игре “семейный спор” супругам по очереди использовать разновыгодные ситуации равновесия.

Замечание 7. Всегда гдеP – множество Парето, следовательно эффективные точки могут быть реализованы как исходы равновесных стратегий. То есть всегда можно выбрать паретовскую точку и сделать из неё ситуацию равновесия.

Таким образом, в динамических моделях принятия решений всегда с использованием необходимой информации можно построить компромиссные – равновесные решения.

В иерархической игре игрок 1 (начальник) всегда может выбрать для себя наилучшую равновесную ситуацию.

Однако используемый класс стратегий предполагает непрерывное наблюдение, а, следовательно, анализ большого объема поступаемой информации.

Несколько смягчает ситуацию тот факт, что необходимо знать только, нарушил партнер (подчинённый) договоренность или нет.

Тем не менее, задача более экономного использования информации остается актуальной.