- •Лекция №1 Введение в системный анализ
- •Основные понятия теории систем
- •Лекция №2 Модели систем
- •Структурный анализ систем
- •Элементы теории графов
- •Алгебраическое представление графа
- •Лекция №3 Ранжирование элементов систем
- •Лекция №4 Элементы теории сетей
- •Сетевое планирование
- •Лекция №5 Функциональные модели
- •Организации
- •Лекция №6 Тезаурус
- •Управление
- •Программное управление
- •Адаптивное управление
- •Лекция №7 Рефлексивное управление
- •Развитие
- •1. Линейные связи
- •2. Ограничивающие связи
- •3. Запаздывающие связи
- •4. Селектирующие связи
- •Лекция №8 Информационное описание
- •Лекция №9 Исследование операций
- •Элементы теории игр
- •Игры двух лиц с нулевой суммой
- •Лекция №10 Смешанные стратегии
- •Методы определения оптимальных стратегий
- •Итерационный метод решения игр
- •Лекция №11 Игры двух лиц с ненулевой суммой
- •Игры nлиц
- •Игровое моделирование
- •Лекция №12 Теория полезности История вопроса
- •Предпочтение и полезность
- •Лекция №13 Теория ожидаемой полезности
- •Аксиомы для линейной функции полезности
- •Субъективная вероятность
- •Лекция №14 Теория принятия решений
- •Аксиомы теории принятия решений
- •Прогнозирование
- •Лекция №15 Автоматизированные системы управления процессами
- •Лекция №16 Системы искусственного интеллекта
- •Экспертные системы
- •Приложение 1 Элементы булевой алгебры
- •Приложение 2 Общие сведения об операторах
- •Содержание
Итерационный метод решения игр
Рассмотрим один из наиболее простых итерационных методов решения игр – метод Брауна - Робинсона. Основная идея метода заключается в том, что игроки при многократном повторении игры при выборе стратегии в каждой конкретной партии используют весь накопленный в предыдущих партиях опыт.
Пусть - множество чистых стратегий игрокаА, а- множество чистых стратегий игрокаБ. Соответственно назовемэмпирическими смешанными стратегиямиигроковАиБпосле проведенияkпартий векторы
и ,
где - частота использования стратегийвkпартиях, а- соответственно число использования стратегийвkпартиях.
Алгоритм построения решения заключается в том, что разыгрывается большое число партий, причем в каждой партии каждый игрок выбирает такую чистую стратегию, которая обеспечивает наилучший результат для эмпирической смешанной стратегии, использованной противником в предыдущих партиях. После каждой партии значенияипересчитываются (так как изменяется число сыгранных партийk). Выбор игроками стратегий в первой партии произволен, например, можно использовать минимаксные стратегии.
Доказано, что
и ,
где и- оптимальные стратегии игроковАиБсоответственно, а выигрыш игрокаБ(проигрыш игрокаА) стабилизируется и стремится к цене игры.
При практической реализации метода вычисления прекращаются, когда
,
где ε- заданная точность.
При использовании метода Брауна - Робинсона следует иметь в виду, что он сходится медленно, но прост в реализации на ЭВМ, причем увеличение размерности игры не приводит к ощутимому увеличению объема вычислений, чего нельзя сказать о методе сведения к задачам линейного программирования.
Лекция №11 Игры двух лиц с ненулевой суммой
В играх двух лиц с ненулевой суммой есть одна существенная особенность: то, что хорошо для одного игрока, не обязательно плохо для другого. Следовательно, интересы не являются полностью противоположными, и они могут извлечь выгоду из сообщения о своей стратегии. Различают два варианта таких игр:
некооперативные(бескоалиционные) игры, когда запрещены любые соглашения, обмен информацией, побочные платежи и совместный выбор стратегий;
кооперативныеигры, в которых разрешается любой вид кооперации.
В некооперативных играхзадают две функции выигрышаА(σ,τ)иВ(σ,τ), определенные для всех пар стратегий(σ,τ)и соответствующие выигрышам игроковАиБ. Если множества стратегий конечные, то функции выигрышаА(σ,τ)иВ(σ,τ)можно представить в виде матрици. Игра в такой форме называетсябиматричной игрой.
В общем случае в таких играх равновесных пар чистых стратегий может и не существовать, но справедливо следующее утверждение.
Теорема.В любой биматричной игре существует, по крайней мере, одна равновесная пара смешанных стратегий.
К сожалению, для игр с ненулевой суммой равновесные пары не полностью удовлетворяют понятию «решение игры». Рассмотрим примеры, которые демонстрируют соответствующие трудности.
Пример 1
Фирма Аможет выпускать два сорта кофе: дешевый и дорогой, а фирмаБ- два типа кофейников: дешевые и дорогие. Дорогой кофе можно сварить в любом кофейнике, а дешевый кофе – только в дорогом кофейнике.
Если одна фирма производит дорогой продукт, а другая – дешевый, то существуют соизмеримые объемы продажных товаров, при которых фирма, выпускающая дорогой продукт, получит большую прибыль, а другая будет иметь некоторую разумную прибыль. Если обе фирмы будут выпускать дорогую продукцию, то объемы продаж будут малы и ни одна из них не получит никакой прибыли. Если же обе фирмы будут выпускать дешевую продукцию, то они ничего не продадут.
Рассматриваемую игру, разумным образом вводя полезность (в условных единицах), можно представить с помощью двух матриц
.
Нетрудно видеть, что равновесными будут пары и. Однако парыине являются равновесными. Более того, выигрыши в равновесных точках различны.
Пример 2 (дилемма заключенного)
Два преступника ожидают приговора суда за совершенное злодеяние. Адвокат конфиденциально предлагает каждому из преступников облегчить его участь (и даже освободить!), если он сознается и даст показания против сообщника. Если никто не сознается, то обоим угрожает заключение на определенный срок по сфабрикованному обвинению в незначительном преступлении.
Каждый заключенный имеет на выбор две стратегии: не сознаваться или сознаться, выдав при этом сообщника. Разумно назначив полезность, можно получить матрицы
.
Нетрудно видеть, что - единственная равновесная пара, однако неравновесные стратегии дадут им больший выигрыш.
Рассмотренные примеры показывают, что некооперативные игры двух лиц с ненулевой суммой существенно отличаются от игр двух лиц с нулевой суммой. Подробнее остановиться на таких играх не позволяет объем нашего курса.
В основе кооперативных игрлежит предпосылка, согласно которой оба игрока могут в целом достичь большего, если будут действовать сообща, - в этом и состоит ценность кооперации. Такая кооперация, естественно, должна оплачиваться, что приводит к различнымсделкам, или так называемымпобочным платежам.
В простейшем случае предполагается, что два игрока не могут воздействовать друг на друга, пока не придут к некоторому соглашению. Таким образом, игра определяется посредством подмножества Sв евклидовом пространстве, представляющего (общие) выигрыши, которые оба игрока могут получить в случае кооперации; кроме того, заданы два числа, определяющие величину выигрыша каждого из игроков без кооперации между ними.
Обычно предполагают, что подмножество S является замкнутым, выпуклым и ограниченным сверху (в том смысле, что для любых(a,b)множество всехсограничено). В таком случае, основываясь на разумной системе аксиом (аксиомах Нэша), можно прийти к выводу, что игроки «должны» согласиться получить выигрыш, соответствующий точке, в которой достигается
при ограничениях .
Такая точка известна какточка Нэша. Можно доказать, что она единственна.
В более общем случае каждый из игроков может воздействовать на другого, даже если соглашение между ними не достигнуто. В этом случае игра будет иметь более сложную структуру, определяемую множеством S, аналогичным введенному выше, и двумя функциями платежейА(σ,τ)иВ(σ,τ), которые характеризуют выигрыши игроков, если они не могут достичь соглашения (здесьσиτ– стратегии двух игроков).
Идея состоит в том, что стратегии σиτвыбираются и используются какугроза, которая осуществляется только в том случае, если соглашение не достигнуто. Тогда сделка может быть заключена, если каждый из игроков знает угрозу другого. Последнее обстоятельство приводит к тому, что исход сделки будет зависеть от весомости угроз.
Если сделаны угрозы σиτ, то исходом сделки должна быть точка, в которой достигается
при ограничениях .
Таким образом, точка логически получается в результате применения пары угроз. При этом появляется возможность определить равновесную паруне через выигрыши (с угрозой!)А(σ,τ)иВ(σ,τ), а скорее через логические исходы.
Относительно введенных понятий верна следующая теорема.
Теорема. Если множества стратегий обоих игроков конечны, то существует по крайней мере одна равновесная пара смешанных стратегий угроз, которая известна как оптимальная стратегия угроз.
Эта теорема гарантирует существование значений и оптимальных угроз для конечных игр. Конечно, вычислить их весьма сложно, так как они зависят от обеих платежных матрицА,Ви от множестваS.