- •Теория игр
- •. Содержание
- •История исследований по теории игр
- •Представление игр
- •Экстенсивная форма
- •Нормальная форма
- •Характеристическая функция в игре
- •Применение теории игр
- •Описание и моделирование
- •Нормативный анализ (выявление наилучшего поведения)
- •Типы игр Кооперативные и некооперативные
- •Симметричные и несимметричные
- •С нулевой суммой и с ненулевой суммой
- •Параллельные и последовательные
- •С полной или неполной информацией
- •Игры с бесконечным числом шагов
- •Дискретные и непрерывные игры
- •Метаигры
- •Стохастическая игра
- •История исследований стохастических игр
- •Применение стохастических игр
- •Некооперативная игра
- •Некооперативная игра в нормальной форме
- •Некооперативная игра в развернутой форме
- •Принципы оптимальности Эффективность по Парето
- •Равновесие Нэша: формальное определение
- •Равновесии дрожащей руки: формальное определение
- •Собственное равновесие
- •Определение
- •Сильное равновесие
- •Равновесие в доминирующих стратегиях
- •Равновесие, совершенное по под-играм
- •Кооперативная игра
- •Математическое представление кооперативной игры
- •Свойства характеристической функции
- •Примеры кооперативных игр
- •Решение кооперативных игр
- •Свойства
- •Формальное определение
- •История возникновения
- •Дальнейшие свойства
- •Вектор Шепли
- •Формальное определение
- •Аксиоматика вектора Шепли
- •Литература
- •Антагонистическая игра
- •Дифференциальные игры
- •Сетевые игры
- •Кооперативные стохастические игры
- •Марковский процесс принятия решений
- •Определение
- •Классическая дилемма заключённого
- •Обобщённая форма
- •Примеры из реальной жизни
- •Повторяющаяся дилемма заключённого
- •Психология обучения и теория игр
- •Восточная философия
- •Генетика
- •Игрок в теории игр
- •Типы стратегий
- •Терминология
- •Формальные определения
- •Доминирование и равновесие Нэша
- •Последовательное исключение доминируемых стратегий
- •Литература
Равновесие Нэша: формальное определение
Допустим, —играnлиц в нормальной форме, где— набор чистых стратегий, а— набор выигрышей. Когда каждый игроквыбирает стратегиюв профиле стратегий, игрокполучает выигрыш. Заметьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком, но и от чужих стратегий. Профиль стратегийявляется равновесием по Нэшу, если изменение своей стратегии снане выгодно ни одному игроку, то есть для любого
Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных(то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешитьсмешанные стратегии, тогда в каждой игреnигроков будет хотя бы одно равновесие Нэша.
Равновесии дрожащей руки: формальное определение
Пусть задана игра в нормальной форме . Набор смешанных стратегийигроковqназывается равновесием дрожащей руки, если существует такая последовательность вполне смешанных стратегий {pε} →q, что стратегияqiявляется наилучшим ответом игрокаiна стратегии остальных игроков из набораpε.
Как и равновесие Нэша, равновесие дрожащей руки существует в смешанном расширении в любойнекооперативной игрес конечными множествами стратегий игроков.
Пример
Пусть в игре будут два лица. Игра происходит в нормальной форме. Игроки выбирают стратегии (Вверх,Влево) (Вниз,Вправо). Однако, только (В,Л) является равновесием дрожащей руки.
|
Влево |
Вправо |
Вверх |
1, 1 |
2, 0 |
Вниз |
0, 2 |
2, 2 |
Действительно, предположим, что игрок 1 использует смешанную стратегию , для некоторого. Ожидаемый выигрыш игрока 2, если он играетЛево, составит:
.
Ожидаемый выигрыш игрока 2 при выборе стратегии Правосоставит:
.
Для достаточно малых значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя стратегию Правос минимальным весом. Аналогично, игрок 1 должен использовать с минимальным весом стратегиюНиз, если игрок 2 использует смешанную стратегию. Следовательно, (В,Л) является равновесием дрожащей руки.
Аналогичные рассуждения не выполняются для профиля стратегий (Н,П). Действительно, предположим, что игрок 1 использует смешанную стратегию. Ожидаемый выигрыш игрока 2, если он используетЛ, составит:
.
Ожидаемый выигрыш игрока 2 при использовании стратегии П:
.
В этом случае для любых положительных значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя Пс минимальной частотой. Следовательно, (Н,П) не является равновесием дрожащей руки, так как при небольшой вероятности ошибок игрок 2 максимизирует свой ожидаемый выигрыш, отклоняясь от данной стратеги
Собственное равновесие
Собственное равновесие—принцип оптимальностивнекооперативных играх, представляющий собой сужениеравновесия дрожащей руки. ВведёнР. Б. Майерсоном.
В отличие от равновесия дрожащей руки, данный принцип основан на предположении, что более затратные отклонения от равновесных стратегий возникают со значительно меньшей вероятностью, нежели менее затратные.
Определение
Для заданной игры в нормальной форме и параметра ε > 0, профиль вполне смешанных стратегий называетсяε-собственным, если выполнено следующее условие: для двух чистых стратегий игрокаi,x',x'' ∈Xi, таких, что его ожидаемый выигрыш при использовании стратегииx' меньше, нежели при использованииx'', вероятность использованияx' не превышаетεp, гдеp— вероятность использования чистой стратегииx''.
Профиль стратегий в игре называется собственным равновесием, если он является пределом при ε→0 последовательностиε-собственных вполне смешанных профилей стратегий.
Пример
Рассмотрим вариант игры «орел-решка», приведенный в таблице.
|
Орел |
Решка |
Забрать монету |
Орел |
-1, 1 |
0, 0 |
-1, 1 |
Решка |
0, 0 |
-1, 1 |
-1, 1 |
Игрок 1, выбирающий строку, прячет монету одной из сторон вверх. Если Игрок 2, выбирающий столбец, угадывает сторону, он получает эту монету. Однако, в этом варианте игры он имеет еще одну стратегию, забрать монету, не угадывая. Равновесиями Нэшав данной игре являются ситуации, в которых Игрок 2 использует стратегию «забрать монету» с вероятностью 1, а Игрок 1 — любую смешанную стратегию. Более того, любая такая ситуация является также иравновесием дрожащей руки. Интуитивно это означает, что Игроку 1, в условиях, когда Игрок 2 в любом случае забирает монету, нет необходимости оптимизировать свою стратегию.
В то же время, единственным собственным равновесием в этой игре является использование Игроком 1 своих стратегий «орел» и «решка» с вероятностями 1/2, а Игроком 2 — стратегии «забрать монету» с вероятностью 1. Наличие этого равновесия связано с тем, что Игрок 1 по-прежнему учитывает возможность невероятного события, когда Игрок 2 не забирает монету, а пытается угадать. При этом указанная стратегия Игрока 1 будет минимизировать его ожидаемый проигрыш.