- •Теория игр
- •. Содержание
- •История исследований по теории игр
- •Представление игр
- •Экстенсивная форма
- •Нормальная форма
- •Характеристическая функция в игре
- •Применение теории игр
- •Описание и моделирование
- •Нормативный анализ (выявление наилучшего поведения)
- •Типы игр Кооперативные и некооперативные
- •Симметричные и несимметричные
- •С нулевой суммой и с ненулевой суммой
- •Параллельные и последовательные
- •С полной или неполной информацией
- •Игры с бесконечным числом шагов
- •Дискретные и непрерывные игры
- •Метаигры
- •Стохастическая игра
- •История исследований стохастических игр
- •Применение стохастических игр
- •Некооперативная игра
- •Некооперативная игра в нормальной форме
- •Некооперативная игра в развернутой форме
- •Принципы оптимальности Эффективность по Парето
- •Равновесие Нэша: формальное определение
- •Равновесии дрожащей руки: формальное определение
- •Собственное равновесие
- •Определение
- •Сильное равновесие
- •Равновесие в доминирующих стратегиях
- •Равновесие, совершенное по под-играм
- •Кооперативная игра
- •Математическое представление кооперативной игры
- •Свойства характеристической функции
- •Примеры кооперативных игр
- •Решение кооперативных игр
- •Свойства
- •Формальное определение
- •История возникновения
- •Дальнейшие свойства
- •Вектор Шепли
- •Формальное определение
- •Аксиоматика вектора Шепли
- •Литература
- •Антагонистическая игра
- •Дифференциальные игры
- •Сетевые игры
- •Кооперативные стохастические игры
- •Марковский процесс принятия решений
- •Определение
- •Классическая дилемма заключённого
- •Обобщённая форма
- •Примеры из реальной жизни
- •Повторяющаяся дилемма заключённого
- •Психология обучения и теория игр
- •Восточная философия
- •Генетика
- •Игрок в теории игр
- •Типы стратегий
- •Терминология
- •Формальные определения
- •Доминирование и равновесие Нэша
- •Последовательное исключение доминируемых стратегий
- •Литература
Классическая дилемма заключённого
Во всех судебных системах кара за бандитизм(совершение преступлений в составе организованной группы) намного тяжелее, чем за те же преступления, совершённые в одиночку (отсюда альтернативное название — «дилемма бандита»).
Классическая формулировка дилеммы заключённого такова:
Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?
Игру можно представить в виде следующей таблицы:
|
Заключённый Б хранит молчание |
Заключённый Б даёт показания |
Заключённый А хранит молчание |
Оба получают полгода. |
А получает 10 лет, Б освобождается |
Заключённый А даёт показания |
А освобождается, Б получает 10 лет тюрьмы |
Оба получают 2 года тюрьмы |
«Дилемма заключённого» в нормальной форме. |
Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.
Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.
С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимумможет быть противоположнымравновесию Нэша.
Обобщённая форма
|
Сотрудничать |
Предать |
Сотрудничать |
C, C |
c, D |
Предать |
D, c |
d, d |
Каноническая матрица выигрышей «Дилеммы заключённого» |
В игре — два игрока и банкир. Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой — «предать» (это стандартная терминология игры). Каждый игрок кладёт одну карту перед банкиром лицом вниз (то есть никто не знает чужого решения, хотя знание чужого решения не влияет на анализ доминирования[1]). Банкир открывает карты и выдаёт выигрыш.
Если оба выбрали «сотрудничать», оба получают C. Если один выбрал «предать», другой «сотрудничать» — первый получаетD, второйс. Если оба выбрали «предать» — оба получаютd.
Значения переменных C, D, c, d могут быть любого знака (в примере выше все меньше либо равны 0). Обязательно должно соблюдаться неравенство D > C > d > c, чтобы игра представляла собой «Дилемму заключённого» (ДЗ).
Если игра повторяется, то есть играется больше 1 раза подряд, общий выигрыш от сотрудничества должен быть больше суммарного выигрыша в ситуации, когда один предаёт, а другой — нет, то есть 2C > D + c (объяснение см. ниже).
Эти правила были установлены Дугласом Хофштадтероми образуют каноническое описание типичной дилеммы заключённого.
Хофштадтер[2]предположил, что люди проще понимают задачи, как задача ДЗ, если она представлена в виде отдельной игры или процесса торговли. Один из примеров —«обмен закрытыми сумками»:
Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая — товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.
В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игрокиникогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.