Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр - теоретический материал, все вопросы.docx
Скачиваний:
280
Добавлен:
20.06.2014
Размер:
4.41 Mб
Скачать

56. Обратная индукция и позиционные игры с совершенной информацией.

Для того, чтобы внимательнее посмотреть на обратную индукцию в конечной игре с совершенной информацией, начнём с определения оптимального «действия» в последних вершинах дерева, где принимается решение (т.е. тех вершин, для которых «последователи» – это только терминальные вершины). Решение, принимаемое игроком в такой вершине, не зависит уже от стратегического взаимодействия и потому является простой задачей принятия решения. Затем мы может обратиться к «предпоследней» вершине и найти оптимальное решение там, предвидя, естественно, ход, который будет сделан в последней вершине. И так далее.

Рассмотрим следующий пример позиционной игры

Принимая оптимальные решения для третьего игрока в последних вершинах дерева, приходим к первой редуцированной игре следующего вида

Принимая оптимальное решение для второго игрока, получаем вторую редуцированную игру (

Игровая ситуация является равновесной по Нэшу. Игрок отклонившись в единоличном порядке от своей оптимальной стратегии может лишь ухудшить своё положение. Найденное решение игры проведено в соответствии с принципом последовательной рациональности.

57. Модель дуополии по Штакельбергу.

Дуополия по Штакельбергу – это модификация дуополии по Курно. Теперь мы считает, что есть лидер, который делает ход первым. Затем, зная этот выбор, другой игрок делает свой ход.

Итак, игра протекает следующим образом:

  1. фирма 1 выбирает ;

  2. фирме 2 становится известна величина , и после этого она выбирает;

  3. Выигрыш фирмы определяется формулой ,.

Для нахождения равновесия воспользуемся обратной индукцией. Определим сначала функцию реагирования фирмы 2, решая задачу

.

Привлекая необходимое условие существования экстремума получаем функцию реагирования . То же самое было и в случае дуополии Курно. Разница, однако, в том, чтодействительная, а не гипотетическая функция реагирования фирмы 2.

Фирма 1, естественно, также может вычислить эту функцию реагирования, а, следовательно, задача фирмы 1 выглядит так:

,

что даёт и.

Прибыль в случае дуополии по Штакельбергу:

, .

Для сравнения в модели Курно:

.

58. Модель последовательного торга.

Рассмотрим следующую игру. Игроки 1 и 2 торгуются о разделе 1 доллара: 1-й игрок предлагает некоторый способ деления, 2-й либо принимает это предложение, либо нет; если нет, то он предлагает способ деления, а 1-й принимает, либо нет и т.д.

Каждое предложение занимает один период, но при этом есть дисконтирующий множитель. Итак, формально рассмотрим следующую трёх-периодную игру.

1.а) В начале первого периода игрок 1 предлагает «свою долю» доллара, оставляяигроку 2.

1.b) Игрок 2 принимает предложение, тогда игра заканчивается, либо отклоняет его. В этом случае игра переходит ко 2-му периоду.

2.a) В начале второго периода игрок 2 предлагает долю , которую получает игрок 1, оставляя себе.

2.b) Игрок 1 либо принимает предложение, либо нет. В последнем случае игра переходит к 3-му периоду.

3) Игроки в третьем периоде получают доли ,, причёмd задан экзогенно.

Решим данную задачу с помощью обратной индукции. Сначала вычислим, что происходит, если дело доходит до 2-го периода. Игрок 1 может получить d, если отклонит . С учётом дисконтирования (мы сравниваем стоимость в разных (соседних) периодах) игрок 1 приметтогда и только тогда, когда,– коэффициент дисконтирования. Это значит, что задача игрока 2 состоит в выборе между получениеми получениемв следующем периоде. Дисконтированная стоимость последнего действия есть, что меньше, чем, а потому игрок 2 во втором периоде предлагает.

Таким образом, если игра доходит до второго периода, то 2-й игрок предложит , и игрок 1 примет это предложение.

Однако игрок 1 может предвидеть, что игрок 2 может получить во втором периоде, отклоняя предложение. В первом периоде стоимостьс учётом дисконтирования составит. Значит, игрок 2 принимаеттогда и только тогда, когда, или.

Поэтому задача игрока 1 в первом периоде состоит в выборе между получением в этом периоде и получениемв следующем периоде. Дисконтированная величинасоставляет, что меньше, чем. Значит, оптимальное предложение в первом периоде есть. Следовательно, в первом периоде игрок 1 предлагает, а игрок 2 принимает это предложение и получает. Таким образом, выигрыш игроков естьисоответственно.