5.2.4.Смешанные стратегии

В заключение данного параграфа отметим еще одну важную особенность принципа оптимальности в форме равновесия. До сих пор мы не затрагивали вопроса существования ситуаций равновесия в произвольной биматричной игре; между тем, как видно из простейших примеров, ситуаций равновесия может и не быть. Выход из этого положения был найден довольно неожиданный: вводится новый способ выбора стратегий, состоящий в том, что стратегии выбираются не путем их явного указания, а случайным образом, но так, чтобы каждая стратегия имела определенную вероятность быть выбранной. Пусть, например, множество, из которого производится выбор, состоит из трех элементов: X={x₁,x₂,x₃}, при этом вероятность выбора x₁равна 1/2, вероятность выбора x₂равна 1/3 и вероятность выбора x₃равна 1/6. Рассмотрим физический механизм, представляющий собой свободно вращающуюся вокруг неподвижной оси стрелку, а окружность разбита на три дуги x₁,x₂,x₃, длины которых пропорциональны числам 1/2, 1/3, 1/6 (рис.5.3). Если придать стрелке вращение, то вероятность того, что она остановится в секторе x₁,x₂,x₃, равна соответственно 1/2, 1/3, 1/6. Таким образом, данный механизм реализует случайный выбор элементов x₁,x₂,x₃ с вероятностями соответственно 1/2, 1/3, 1/6.

Рассмотрим теперь биматричную игру, в которой X={x₁,…,x_n}– множество стратегий игрока 1, Y={y₁,…,y_m}– множество стратегий игрока 2, f_k – функция выигрыша игрока k=l, 2. Пусть игрок 1 производит выбор своей стратегии случайно, причем вероятность выбора стратегии x_i равна . Тогда можно считать, что он производит выбор (но уже неслучайно!) системы неотрицательных чисел .Такая система чисел носит название смешанной стратегии.

Таким образом, допущение случайного выбора игроками своих стратегий означает фактически замену первоначальных множеств стратегий игроков множествами смешанных стратегий. Пусть игрок 1 выбрал смешанную стратегию p=(p₁,…,p_n), а игрок 2 – смешанную стратегию q=(q₁,…,q_m). Если игроки производят свой выбор независимо друг от друга, тогда вероятность того, что одновременно игрок 1 выберет стратегию x_i, а игрок 2 – стратегию y_j ,т. е. вероятность ситуации (x_i, у_j), равна произведению p_iq_j, причем в этой ситуации игрок 1 получает выигрыш f₁(x_i, у_j), а игрок 2 – выигрыш f₂(x_i, у_j). В качестве выигрышей игроков при выборе ими смешанных стратегий р и q берутся математические ожидания:

для игрока 1

для игрока 2

В итоге мы получаем новую игру, в которой стратегиями игроков являются их смешанные стратегии, М и N – функции выигрыша. Такая игра носит название смешанного расширения первоначальной игры. Одним из основные результатов теории игр является доказанная в 1951 г. американским математиком Дж. Нэшем теорема, согласно которой для всякой биматричной игры существует ситуация равновесия в ее смешанном расширении.

5.3. Игры с нулевой суммой

Игры двух участников с нулевой суммой составляют наиболее хорошо разработанную часть теории игр. В них рассматриваются ситуации, связанные с принятием решений, в которых два противника имеют противоположные цели. К числу типичных примеров относится рекламирование конкурирующих товаров и планирование военных стратегий противоборствующих армий. Эти ситуации принятия решений отличаются от рассмотренных ранее, где противники не обязательно рассматривались как антагонисты.

В игровом конфликте участвуют два противника, именуемые игроками, каждый из которых имеет некоторое множество (конечное или бесконечное) возможных выборов, которые называются стратегиями. С каждой парой стратегий связан платеж, который один из игроков выплачивает другому. Поскольку выигрыш одного игрока равен проигрышу другого, эти игры получили название игр двух лиц с нулевой суммой. В такой игре достаточно задать результаты в виде платежей для одного из участников. При обозначении игроков через А и В с числом стратегий m и n соответственно, игру обычно представляют в виде матрицы платежей игроку А:

Игры такого типа называют матричными. Матричное представление игры означает, что если игрок А использует стратегию i, а игрок В – стратегию j, то платеж игроку А составляет а_ij, и, следовательно, игроку В – (-а_ij).

<<< < Предыдущая 1 2 3 4 56 / 116 7 8 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.11.20181.04 Mб3Стат. мет.5.doc
#
19.09.2019872.01 Кб2Статика л1.docx
#
27.08.20192.16 Mб6Структура и Субструктура.doc
#
05.11.2018264.19 Кб5Т.К.М лаб. раб №2.doc
#
28.09.20191.81 Mб12Т4 Принятие решений в условиях риска.doc
#
28.09.2019915.46 Кб12Т5 Принятие решений в условиях неопределенности...doc
#
10.06.2015330.24 Кб18Таблица 6.психология.doc
#
10.06.201592.65 Кб38ТГП ответы.docx
#
10.06.201518.99 Mб41ТГП.docx
#
10.06.2015901.06 Кб360Тексты на английском.pdf
#
10.06.2015233.98 Кб48Телефоны Опеки по Калининградской области.doc