- •2.Теоретические основы матричных игр
- •2.1 Структура матричных игр и принципы оптимальности
- •2.2. Минимаксы
- •2.3 Смешанное расширение матричной игры.
- •X1y1,x2y2,…,x1yn,x2y1,…,x2yn,…,xmyn
- •2.4. Теорема о минимаксе
- •2.5. Ситуации равновесия и оптимальные стратегии
- •Свойства значения игры и оптимальных стратегий
- •2.7. Доминирование стратегий
- •2.7 Игры против природы – частный и важный случай матричной игры.
2.Теоретические основы матричных игр
2.1 Структура матричных игр и принципы оптимальности
Определение 2.1. Антагонистические игры, в которых каждый игрок имеет конечное число стратегий, называют матричными играми [3].
Следовательно, для того, чтобы перейти к рассмотрению матричных игр, необходимо охарактеризовать антагонистические игры.
Определение 2.2. Игры, в которых имеется только два участника (игрок I и игрок II) с диаметрально противоположными интересами называют антагонистическими играми или играми с нулевой суммой.
Формально противоположность интересов игроков выражается в том, что при переходе от некоторой ситуации s к ситуации si игрок I приобретает (теряет) ровно столько, сколько теряет (соответственно, приобретает) игрок II [6]:
Н1(s)- Н1(si)= Н2(si)- Н2(s)
Иначе это можно выразить как постоянство суммы выигрышей игроков во всех ситуациях:
Н1(s)+ Н1(s)= Н1(si)+ Н1(si)
Определение 2.3. Тройка
Г = < X, Y, H > (2.1)
(где X и Y — множества, Н — функция от двух переменных х X и у Y) называется антагонистической игрой. Если множества X и Y конечны, то тройка (1.1) называется конечной антагонистической игрой. Множества X , Y называются множествами стратегий. Элементы х X называются стратегиями (точнее чистыми стратегиями) игрока I, элементы у Y — (чистыми) стратегиями игрока II, функция Н — функцией выигрыша игрока I или просто функцией выигрыша, а пара (х, у) — ситуацией в чистых стратегиях[1].
Необходимо ещё раз отметить, что для игр с нулевой суммой достаточно только задать значение функции выигрыша игрока 1.
Итак, будем считать, что оба игрока в антагонистической игре (2.1) имеют конечное число стратегий каждый. Тогда значение функции выигрыша удобно расположить в виде следующей таблицы:
Таблица 1
|
y1 |
y2 |
… |
yn |
x1 |
Н(х1, у1) |
Н(х1, у1) |
… |
Н(х1, у1) |
x2 |
Н(х1, у1) |
Н(х1, у1) |
… |
Н(х1, у1) |
… |
… |
… |
… |
… |
xm |
Н(х1, у1) |
Н(х1, у1) |
… |
Н(х1, у1) |
Поскольку число возможных действий каждого из игроков конечно, а названия стратегий для нас несущественны, можно полагать х = {1,2, . . ., т} и у = {1, 2, ...,п} (здесь т и п соответственно число чистых стратегий игроков I и II). Тогда значения функции Н естественно представить в виде матрицы.
Каждая ситуация в такой игре будет обозначаться парой чисел i,j , где i может принимать значения 1,2,…m, а j – значения 1,2,…n. Нашу таблицу теперь можно переписать в виде:
где hij- значение функции выигрыша в ситуации ij.
Таблицы подобного вида в математике называются матрицами. Горизонтальные ряды матрицы называются её строками, а вертикальные – столбцами. Числа, стоящие в клетках таблицы являются значениями выигрыша для игрока I.
Иногда для того, чтобы подчеркнуть, что в нашей игре игрок I имеет m стратегий, и игрок II – n стратегий, её называют матричной mхn игрой.
Процесс разыгрывания конечной антагонистической игры состоит в том, что игроки I и II, независимо друг от друга, выбирают соответственно некоторые чистые стратегии х и у, в результате чего складывается ситуация (х, у). После этого игрок I получает выигрыш.
Игрок II столько же проигрывает, сколько выигрывает игрок I. Поэтому величину Н(х, у) также называют проигрышем игрока II.
Такимобразом, всякую конечную антагонистическую игру можно задать вещественной матрицей, которая называется матрицей выигрышей. В этой терминологии конечная антагонистическая игра называется матричной. Выбор игроком I стратегии i означает выбор строки i, а выбор игроком II стратегии j—выбор столбца j. Выигрыш игрока I будет при этом равен элементу матрицы Н, стоящему на пересечении i-й строки и j-го столбца.
Если игрок I выбирает стратегию х0X, то игрок II может выбрать такую стратегию у Y, при которой выигрыш игрока I будет равен наименьшему из выигрышей H ( х0, у),т. е. min H (х0, у).
уY
Поэтому игрок I будет склонен выбрать свою стратегию х0 так, чтобы этот минимальный выигрыш был наибольшим, т. е. равным
H ( х0, у),т. е. min H (х0, у),
уY
minH(х0,у)=maxminН(х,у)=v(Г) (2.2)
уY хX уY
Величину v (Г) будем называть нижним значением игры Г = (X, Y, H). Соответствующую этому значению стратегию игрока I называют его максиминной чистой стратегией. Применяя эту стратегию, игрок I при любом поведении игрока II обеспечивает себе выигрыш, не меньший чем v (Г).
Это можно записать в виде неравенства
H(x°,y)≥ v(T) у Y. (2.3)
Аналогично стратегия у°, определяемая из равенства
max H(х, у°) = min max H(x, у) = (Г), (2.4)
уY уY хX
называется минимаксной чистой стратегией игрока II. Применяя ее, игрок II при любых действиях игрока I проигрывает ему не больше (Г), что соответствует неравенству
H(х, у °) ≤ (Г) x X (2.5)
Величину (Г) будем называть верхним значением игры Г = (X, Y, H).
Полагая в (2.3) у = у°, а в (2.5) x=x°, мы получим
v(Г)≤H(x°,y°)≤(Г) (2.6)
Придерживаясь стратегии x°, игрок I поступает очень осторожно: он желает получить величину v(Г) независимо от действий игрока II. Принцип, которому он следует, называется принципом максимина, потому что гарантированный выигрыш игрока I как раз равен величине
max min Н (x,y).
хX уY
Игрок I этот выигрыш может всегда себе обеспечить, а большей суммы ему не позволит выиграть противник.
Если игрок II придерживается стратегии y°, то он тоже следует этому принципу. А выигрыш игрока II равен — H(x,y), (то есть проитвоположен выигрышу игрока I )
max min. (—H(x,y)) = — min max H(x,y) (2.7)
хX уY уY хX
Таким образом, его проигрыш не больше (Г) при любых действиях игрока I.
Принцип максимина был впервые явно сформулирован Дж. фон Нейманом [1] в 1928 г.
Этот принцип имеет важное значение и широко используется в теории игр. В частности, теория антагонистических игр изучает поведение игроков, придерживающихся именно этого принципа.