- •2.Теоретические основы матричных игр
- •2.1 Структура матричных игр и принципы оптимальности
- •2.2. Минимаксы
- •2.3 Смешанное расширение матричной игры.
- •X1y1,x2y2,…,x1yn,x2y1,…,x2yn,…,xmyn
- •2.4. Теорема о минимаксе
- •2.5. Ситуации равновесия и оптимальные стратегии
- •Свойства значения игры и оптимальных стратегий
- •2.7. Доминирование стратегий
- •2.7 Игры против природы – частный и важный случай матричной игры.
X1y1,x2y2,…,x1yn,x2y1,…,x2yn,…,xmyn
Поэтому среднее значение этой случайной величины равно
h11x1y1+ h12x1y2+…+ h1nx1yn ,
+h21x2y1+ h22x2y2+…+ h2nx2yn ,
………………………………
+hm1xmy1+ hm2xmy2+…+ hmnxmyn
Это среднее называется выигрышем игрока 1 в ситуации в смешанных стратегиях (X, Y) в игре Г и что аналогии с обычной ситуацией обозначается через Нг(X,Y).
Теперь мы снова оказываемся в знакомой обстановке. Игрок 1, выбирая произвольным образом свою смешанную стратегию X, стремится максимизировать свой выигрыш Нг(X,Y). Игрок 2, произвольно выбирая свою смешанную стратегию Y, стремится Нг(X,У) минимизировать. Поэтому разумные действия игрока 1 обеспечивают ему выигрыш, не меньший, чем
, (2.24)
а разумные действия игрока 2 не дадут игроку 1 выигрыша, большего, чем
. (2.25)
Но здесь обнаруживается замечательное обстоятельство, коренным образом отличающее наши рассуждения от тех, которые были проведены ранее. Минимаксы (2.24) и (2.25) всегда оказываются равными. Следовательно, ситуации равновесия в смешанных стратегиях для матричных игр всегда существуют.
Первое доказательство равенства минимаксов (2.24) и (2.25) было найдено в 1928 г. Дж. Нейманом, а в настоящее время известно довольно много доказательств этого утверждения.
Выбор игроками своих чистых стратегий с некоторыми заранее заданными вероятностями — по существу один из планов проведения игры и, в этом смысле, тоже является некоторой стратегией. В отличие от первоначально заданных, такие стратегии называются смешанными.
Определение 2.5. Распределение вероятностей на множестве чистых стратегий игрока называется его смешанной стратегией.
Множество всех смешанных стратегий игрока I будем обозначать через X. Смешанная стратегия xX является вещественной функцией, для которой Х(х)≥0 и
∑= Х(х)=1,
хX
а чистая стратегия — это такая функция, что Х(x°) = 1 и Х(х) = 0 для х ≠ х°.
Таким образом, чистая стратегия является частным случаем смешанной стратегии. Например, чистая стратегия i игрока I есть вектор (0, ..., 0, 1, 0, ..., 0), i-я компонента которого равна 1, а остальные равны нулю. Помня, что такой вектор есть не что иное как чистая стратегия i, мы далее, будем обозначать его через i. Вследствие этого, множество смешанных стратегий игрока I называют смешанным расширением множества чистых стратегий.
Множество всех смешанных стратегий игрока II будем обозначать через У. Смешанная стратегия yУ является вещественной функцией У = У(у), для которой У(у)≥0 и , a чистая стратегия — это такая функция, что У(у°) = 1 и Y(y) = 0 для у≠ у".
Если чистые стратегии игрока I занумерованы числами 1, 2, . . ., т, то каждая стратегия x Х может быть представлена как вектор
Х = (ξ1,ξ2, ...,ξm), ξi≥0 , (2.26)
где ξi — вероятность выбора игроком I чистой стратегии i.
Аналогично множество всех смешанных стратегий Y будет состоять из векторов
Y = (η1,η2, ...., ηn), ηj≥0, , (2.27)
где ηj — вероятность выбора игроком II чистой стратегии j, a n — число чистых стратегий игрока II.
Множества смешанных стратегий игроков I и II можно отождествить с подмножествами евклидовых пространств Rm и Rn, определяемыми формулами (1.12) и (1.13). Эти подмножества замкнуты и ограничены, а потому компактны.
На рис. 2.2 изображено множество сметанных стратегий игрока, имеющего три чистые стратегии. Это множество является равносторонним треугольником (двумерным симплексом). Если игрок имеет п чистых стратегий, то множество его смешанных стратегий можно представить в виде (п — 1 )-мерного симплекса в n-мерном пространстве.
Рис. 2.2..
Применение смешанных стратегий превращает процесс игры в некоторое случайное испытание, исходами которого являются ситуации игры. Это случайное испытание называется ситуацией в смешанных стратегиях и обозначается через (X, Y). На первый взгляд кажется, что применение смешанных стратегий некоторым образом осложняет положение игрока. Действительно, используя смешанную стратегию, игрок I может в качестве выигрыша получить, вообще говоря, любой элемент матрицы выигрышей Н = ||hij||, в том числе самый малый элемент этой матрицы, который для некоторых матриц он заведомо не получил бы, применяя свою максиминную стратегию. Однако при достаточно правильно выбранной стратегии ситуация, соответствующая минимальному элементу матрицы, будет осуществляться, с малой вероятностью. Отказываясь от применений только чистых стратегий, игрок отказывается и от получения заведомо гарантированного результата. Он старается максимизировать математическое ожидание своего выигрыша.
Отсутствие какого-либо обмена информацией между игроками делает их случайные выборы своих чистых стратегий независимыми. Поэтому, если они применяют свои смешанные стратегии XX, YY, то каждая ситуация в чистых стратегиях (х, у) реализуется с вероятностью X(x)Y(y). Следовательно, математическое ожидание выигрыша игрока I можно вычислить по формуле
Н (X, Y) = ∑ ∑ Н (х, у) X (х) Y (у), (2.28)
xX уУ
или, в матричной форме записи,
(2.29)
Таким образом, мы пришли к понятию смешанного расширения матричной игры.
Определение 2.6. Тройка Г = < X, Y, H>, где X, У — смешанные расширения чистых стратегий игроков, а функция выигрыша игрока I определяется выражением (2.28) или (2.29), называется смешанным расширением матричной игры.
Смешанное расширение матричной игры является антагонистической игрой, в которой множество чистых стратегий каждого из игроков бесконечно, функция выигрыша игрока I задана формулой (2.28) или (2.29), а функция выигрыша игрока II равна — H.
Функция Н(Х,Y), являясь билинейной функцией в евклидовом пространстве, непрерывна на множестве ситуаций X х Y. Вследствие замкнутости и ограниченности множества смешанных стратегий первого игрока определена и непрерывна функция
v(X)=minH(X,Y)=minH(X,j). (2.30) y j
Действительно, каждая из функций Н(Х,Y) (1≤j≤n) непрерывна, а значит, вследствие замкнутости и ограниченности, и равномерно непрерывна. Таким образом, так как число функций Н(Х, j) конечно, для любого ε > О существует такое δ > 0, что из условия |Х'— Х"|<δ будет следовать неравенство |Н(Х', j) —H(Х", j)|<ε при i≤j≤n. Далее, если v(X') = Н(X', У'),
v(X")= Н(Х",j"),то
v(X') + ε = Н(Х', j') + ε > H(Х", , j') ≥ v(X")> Н(Х', j") – ε ≥ v(X') - ε
Следовательно, |v(X') — v(X")| < ε, что доказывает непрерывность функции v(X). Поэтому существует стратегия X*, определяемая равенствами
(2.31)