Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
глава2.doc
Скачиваний:
16
Добавлен:
07.11.2018
Размер:
723.97 Кб
Скачать

X1y1,x2y2,…,x1yn,x2y1,…,x2yn,…,xmyn

Поэтому среднее значение этой случайной величины равно

h11x1y1+ h12x1y2+…+ h1nx1yn ,

+h21x2y1+ h22x2y2+…+ h2nx2yn ,

………………………………

+hm1xmy1+ hm2xmy2+…+ hmnxmyn

Это среднее называется выигрышем игрока 1 в ситуации в смешанных стратегиях (X, Y) в игре Г и что аналогии с обычной ситуацией обозначается через Нг(X,Y).

Теперь мы снова оказываемся в знакомой обстановке. Игрок 1, выбирая произвольным образом свою смешанную стратегию X, стремится максимизировать свой выигрыш Нг(X,Y). Игрок 2, произвольно выбирая свою смешанную стратегию Y, стремится Нг(X,У) минимизировать. Поэтому разумные действия игрока 1 обеспечивают ему выигрыш, не меньший, чем

, (2.24)

а разумные действия игрока 2 не дадут игроку 1 выигрыша, большего, чем

. (2.25)

Но здесь обнаруживается замечательное обстоятельство, коренным образом отличающее наши рассуждения от тех, которые были проведены ранее. Минимаксы (2.24) и (2.25) всегда оказываются равными. Следовательно, ситуации равновесия в смешанных стратегиях для матричных игр всегда существуют.

Первое доказательство равенства минимаксов (2.24) и (2.25) было найдено в 1928 г. Дж. Нейманом, а в настоящее время известно довольно много доказательств этого утверждения.

Выбор игроками своих чистых стратегий с некоторы­ми заранее заданными вероятностями — по существу один из планов проведения игры и, в этом смысле, тоже явля­ется некоторой стратегией. В отличие от первоначально заданных, такие стратегии называются смешанными.

Определение 2.5. Распределение вероятностей на множестве чистых стратегий игрока называется его сме­шанной стратегией.

Множество всех смешанных стратегий игрока I будем обозначать через X. Смешанная стратегия xX являет­ся вещественной функцией, для которой Х(х)≥0 и

= Х(х)=1,

хX

а чистая стратегия — это такая функция, что Х(x°) = 1 и Х(х) = 0 для х ≠ х°.

Таким образом, чистая стратегия является частным случаем смешанной стратегии. Например, чистая стра­тегия i игрока I есть вектор (0, ..., 0, 1, 0, ..., 0), i-я компонента которого равна 1, а остальные равны нулю. Помня, что такой вектор есть не что иное как чистая стратегия i, мы далее, будем обозначать его через i. Вследствие этого, множество смешанных стратегий игро­ка I называют смешанным расширением множества чистых стратегий.

Множество всех смешанных стратегий игрока II бу­дем обозначать через У. Смешанная стратегия yУ является вещественной функцией У = У(у), для которой У(у)≥0 и , a чистая стратегия — это такая функция, что У(у°) = 1 и Y(y) = 0 для у≠ у".

Если чистые стратегии игрока I занумерованы числа­ми 1, 2, . . ., т, то каждая стратегия x Х может быть представлена как вектор

Х = (ξ12, ...,ξm), ξi≥0 , (2.26)

где ξi — вероятность выбора игроком I чистой страте­гии i.

Аналогично множество всех смешанных стратегий Y будет состоять из векторов

Y = (η1,η2, ...., ηn), ηj≥0, , (2.27)

где ηj — вероятность выбора игроком II чистой страте­гии j, a n — число чистых стратегий игрока II.

Множества смешанных стратегий игроков I и II мож­но отождествить с подмножествами евклидовых пространств Rm и Rn, определяемыми формулами (1.12) и (1.13). Эти подмножества замкнуты и ограничены, а по­тому компактны.

На рис. 2.2 изображено множество сметанных стра­тегий игрока, имеющего три чистые стратегии. Это множество является равносторонним треугольником (двумерным симплексом). Если игрок имеет п чи­стых стратегий, то множе­ство его смешанных стра­тегий можно представить в виде (п — 1 )-мерного симплекса в n-мерном про­странстве.

Рис. 2.2..

Применение смешан­ных стратегий превращает процесс игры в некоторое случайное испытание, ис­ходами которого являются ситуации игры. Это случайное испытание называется ситуацией в смешанных стратегиях и обозначается через (X, Y). На первый взгляд кажется, что применение смешанных стратегий некоторым образом осложняет положение игрока. Действительно, ис­пользуя смешанную стратегию, игрок I может в качестве вы­игрыша получить, вообще говоря, любой элемент матрицы выигрышей Н = ||hij||, в том числе самый малый элемент этой матрицы, который для некоторых матриц он заве­домо не получил бы, применяя свою максиминную стра­тегию. Однако при достаточно правильно выбранной стра­тегии ситуация, соответствующая минимальному элемен­ту матрицы, будет осуществляться, с малой вероятностью. Отказываясь от применений только чистых стратегий, игрок отказывается и от получения заведомо гарантиро­ванного результата. Он старается максимизировать мате­матическое ожидание своего выигрыша.

Отсутствие какого-либо обмена информацией между игроками делает их случайные выборы своих чистых стратегий независимыми. Поэтому, если они применяют свои смешанные стратегии XX, YY, то каждая ситуация в чистых стратегиях (х, у) реализуется с вероятностью X(x)Y(y). Следовательно, математическое ожи­дание выигрыша игрока I можно вычислить по формуле

Н (X, Y) = ∑ ∑ Н (х, у) X (х) Y (у), (2.28)

xX уУ

или, в матричной форме записи,

(2.29)

Таким образом, мы пришли к понятию смешанного расширения матричной игры.

Определение 2.6. Тройка Г = < X, Y, H>, где X, У — смешанные расширения чистых стратегий игро­ков, а функция выигрыша игрока I определяется выра­жением (2.28) или (2.29), называется смешанным расши­рением матричной игры.

Смешанное расширение матричной игры является ан­тагонистической игрой, в которой множество чистых стра­тегий каждого из игроков бесконечно, функция выигрыша игрока I задана формулой (2.28) или (2.29), а функ­ция выигрыша игрока II равна — H.

Функция Н(Х,Y), являясь билинейной функцией в евклидовом пространстве, непрерывна на множестве ситуаций X х Y. Вследствие замкнутости и ограничен­ности множества смешанных стратегий первого игрока определена и непрерывна функция

v(X)=minH(X,Y)=minH(X,j). (2.30) y j

Действительно, каждая из функций Н(Х,Y) (1≤j≤n) непрерывна, а значит, вследствие замкнутости и ограни­ченности, и равномерно непрерывна. Таким образом, так как число функций Н(Х, j) конечно, для любого ε > О существует такое δ > 0, что из условия |Х'— Х"|<δ будет следовать неравенство |Н(Х', j) —H(Х", j)|<ε при ijn. Далее, если v(X') = Н(X', У'),

v(X")= Н(Х",j"),то

v(X') + ε = Н(Х', j') + ε > H(Х", , j') ≥ v(X")> Н(Х', j") – ε ≥ v(X') - ε

Следовательно, |v(X') — v(X")| < ε, что доказывает непрерывность функции v(X). Поэтому существует стратегия X*, определяемая равенствами

(2.31)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]