Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный политехнический университет Институт Машиностроения

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

глава2.doc

Скачиваний:

Добавлен:

07.11.2018

Размер:

723.97 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 94 5 6 7 8 9 > Следующая >>>

X1y1,x2y2,…,x1yn,x2y1,…,x2yn,…,xmyn

Поэтому среднее значение этой случайной величины равно

h₁₁x₁y₁+ h₁₂x₁y₂+…+ h_1nx₁y_n ,

+h₂₁x₂y₁+ h₂₂x₂y₂+…+ h_2nx₂y_n
,

………………………………

+h_m₁x_my₁+ h_m₂x_my₂+…+ h_mnx_my_n

Это среднее называется выигрышем игрока 1 в ситуации в смешанных стратегиях (X, Y) в игре Г и что аналогии с обычной ситуацией обозначается через Нг(X,Y).

Теперь мы снова оказываемся в знакомой обстановке. Игрок 1, выбирая произвольным образом свою смешанную стратегию X, стремится максимизировать свой выигрыш Нг(X,Y). Игрок 2, произвольно выбирая свою смешанную стратегию Y, стремится Нг(X,У) минимизировать. Поэтому разумные действия игрока 1 обеспечивают ему выигрыш, не меньший, чем

, (2.24)

а разумные действия игрока 2 не дадут игроку 1 выигрыша, большего, чем

. (2.25)

Но здесь обнаруживается замечательное обстоятельство, коренным образом отличающее наши рассуждения от тех, которые были проведены ранее. Минимаксы (2.24) и (2.25) всегда оказываются равными. Следовательно, ситуации равновесия в смешанных стратегиях для матричных игр всегда существуют.

Первое доказательство равенства минимаксов (2.24) и (2.25) было найдено в 1928 г. Дж. Нейманом, а в настоящее время известно довольно много доказательств этого утверждения.

Выбор игроками своих чистых стратегий с некоторыми заранее заданными вероятностями — по существу один из планов проведения игры и, в этом смысле, тоже является некоторой стратегией. В отличие от первоначально заданных, такие стратегии называются смешанными.

Определение 2.5. Распределение вероятностей на множестве чистых стратегий игрока называется его смешанной стратегией.

Множество всех смешанных стратегий игрока I будем обозначать через X. Смешанная стратегия xX является вещественной функцией, для которой Х(х)≥0 и

∑= Х(х)=1,

хX

а чистая стратегия — это такая функция, что Х(x°) = 1 и Х(х) = 0 для х ≠ х°.

Таким образом, чистая стратегия является частным случаем смешанной стратегии. Например, чистая стратегия i игрока I есть вектор (0, ..., 0, 1, 0, ..., 0), i-я компонента которого равна 1, а остальные равны нулю. Помня, что такой вектор есть не что иное как чистая стратегия i, мы далее, будем обозначать его через i. Вследствие этого, множество смешанных стратегий игрока I называют смешанным расширением множества чистых стратегий.

Множество всех смешанных стратегий игрока II будем обозначать через У. Смешанная стратегия yУ является вещественной функцией У = У(у), для которой У(у)≥0 и , a чистая стратегия — это такая функция, что У(у°) = 1 и Y(y) = 0 для у≠ у".

Если чистые стратегии игрока I занумерованы числами 1, 2, . . ., т, то каждая стратегия x Х может быть представлена как вектор

Х = (ξ₁,ξ₂, ...,ξ_m), ξi≥0 , (2.26)

где ξ_i — вероятность выбора игроком I чистой стратегии i.

Аналогично множество всех смешанных стратегий Y будет состоять из векторов

Y = (η₁,η₂, ...., η_n), η_j≥0, , (2.27)

где η_j — вероятность выбора игроком II чистой стратегии j, a n — число чистых стратегий игрока II.

Множества смешанных стратегий игроков I и II можно отождествить с подмножествами евклидовых пространств R^m и Rⁿ, определяемыми формулами (1.12) и (1.13). Эти подмножества замкнуты и ограничены, а потому компактны.

На рис. 2.2 изображено множество сметанных стратегий игрока, имеющего три чистые стратегии. Это множество является равносторонним треугольником (двумерным симплексом). Если игрок имеет п чистых стратегий, то множество его смешанных стратегий можно представить в виде (п — 1 )-мерного симплекса в n-мерном пространстве.

Рис. 2.2..

Применение смешанных стратегий превращает процесс игры в некоторое случайное испытание, исходами которого являются ситуации игры. Это случайное испытание называется ситуацией в смешанных стратегиях и обозначается через (X, Y). На первый взгляд кажется, что применение смешанных стратегий некоторым образом осложняет положение игрока. Действительно, используя смешанную стратегию, игрок I может в качестве выигрыша получить, вообще говоря, любой элемент матрицы выигрышей Н = ||hij||, в том числе самый малый элемент этой матрицы, который для некоторых матриц он заведомо не получил бы, применяя свою максиминную стратегию. Однако при достаточно правильно выбранной стратегии ситуация, соответствующая минимальному элементу матрицы, будет осуществляться, с малой вероятностью. Отказываясь от применений только чистых стратегий, игрок отказывается и от получения заведомо гарантированного результата. Он старается максимизировать математическое ожидание своего выигрыша.

Отсутствие какого-либо обмена информацией между игроками делает их случайные выборы своих чистых стратегий независимыми. Поэтому, если они применяют свои смешанные стратегии XX, YY, то каждая ситуация в чистых стратегиях (х, у) реализуется с вероятностью X(x)Y(y). Следовательно, математическое ожидание выигрыша игрока I можно вычислить по формуле

Н (X, Y) = ∑ ∑ Н (х, у) X (х) Y (у), (2.28)

_x_X_уУ

или, в матричной форме записи,

(2.29)

Таким образом, мы пришли к понятию смешанного расширения матричной игры.

Определение 2.6. Тройка Г = < X, Y, H>, где X, У — смешанные расширения чистых стратегий игроков, а функция выигрыша игрока I определяется выражением (2.28) или (2.29), называется смешанным расширением матричной игры.

Смешанное расширение матричной игры является антагонистической игрой, в которой множество чистых стратегий каждого из игроков бесконечно, функция выигрыша игрока I задана формулой (2.28) или (2.29), а функция выигрыша игрока II равна — H.

Функция Н(Х,Y), являясь билинейной функцией в евклидовом пространстве, непрерывна на множестве ситуаций X х Y. Вследствие замкнутости и ограниченности множества смешанных стратегий первого игрока определена и непрерывна функция

v(X)=minH(X,Y)=minH(X,j). (2.30) y j

Действительно, каждая из функций Н(Х,Y) (1≤j≤n) непрерывна, а значит, вследствие замкнутости и ограниченности, и равномерно непрерывна. Таким образом, так как число функций Н(Х, j) конечно, для любого ε > О существует такое δ > 0, что из условия |Х'— Х"|<δ будет следовать неравенство |Н(Х', j) —H(Х", j)|<ε при i≤j≤n. Далее, если v(X') = Н(X', У'),

v(X")= Н(Х",j"),то

v(X') + ε = Н(Х', j') + ε > H(Х", , j') ≥ v(X")> Н(Х', j") – ε ≥ v(X') - ε

Следовательно, |v(X') — v(X")| < ε, что доказывает непрерывность функции v(X). Поэтому существует стратегия X*, определяемая равенствами

(2.31)

<<< < Предыдущая 1 2 34 / 94 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.11.2019353.79 Кб1ГЛАВА 3 Стратегии.doc
#
24.11.2019368.64 Кб6ГЛАВА 4 Планирование.doc
#
24.11.2019982.02 Кб23ГЛАВА 6 Рац.Технологии.doc
#
25.11.2019338.94 Кб2Глава 8 мпз откор 07-10.doc
#
07.11.201865.02 Кб4глава1.doc
#
07.11.2018723.97 Кб16глава2.doc
#
07.11.2018312.83 Кб11глава3.doc
#
07.11.2018331.26 Кб7глава5.doc
#
24.11.20191.09 Mб4Главы 7 и 8.doc
#
15.12.20181.26 Mб16Гос. рег. в эк..doc
#
20.07.201960.64 Кб2Государственное образовательное учреждение.docx