Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
глава2.doc
Скачиваний:
16
Добавлен:
07.11.2018
Размер:
723.97 Кб
Скачать

2.3 Смешанное расширение матричной игры.

В предыдущем параграфе на примере 1.3 было показано, что если игра не имеет ситуа­ции равновесия в чистых стратегиях, то игроки, приме­няя свои максиминную и минимаксную чистые страте­гии, создают неустойчивую ситуацию, которую один из игроков может изменить с выгодой для себя. С другой стороны, представляется, что ничего другого осторожным игрокам рекомендовать нельзя. Но рассмотрим этот случай более подробно.

Итак, при равенстве минимаксов игрок I получает ровно столько, сколько он вообще может в этой игре получить.

Поэтому выбор им той стратегии, которая максимизирует в буквальном смысле слова не оставляет ему желать ничего лучшего. Однако в случае различия минимаксов, когда фактический гарантированный выигрыш игрока 1 «отстает» от того выигрыша, для получения которого никаких принципиальных препятствий нет, он, естественно, должен искать какие-либо дополнительные возможности увеличения своего гарантированного выигрыша. Следующие рассуждения показывают, что эти поиски можно систематизировать.

Рассмотрим с этой целью самую, пожалуй, простую из матричных игр, для которой минимаксы различны, —

игру с матрицей

(2.20)

В этом случае

,

Поэтому все проводившиеся выше рассуждения о разумных действиях игроков к такой игре неприменимы. Вместе с тем эта игра является моделью весьма часто встречающихся явлений. В положении участника такой игры мы оказываемся всякий раз, когда располагаем для достижения наших целей двумя действиями, а обстоятельства, неизвестные нам, также могут быть двоякими: либо благоприятными для первого образа действий и неблагоприятными для второго, либо наоборот. В частности, эти обстоятельства могут создаваться нашим противником, являясь его стратегиями.

Проведем анализ игры с матрицей (2.20) на примере игры в орлянку в той ее форме, когда игрок 1 кладет монету на стол лицевой («решетка») или оборотной («герб») стороной вверх, а игрок 2, не видя монеты, пытается угадать, какой стороной она положена. Угадывающий в случае правильного ответа получает лежащую на столе монету, а в противном случае сам уплачивает эту сумму противнику.

Предположим, что наши игроки играют достаточно продолжительный («бесконечный») матч в орлянку, каждая партия которого состоит из описанной выше игры. Какой тактики должны придерживаться в этом матче игроки, чтобы иметь систематический выигрыш (или хотя бы не иметь систематического проигрыша)?

Самый простой способ действий игрока 1 состоит в неизменном показе одной из сторон монеты. Пусть, например, он все время показывает герб. Тогда игрок 2 после нескольких партий это, несомненно, установит, и, называя все время герб, начнет систематически выигрывать. В предвидении такого оборота дел только у весьма недалекого игрока может мелькнуть мысль, что неизменный показ решетки будет давать ему систематический выигрыш; ясно, что показы гербов и решеток должны как-то чередоваться.

Предположим теперь, что игрок 1 примет решение показывать герб на четных конах и решетку на нечетных. Тогда игрок 2 также довольно быстро разгадает тактику своего противника и начнет систематически выигрывать. К аналогичному выводу мы придем, если допустим, что игрок 1 чередует свои стратегии каким-либо более сложным, но закономерным способом.

Эти рассуждения показывают, что игрок 1 должен избрать такую тактику чередования своих стратегий, чтобы результаты предыдущих партий не дали бы противнику никакой информации о поведении игрока 1 в последующих партиях.

Так как любое систематическое чередование гербов и

решеток может быть противником за достаточно длинное число партии разгадано, появление герба (решетки) в каждой партии должно быть случайным событием. Чтобы игрок 2 не извлек из наблюдений никакой информации о будущем, необходимо, чтобы все эти случайные события, соответствующие разным партиям, были независимыми.

Итак, будем считать, что игрок 1 в каждой партии показывает герб с вероятностью р. Тогда игрок 2, неизменно называя герб, будет с вероятностью р угадывать и получать от игрока 1 единицу, а с вероятностью 1 —р выигрывать будет игрок 1. В среднем выигрыш игрока 1 будет равен

1(1-р)+(-1)р=1-2р (2.21)

Если игрок 2 будет неизменно называть решетку, средний выигрыш игрока 1 за одну партию будет равен

(-1)(1-р)+1р=2р-1 (2.22)

Сравнивая выражения (2.21) и (2.22), мы видим, что при игрок 2 должен неизменно называть герб, а при —решетку. Это будет давать ему в среднем выигрыш в каждой партии. Единственная возможность не дать игроку 2 систематического выигрыша состоит в выборе игроком 1 значения. Следовательно, единственный разумный способ действий игрока 1 состоит в случайном бросании монеты (что, впрочем, при игре в орлянку и практикуется).

Нетрудно видеть, что по аналогичным причинам игрок 2 не может найти ничего лучшего, как также называть герб и решетку случайно, с вероятностью и независимо от партии к партии.

При этом в среднем в каждой партии ни один из игроков систематического выигрыша не получит.

Описанный здесь в применении к орлянке вероятностный подход был для довольно широкого класса игр разработан еще в двадцатых годах Борелем, Нейманом и Кальмаром [3,4]. На этом пути произошло проникновение теории вероятностей в теорию игр и тесная связь этих двух дисциплин.

Таким образом, мы выяснили, что в случае различия

минимаксов и применение игроками случайных стратегий помогает каждому из них зачислить в свой гарантированный доход некоторую долю разности

В разобранном выше примере игры в орлянку разность оказалась разделенной полностью. Это обстоятельство является типичным для матричных игр.

Итак, Рассмотрим более подробно последствия случайного выбора игроками своих стратегий.

Пусть мы имеем дело с матричной игрой Г, матрица которой

(2.23)

Случайный выбор игроком 1 своих стратегий есть некоторое испытание, в котором его стратегии (то есть строки матрицы H) имеют какие-то вероятности x1,x2,…,xm. Но такой случайный выбор тоже является некоторым способом действий игрока 1, то есть по существу некоторой его стратегией. Чтобы отличать стратегии такого вида от первоначально определенных нами стратегий игрока, их называют смешанными стратегиями. При этом первоначально заданные стратегии игрока (то есть строки матрицы выигрышей) называют чистыми стратегиями

Точно так же определяются смешанные стратегии игрока 2.

Так как в процессе антагонистической игры игроки не могут по самой сути дела, обмениваться информацией, случайные выборы стратегий первым и вторым игроком должны быть независимыми. Поэтому, если игрок 1 выбирает свою i-ю чистую стратегию с вероятностью xi, а игрок 2 выбирает свою j-ю чистую стратегию с вероятностью yj , то ситуация, определяемая стратегиями 1i и 2j в этой игре, будет иметь вероятность xiyj ..

Таким образом, процесс игры в игру Г при употреблении игроками своих смешанных стратегий превращается в некоторое случайное испытание, исходами которого являются ситуации игры.

Это случайное испытание, вполне определяемое смешанными стратегиями игроков, называется ситуацией в смешанных стратегиях.

Так как ситуация (X, Y) в смешанных стратегиях Х=(x1,x2,…,xm) и Y=(y1,y2,…,yn) является испытанием, а исходы его — ситуациями, каждой из которых приписан вполне определенный выигрыш, всякая ситуация в смешанных стратегиях осуществляет случайный выбор некоторого числа. Это значит, что каждой ситуации в смешанных стратегиях соответствует некоторая случайная величина. Эта случайная величина принимает значения

h11, h12 ,…h1n , h21,…,h2n ,…, hmn

соответственно с вероятностями

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]