Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции мисис-15.doc
Скачиваний:
60
Добавлен:
23.03.2016
Размер:
1.42 Mб
Скачать

2. Пусть игрок а обладает 4 чистыми стратегиями. Будут ли следующие векторы смешанными стратегиями?

а) (2/3, 5/24, 1/8) –нет, т.к. смешанная стратегия 4-х мерный вектор.

б) (5/12, 5/12, 4/18, 1/18)- нет, т.к. сумма координат не равна 1.

в) (1/5, 3/10, 7/30, 4/15)- да, т.к. все координаты неотрицательны и сумма координат равна 1.

3. Известно, что смешанная стратегия Р= (р1, р2, р3, р4, р5) является следующей линейной комбинацией чистых стратегий: Р=0,15(1,0,0,0,0)+0,35(0,1,0,0,0)+0,25(0,0,1,0,0)+0,05(0,0,0,1,0)+0,20(0,0,0,0,1). Найти эту смешанную стратегию.

Ответ: (0,15; 0,35; 0,25; 0,05; 0,20).

Графическая иллюстрация смешанной стратегии

1. Пусть Р= (0; 0,6; 0,4)- тем самым, у игрока А три чистых стратегии. Отметим чистые стратегии точками А1, А2, А3 в системе координат:

Рис. 9.1

Итак, смешанная стратегия, геометрически, это точка на поверхности указанного трехмерного объекта, называемого симплексом (simplex).

2. Пусть игрок а имеет две чистых стратегии.

Изобразить графически смешанную стратегию Р=(0,3; 0,7).

На рис. 9.2 укажем симплекс, на осях координат отметим точки 0,3 и 0,7 и на прямой А1А2 отметим точкой смешанную стратегию:

Рис. 9.2

Какие же смешанные стратегии следует считать оптимальными?

Теорема фон Неймана

Каждая матричная игра с нулевой суммой имеет оптимальное решение в смешанных стратегиях, иначе говоря, существует такое число v (цена игры) и такие смешанные стратегии P*, Q* ,что

H(P,Q*) ≤ v = H(P*,Q*) ≤ H(P*,Q) .

Смысл теоремы:

существует такое число v (цена игры), что если игрок А придерживается оптимальной смешанной стратегии, а игрок В- любой ( в том числе- чистой стратегии), то математическое ожидание его выигрыша (т.е. средний гарантированный выигрыш) будет не меньше v. Аналогичное утверждение относительно игрока В: математическое ожидание его проигрыша будет не больше v.

Замечание: подчеркнем, в записи теоремы в качестве Р и Q можно ( и нужно) использовать чистые стратегии!

Как же практически найти цену игры v и оптимальные смешанные стратегии игроков? Это позволяют указанные в теореме неравенства.

Графический метод

Пример 1.

Решить игру, заданную платежной матрицей:

Рис. 9. 3

Одновременно, обеим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А?

Разумеется, то, при котором цена игры (нижняя огибающая) достигнет максимума.

Решаем систему:

р = 1/3, 1-p = 2/3, v=5/3

Вывод: если игрок А с вероятностью 1/3 будет выбирать 1 стратегию и с вероятностью 2/3 – 2 стратегию, то при достаточно большом количестве игр с данной платежной матрицей, гарантированный средний выигрыш составит 5/3.

Другая интерпретация: чередовать стратегии в пропорции 1:2.(1/3:2/3).

Чтобы найти оптимальную стратегию игрока В, воспользуемся первой строкой матрицы:

q + 3 (1-q) = vq = 2/3, 1-q = 1/3

Пример 2.

Фирма планирует выпуск двух моделей айфонов (игрок А).

Игрок В - спрос на продукцию. Аналитики составили платежную матрицу:

Найти оптимальную стратегию игрока А.

(почему не интересует игрок В?)

Следуем теореме Неймана.

Рис. 9.4

Одновременно, обеим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А?

Разумеется, то, при котором нижняя огибающая достигнет максимума.

Решаем систему:

р = 3/11, 1-p = 8/11, v = 49/11

Вывод: следует порекомендовать выпускать айфоны обеих моделей в отношении 3:8.

Чтобы найти оптимальную стратегию игрока В, заметим, что в образовании цены игры участвовали только 2-я и 3-я чистые стратегии игрока В, поэтому: 3q2 + 11 (1-q2) = 49/11.

q2 = 9/11, q3 =2/11, q1=0.

Пример 3

Компания занимается разработкой нового продукта и оценивает возможность его выхода на рынок в следующем году. Можно выпустить продукт малой серией из за опасений, что экономическая обстановка будет неудовлетворительной, либо выпустить продукт крупной серией в надежде на экономический рост. Составлена платежная матрица (прибыль в тысячах евро):

400р + 100=-600р+ 900

р=0,8 V=420

Итак, если бы ситуация могла повторяться несколько раз, то оптимальным вариантом было бы выпускать продукт малой серией в 8 случаях из 10, при этом средний ожидаемый доход 420 тысяч евро.

Пример:

Торговая организация А выделяет 1 млн. рублей на закупку товара. Имеется выбор между закупкой товара Т1 или Т2. Ожидаемая прибыль зависит от того, какой товар Т1 или Т2 будет закупать конкурент В. Если оба будут закупать Т1, то в виду конкуренции А понесет убытки 200 тыс.руб. Если оба будут закупать Т2, то по той же причине А понесет убытки в 100 тыс.руб. Если А закупит Т1, а В закупит Т2, то прибыль А составит 900 тыс. руб. Если А закупит Т2, а В- Т1, то прибыль А составит 700 тыс. руб. Как лучше поступить игрокам при оптимальном поведении?

Чистые стратегии игроков очевидны: А1-компания А закупает товарТ1, А2- компания А закупает товар Т2 и т.д. Составляем платежную матрицу:

-200

-100

-200р + 700(1-р) = 900р - 100(1-р)

р=8/19 1-р=11/19

цена игры v=-200(8/19)+700(11/19)= 321,052

Вывод: игроку А выгодно реализовать обе стратегии в долях 8/19=0,421 и 11/19=0,579, т.е. закупать

и товар Т1 иТ2. При этом товар Т1 должен быть закуплен на сумму 421тыс. руб., а Т2 - на сумму 579 т. руб. Прибыль не зависимо от поведения соперника составит 321052 руб. То же можно сказать и для игрока В.