Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский торгово-экономический университет потребительской кооперации

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ЭМММ.docx

Скачиваний:

Добавлен:

07.12.2018

Размер:

74.04 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 88

Понятие смешанной стратегии. Упрощение платежных матриц

Если платёжная матрица не имеет Седловой точки, то есть a<B, то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении 2 и более стратегий с определёнными частотами. Смешанной стратегией игрока называют вектор, каждая из компонент которого показывает относительную частоту, использования игроком соответствующей чистой стратегии. Обычно смешанную стратегию игрока A обозначают как P, а второго игрока B как вектор Q. Из определения следует, что сумма компонент вектора стратегии равна 1, а сами компоненты неотрицательны.

P=(p₁, p₂, …, p_m), p_i>0, _i=1

Q=(q₁, q₂ …, q_n), q_j>0, _j=1

Основная теорема теории игр утверждает, что каждая конечная игра имеет, по крайней мере, 1 решение и возможно оно находится в области смешанных стратегий. Применение игроками оптимальных смешанных стратегий P^* и Q^* позволяет получить выигрыш равный цене игры j и a<j<ß.

Для игр с платёжными матрицами большой размерности отыскания решения можно несколько упростить, если уменьшить их размерность путём вычёркивания дублирующих и заведомо невыгодных стратегий.

1)Если в матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующие им стратегии называются дублирующими и одна из них может быть исключена.

2)Если в матрице игры все элементы некоторой строки, определяющей стратегию игрока A не больше (<) соответствующих элементов другой строки, то стратегия игрока A называется заведомо невыгодной и может быть исключена из рассмотрения.

3)Если в матрице игры все элементы некоторого столбца, определяющего стратегию игрока B, не меньше (>) соответствующих элементов другого столбца, то данная стратегия игрока B называется заведомо невыгодной и может быть исключена из платёжной матрицы.

Решение статистических игр

Особенности игр с природой:

В платёжной матрице нельзя отбрасывать те или иные состояния природы
Решение достаточно найти только для игрока A, поскольку природа нашей рекомендации воспринять не может
Смешанные стратегии приобретают смысл только при многократном повторении игры.

Игра с природой задаётся платёжной матрицей, в которой строки соответствуют стратегиям сознательного игрока, а столбцы – состояниям природы. Состояние природы обозначаются как П_j (П – «природа», j – номер состояния). Для игр с природой часто составляют матрицу рисков. Риск – разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии A_i в тех же условиях. Риск сознательного игрока A при применении им своей стратегии A_i в условиях П_j обозначается как r_ij. Величина r_ij рассчитывается по формуле:

r_ij=B_j-a_ij

B_j– максимальный выигрыш в j-столбце, характеризует благоприятность состояния природы, a_ij – выигрыш игрока A при применении i-стратегии при j-состоянии природы.

r_ij>0

Определение наилучшей стратегии сознательного игрока A в игре с природой основано на применении некоторых критериев, которые делятся на 2 группы:

Критерии, основанные на известных вероятностях природы
Критерии, используемые в условиях полной неопределённости

Коммерческая фирма занимается продажей новогодних игрушек. Спрос на ёлочные гирлянды может составить 200, 250, 300 или 350 штук. Фирма закупает гирлянды по 2 денежные единицы за 1 штуку, а реализует по 3 денежных единицы. Непроданные к новому году гирлянды реализуются оптом по сниженной цене 1,8 денежных единиц за штуку. Определите оптимальную стратегию поведения фирмы на рынке.

Решение.

Определим стратегии фирмы и возможные состояния природы. У фирмы 4 стратегии:

A1 – закупить 200 штук гирлянд

A2 – закупить 250 штук гирлянд

A3 – закупить 300 штук гирлянд

A4 – закупить 350 штук гирлянд

У природы 4 стратегии:

П1 – спрос составит 200 штук

П2 – спрос составит 250 штук

П3 – спрос составит 300 штук

П4 – спрос составит 350 штук

Составим платёжную матрицу игры:

А/П	П1	П2	П3	П4
А1	200	200	200	200
А2	190	250	250	250
А3	180	240	300	300
А4	170	230	290	350

a₁₁=-2*200+3*200=200

a₁₂=-2*200+3*200=200

a₂₁=-2*250+3*200+1,8*50=190

a₃₁=-2*300+3*200+1,8*100=180

Рассмотрим критерии первой группы.

Критерий Байеса

Если на основе данных статистических наблюдений известны вероятности состояний природы q_j, то оптимальной стратегией игрока A считается та чистая стратегия A_i, которая соответствует максимальному среднему значению выигрыша.

В нашем примере предположим, что эксперты дали оценку возможных состояний спроса на ёлочные украшения. По их оценкам вероятности следующие: q₁=0,2; q₂=0,4; q₃=0,3; q₄=0,1.

Рассчитаем средние выигрыши по каждой стратегии игрока A:

a₁=200*0,2+200*0,4+0,3*200+0,1*200=200

a₂=190*0,2+250*0,4+250*0,3+0,1*250=238

a₃=0,2*180+0,4*240+0,3*300+0,1*300=252

a₄=248

Из полученных значений a_i выберем максимальное значение. Оно соответствует стратегии A3, её и рекомендуем.

Критерий Лапласа

Если игроку A представляется в равной мере правдоподобными все состояния природы, то полагают, что q₁=q₂=…=q_n=1/n. Оптимальной считают чистую стратегию A_i, которая обеспечивает максимальный средний выигрыш a.

a₁=200

a₂=(190+250+250+250)/4=235

a₃=255

a₄=260

Максимальный средний выигрыш соответствует стратегии A4, её и рекомендуем.

Рассмотрим критерии второй группы.

Критерий Вальда.

Оптимальной считается та стратегия игрока A, которая гарантирует в наихудших условиях максимальный выигрыш a. Критерий Вальда выражает позицию крайнего пессимизма.

a₁=min (200; 200; 200; 200)=200

a₂=min (190; 250; 250; 250)=190

a₃=180

a₄=170

Максимальный выигрыш соответствует A1.

Критерий Сэвиджа.

Выбирается та стратегия, которая в наихудших условиях даёт наименьший риск r.

Для расчёта определим максимальный проигрыш B_j по каждому состоянию природы

А/П	П1	П2	П3	П4
А1	200	200	200	200
А2	190	250	250	250
А3	180	240	300	300
А4	170	230	290	350
B_j	200	250	300	350

А/П	П1	П2	П3	П4
А1	0	50	100	150
А2	10	0	50	100
А3	20	10	0	50
А4	30	20	10	0
B_j	200	250	300	350

Найдём максимальный риск по каждой стратегии игрока A.

r₁=150

r₂=100

r₃=50

r₄=30

Минимальный риск соответствует стратегии A4.

Критерий Гурвица.

Оптимальной считается чистая стратегия A_i.

Критерий Гурвица называют критерием пессимизма-оптимизма.

В нашем примере примем значение лямбда 0,3.

S₁=0,3*200+(1-0,3)*200=200

S₂=0,3*190+0,7*250=232

S₃=0,3*180+0,7*300=260

S₄=0,3*170+0,7*350=296

Максимальный обобщённый выигрыш соответствует стратегии A4.

Ответ. Так как стратегия A4 появилась большее количество раз по всем критериям, то она является преобладающей и фирме можно рекомендовать придерживаться четвёртой стратегии. В этом случае ей обеспечена максимальная прибыль при любом состоянии спроса

<<< < Предыдущая 1 2 3 4 5 6 78 / 88

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
05.09.2019121.34 Кб8экономика, вопрос 21,22,23,24,25.doc
#
31.08.201931.81 Кб5ЭМ для ГЭК 2012 Бух.учет 305-306Э.docx
#
30.04.2015939.52 Кб102ЭММ.doc
#
30.04.2015922.62 Кб55ЭММиМ.doc
#
07.12.201868.48 Кб15ЭМММ .docx
#
07.12.201874.04 Кб19ЭМММ.docx