Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Мурманский государственный гуманитарный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Краткий курс ИО - 08.doc

Скачиваний:

Добавлен:

10.12.2018

Размер:

1.4 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2516 17 18 19 20 21 22 23 24 25 > Следующая >>>

Геометрический способ решения антагонистических игр

Геометрический способ решения игр с нулевой суммой применяется к играм, где хотя бы у одного игрока только две стратегии. Иногда возможно упростить игры, применяя следующие принципы:

1. Игрок А стремится увеличить свой выигрыш, поэтому он не будет использовать стратегии, которые заведомо дают ему меньшие суммы;

2. Игрок В стремится уменьшить свой проигрыш, поэтому он не будет использовать стратегии, которые заведомо отнимают большие суммы.

Рассмотрим платежную матрицу

7	6	5	4	2
5	4	3	2	3
5	6	6	3	5
2	3	3	2	4

Упростим матрицу, вычеркивая заведомо невыгодные стратегии игроков.

Путем упрощения, ее можно свести к матрице (2 * 2)

В_J А_J	В1	В2
A₁	4	2
A₂	3	5

р₁ - вероятность применения игроком А стратегии A₁;

р₂ - вероятность применения игроком А стратегии A₂.

Так как р₁+ р₂=1, то р₂=1- р₁. Тогда получим:

Чистые стратегии игрока В	Ожидаемые выигрыши игрока А
В1	4 р₁+3 р₂= (4-3)р₁+3=р₁+3
В2	2 р₁+5 р₂=(2-5)р₁+5=-3р₁+5

На оси Ох разместим точки р₁=0 и р₁=1, через которые проведем прямые, перпендикулярны оси Ох. Подставляя р₁=0 и р₁=1 в выражение р₁+3, найдем значения, которые отложим на соответствующих перпендикулярных прямых. Соединив эти точки, получим прямую.

Аналогично рассмотрим выражение -3р₁+5.

Оптимальная стратегия первого игрока найдется из равенства выражений

р₁+3 и -3р₁+5: р₁= р₂=0,5. S_A= (0,5; 0; 0,5; 0), при этом цена игры равна 3,5.

Для второго игрока оптимальная стратегия ищется аналогично.

Если же игра не сводится путем упрощения к 2 x n или m x 2, то составляется математическая модель и задача решается симплекс-методом.

§3 Игры с « природой».

Для того чтобы можно сделать вывод о том какую именно стратегию выбирать игроку, необходимо использовать критерии Вальда, Гурвица, Сэвиджа, Лапласа, Байеса.

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она достигается из условия max min α_ijи совпадает с нижней ценой игры.

i j

Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека образом, агрессивно, делать все, чтобы помешать нам достигнуть успеха.

Рассмотрим задачу.

Ежедневный спрос на булочки в продовольственном магазине может принимать следующие значения

1	2	3	4	5
100	150	200	250	300

Если булочка не продана днем, то она м.б. реализована за 15 центов к концу дня. Свежие булочки продаются по 49 центов за штуку. Затраты магазина на одну булочку 25 центов.

Используя игровой подход, определить, какое число булочек надо заказывать ежедневно.

Составим платежную матрицу. Сначала вычислим прибыль (49-25=24) и убыток (15-25=-10).

	100	150	200	250	300
100	100*24	100*24	100*24	100*24	100*24
150	10024-5010	150*24	150*24	150*24	150*24
200	10024-10010	15024-5010	200*24	200*24	200*24
250	10024-15010	15024-10010	20024-5010	250*24	250*24
300	10024-20010	15024-15010	20024-10010	25024-5010	300*24

Платежная матрица примет вид

	100	150	200	250	300
100	2400	2400	2400	2400	2400
150	1900	3600	3600	3600	3600
200	1400	3100	4800	4800	4800
250	900	2600	4300	6000	6000
300	400	2100	3800	5500	7200

Вычислим критерий Вальда - максиминный. Он отражает принцип гарантированного результата:

Олицетворяет позицию крайнего пессимизма: надо ориентироваться всегда на худшие условия, зная наверняка, что хуже этого не будет. Этот перестраховочный подход для того, кто очень боится проиграть.

Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае, не меньший, чем нижняя цена игры с природой:

Н = max min α_ij

i j

Подсчитать min по строкам и выбрать ту стратегию, при которой минимум строки максимален.

А₁	2400
А₂	1900
А₃	1400
А₄	900
А₅	400

Критерий Вальда рекомендует выбирать стратегию А_1.

2. Критерий Гурвица (оптимизма - пессимизма). Критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее), ни крайним легкомысленным оптимизмом (авось кривая выведет). Критерий рекомендует стратегию, определяемую по формуле

H = Max {γmin a_ij + (1- γ)max a_ij}

i j j

где γ - степень оптимизма - изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При γ = 1 критерий превращается в критерий Вальда, при γ = 0 - в критерий максимума. На γ оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем хуже последствия ошибочных решений, больше желания застраховаться, тем γ ближе к единице.

Рассмотрим платежную матрицу.

Параметр Гурвица возьмем равным 0,6.

	min	max	γmin a_ij + (1- γ)max a_ij
А₁	2400	2400	24000.6+0.42400=2400
А₂	1900	3600	19000.6+36000.4=2580
А₃	1400	4800	14000.6+48000.4=2760
А₄	900	6000	9000.6+60000.4=2940
А₅	400	7200	4000.6+72000.4=3120

Критерий Гурвица рекомендует стратегию А₅.

3. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

Элементы матрицы рисков находится по формуле (r_ij):

r_ij= max a_ij- a_ij

где max a_ij- максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия находится из выражения

H = Min {max(max a_ij- a_ij)}

Составим матрицу риска, (max a_ij- a_ij).

Выберем максимальный элемент в столбце и вычитаем из него остальные элементы столбца, получим max(max a_ij- a_ij).

	100	150	200	250	300	Мax
А₁	0	1200	2400	3600	4800	4800
А₂	500	0	1200	2400	3600	3600
А₃	1000	500	0	1200	2400	2400
А₄	1500	1000	500	0	1200	1500
А₅	2000	1500	1000	500	0	2000

Из максимальных значений последнего столбца выбираем минимальную величину, получим Min {max(max a_ij- a_ij)}.

Критерий Сэвиджа рекомендует стратегию А₄.

4. Критерий Лапласа. Этот критерий основывается на принципе недостаточного обоснования. Поскольку вероятности состояния не известны, необходимая информация для вывода, что эти вероятности различны, отсутствует. Поэтому можно предположить, что они равны. Выбор стратегии осуществляется по формуле

H = Max {1/n·∑ a_ij}

где 1/n вероятность реализации одного из состояний р = 1/n.

А₁	(2400+2400+2400+2400+2400)/5=2400
А₂	(1900+3600+3600+3600+3600)/5=3260
А₃	(1400+3100+4800+4800+4800)/5=3780
А₄	(900+2600+4300+6000+6000)/5=3960
А₅	(400+2100+3800+5500+7200)/5=3800

Критерий Лапласа рекомендует нам стратегию А₄.

Таким образом, рассмотрев одну платежную матрицу, мы получили, что критерии Лапласа и Сэвиджа рекомендует стратегию А₄. То есть необходимый заказ булочек составит 250 единиц ежедневно.

5. Критерий Байеса. Принятие решения в условиях риска.

Если в рассмотренных выше критериях, необходимая информация о вероятностях какого-либо состояния отсутствовала, то критерий Байеса действует в условиях не полной информации, т.е. в условиях риска (имеется информация о вероятностях применения стратегий второй стороной). Эти вероятности называются априорными вероятностями.

Выбор стратегии осуществляется по формуле

H = Max {∑p_i a_ij}

Ежедневный спрос на булочки в продовольственном магазине задается следующим распределением вероятностей

1	2	3	4	5
100	150	200	250	300
0,2	0,25	0,3	0,15	0,1

Поставив значение a_ij и p_i в формулу, получим:

А₁	24000,2+24000,25+24000,3+24000,15+2400*0,1=2400
А₂	19000,2+36000,25+36000,3+36000,15+3600*0,1=3260
А₃	14000,2+31000,25+48000,3+48000,15+4800*0,1=3695
А₄	9000,2+26000,25+43000,3+60000,15+6000*0,1=3620
А₅	4000,2+21000,25+38000,3+55000,15+7200*0,1=3290

Критерий Байеса рекомендует стратегию А₃

В условиях полной неопределенности теория не дает однозначных принципов выбора того или иного критерия.

Оптимальные стратегии, выбранные по различным критериям, различны.

Таким образом, окончательный вывод зависит от предпочтений человека, который принимает решение.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2516 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
06.05.2019121.34 Кб0КР2_ Растворы.doc
#
21.03.20154.55 Mб85КР_11.DOC
#
21.03.2015561.15 Кб33кр_12.DOC
#
18.11.2019190.46 Кб2Кр_МСМ_Соц.doc
#
30.04.20151.21 Mб21кр_теор_поля.doc
#
10.12.20181.4 Mб18Краткий курс ИО - 08.doc
#
07.03.20163.78 Mб506Крейндлин Л.Н. Столярные, плотничные и паркетные работы.doc
#
16.09.2019773.12 Кб10криминалистика 2.doc
#
07.03.201697.84 Кб44Криминология преступлений против собственности (курсовик).docx
#
21.03.2015125.95 Кб101кружок изо.doc
#
16.09.2019322.56 Кб3КСЕ (правильные ответы).doc