Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpory_po_matematike.doc
Скачиваний:
4
Добавлен:
21.04.2019
Размер:
843.78 Кб
Скачать

11. Принципы составления платежной матрицы. Примеры.

Пример 1.

Командир В охраняет город 5-ю ротами. К городу ведут 2 дороги, по которым может подойти противник, имеющий 4 роты под командованием А. В может приказать любой из 5 рот оборонять любую дорогу. А выигрывает, если на какой-нибудь дороге у него будет больше рот, чем у В. Как должен распорядиться ротами А, чтобы обеспечить себе максимальный шанс прорваться в город?

Решение:

Выигрыш игрока А обозначим через +1, проигрыш через -1. Из условия задачи получим таблицу, в которой в символе 0-4 первая цифра показывает число рот на 1 дороге, а 2-ая - на 2 дороге. То же для командира В.

0-5

1-4

2-3

3-2

4-1

5-0

0-4

-1

-1

-1

-1

1

1

1-3

1

-1

-1

-1

1

1

2-2

1

1

-1

-1

1

1

3-1

1

1

1

-1

-1

1

4-0

1

1

1

1

-1

-1

Пример 2.

Игрок А выбирает число из множества 1,2,3, а игрок В из 1,2,3,4. Если при этом получается четное число, то эту сумму выигрывает А. Если же получится нечетное число, то В.

Какое число должен выбрать игрок А, чтобы обеспечить себе макс. выигрыш. Или, если это невозможно, то это мин. выигрыш.

Составим матрицу.

1

2

3

3

αi

1

+2

-3

+4

-5

-5

2

-3

+4

-5

+6

-5

3

4

-5

+6

-7

-7

βi

4

4

6

6

Β=4

-5<= v <=4

13. Игрой называется математическая модель конфликтной ситуации. Стороны, участвующие в конфликте, называют участниками игры или игроками, а исход конфликта- выигрышем. Игра ведется по определенным правилам, которые представляют собой систему условий, регламентирующих возможные действия игроков.

Ходом называется выбор одного из предложенных правилами игры действий и его осуществление. Стратегией наз-ся совокупность правил, определяющих выбор его действий при каждом личном ходе в зависимости от сложившейся ситуации.

Для того чтобы найти решение игры следует для каждого игрока выбрать стратегию которая удовлетворяет условию оптимальности, т.е. один из игроков должен получить максимальный выигрыш, когда второй придерживается своей стратеги. Такие стратегии наз-ся оптимальными, любому игроку невыгодно отказаться от своей стратегии в игре.

Если игра не имеет Седловой точки, то применении чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешенной стратегией SA игрока А наз-ся применение чистых стратегий А1,А2,….Аi,…Am с вероятностями р1,р2,….рipm, причем рi=1. Смешенные стратегии игрока А записываются в виде матрицы:

SA=A1 A2 …..AiAm

p1 p2……pi…pm

или в виде строки SA=(p1,p2,,,,,pi…pm).

Аналогично смешенные стратегии игрока В обозначаются

SB= B1 B2 ….Bj,,,,,,,Bn

Q1 q2,,,,,qj ….qn

Или SB =(q1 q2 ….qj….qn) где qj=1

Чистая стратегия, которая входит в оптимальную смешенную стратегию с отличной от нуля вероятностью, называется активной.

Если один из игроков придерживается своей оптимальной смешенной стратегии, то выигрыш остается неизменным и равным цене игры v , если игры удовлетворяют неравенстве alfa vbetta.

Рассмотрим игру, заданную платежной матрицей:

Р= а11 а12…а1n

а21 а22…а2n

……………..

аm1 am2….amn

Если такая игра имеет седловую точку, то оптимальное решение игры- это пара чистых стратегий, соответствующей это точке.

Предположим что игра не имеет Седловой точки. Найдем ее решение в смешенных стратегиях SA= (p1,p2…,pi…pm) и SB=(q1,q2,…qj…qn)

Применение игроком А оптимальной стратегии SA должно обеспечивать ему при любых действиях игрока В выигрыш не менее цены игры v. Поэтому выполняются след. соотношения:

piaijv,i=1,2….n причем pi=1

Аналогично для игрока В оптимальная стратегия SB должна обеспечить при любых стратегиях игрока А проигрыш, не превышающий величину v ,т.е.справедливо соотношение:

qjaijv, i=1,2,…m,где qj=1

j

Для решения этих задач используют методы линейного программирования.

14. В некоторых случаях успех экономической деятельности зависит не от сознательно противодействующего конкурента, а от объективной действительности, которую принято называть «природой».

Пусть игрок А располагает m стратегиями, которые обозначим А1,А2,…,Аm, а относительно «природы» известно, что она может принимать n различных состояний, обозначим их Р1,Р2,…,Рn.

Известен также выигрыш аij игрока А при каждой паре стратегий игрока и «природы», т.е. известна платежная матрица:

Р= а11 а12……а1n

а21а22…….а2n

…………..

аm1 аm2……аmn

Игрок А в играх с №природой» старается действовать осмотрительно, используя стратегию, позволяющую получить наибольший выигрыш (наименьший проигрыш). «Природа» (игрок Р) действует случайно, возможные стратегии определяются как ее состояние (погода, спрос на определенную продукцию, сочетание производственных факторов).

Различают игры с «природой» в условиях определенности и игры с «природой» в условиях неопределенности. В первом случае задано распределение вероятностей состояний природы, во втором- оно неизвестно. В этом случае приходится принимать решение в условиях риска.

Риском игрока А при использовании стратегии Аi при состоянии «природы» Рj называется разность между выигрышем , который он получил бы, если бы знал Рj и выигрышем, который он получит в обычных условиях, применяя стратегию Аi:

rij= Bettaj- alfaij,где Bettaj= maxalfai

i

Рассмотрим критерии, используемые при решении игр с природой.

Критерий Бейеса- Лапласа.

При известном распределении вероятностей различных состояний природы Р= (р1,р2,…рn) где р1+р2+…рn=1, критерием принятия решений яв-ся максимум математического ожидания выигрыша, т.е.

VB-L= max aijpj где i=1,2,…m

i j

Критерий Лапласа.

Если ни одно из состояний «природы» нельзя предпочесть другим, выдвигают гипотезу о том, что все они равновероятны: р1=р2=рn=1/n

Тогда VL=maxaij1/n

i j

максиминный критерий Вальда.

Он основан на выборе стратегии игрока А, позволяющей гарантировать ему получение нижней цены игры:

Vw=max min aij

i j

Критерий минимального риска Сэвиджа.

Рекомендует выбирать стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации, т.н.

Vs=min max ril

i j

Критерий Вальда и Сэвиджа основаны на пессимистической оценке обстановки. В отличии от них следующий критерий использует как пессимистический, так и оптимистический подход к ситуации.

Критерий Гурвитца.

По этому критерию выбирается максимум линейной комбинации максимальных или минимальных выигрышей.

VH= max min aij+ (1-)max aij

i j j

Если =1, критерий Гурвитца превращается в пессимистический критерий Вальда. При =0 в критерии крайнего оптимизма, рассчитанный на наилучшее стечение обстоятельств. Обычно принимают в пределах от 0,5 до 0,7

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]