Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УЧЕБНИКИ 3 Экономика / Управленческие решения / Степанов А.Г. Разработка управленческого решения средствами пакета Excel. 2001

.pdf
Скачиваний:
120
Добавлен:
20.04.2015
Размер:
1.43 Mб
Скачать
Платежная матрица
Таблица 3.15
гия N1 и N2

определяется как целевая функция при решении задачи в предположении, что противник выбрал стратегию N2 (z2=18,40), а менеджер стратегию M2 (стратегия противника также угадана). Результат решения средствами пакета Excel дает набор переменных {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана страте-

в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а противник использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15; 6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде прини-

маемого решения X ={2,68; 0,00; 0,00; 0,00}, а противник использует стратегию

N1. Тогда вектор значимости имеет зна-

Стратегии

N

N

чения {9,20; 7,15; 6,01; 7,61} и целевая

 

1

2

M1

33,97

44,37

функция имеет величину 24,65. Резуль-

таты вычислений сведены в табл. 3.15.

M2

24,65

49,29

Начнем обработку платежной матрицы.

 

 

 

Минимальный выигрыш менеджера по стратегии M1 равен 33,97, а по стратегии M2– 24,65. Тогда нижняя цена игры α =33,97. Максимальный проигрыш противника по стратегии N1 равен 33,97, а по стратегии N2 – 49,29. Тогда верхняя цена игры β тоже равна 33,97. Это означает, что α = β = ν и игра имеет решение в чистых стратегиях, т.е. для минимизации своих потерь менеджеру выгодно идти по стратегии M1, а противнику по стратегии N1.

Игры с природой

Отличительной особенностью игр с природой является то обстоятельство, что природа рассматривается как некоторая незаинтересованная инстанция, поведение которой неизвестно, но, во всяком случае, не содержит элемента враждебности и сознательного противодействия достижению целей менеджера. Как и в случае игр с противником, менеджеру должна быть известна платежная матрица, соответствующая выигрышу менеджера при различных своих стратегиях и состояниях (стратегиях) природы. Если в случае игры с противником предполагать определенные вероятности появления его стратегий не представлялось возможным, то в рассматриваемой ситуации менеджеру полезно дополнительно располагать информацией о вероятностях появления воз-

91

можных состояний природы, заданной например в виде смешанных стратегий

SN

 

N

 

N

...N

 

 

=

 

1

2

 

n

,

 

 

q1

q2...qn

 

 

n q j = 1. j=1

Задача менеджера заключается в выборе в конкретных условиях наиболее выгодной собственной стратегии. Отбрасывать “невыгодные” с точки зрения природы стратегии нельзя. Исходя из этого в теории статистических решений [5] вводится понятие риска

 

 

 

 

rij = β j Eij ,

 

Таблица 3.16

где r – риск менеджера при использова-

Пример матрицы рисков

ij

нии стратегии Mi в ответ на состояние

 

 

 

 

r

N

N

природы Nj, а βj – максимально возмож-

ij

 

 

 

ный выигрыш менеджера при состоянии

M

r

r

 

природы N . Пример матрицы рисков

 

M

r

r

j

представлен в табл. 3.16.

Если менеджеру известны вероятности возможных состояний природы qj, то было бы логичным в качестве своей стратегии принять стратегию Mi, максимизирующую свой средний выигрыш

 

 

 

n

 

 

 

 

 

 

 

 

 

 

E = max

Eij q j .

(3.19)

 

 

1≤ im

j=1

 

 

 

 

 

 

 

 

Отметим, что указанная стратегия менеджера одновременно минимизирует его средний риск.

При выборе оптимальной стратегии одну из существенных трудностей представляет определение конкретного набора вероятностей qj. Если нет никаких гипотез о вероятности появления определенного состояния природы, то используется принцип недостаточного основания Лапласа, когда вероятности назначаются равными друг другу

q1 = q2 = ... = qn = 1 . n

92

Если у менеджера существуют некоторые предположения о вероятностях появления определенных событий, то он может их расставить в порядке убывания их правдоподобности (ранжировать) и поставить им в соответствие некоторый ряд чисел, определенный в том числе и экспертным путем. Отметим, что в любом случае справедливо утверждение

n q j = 1. j=1

Наиболее сложным случаем для выработки управленческого решения является ситуация, когда у менеджера полностью отсутствует любая (в том числе и экспертная) информация о вероятностях возможных состояний природы. В этом случае решение приходится принимать исходя из анализа платежной матрицы или матрицы рисков. Согласно максиминному критерию Вальда выбирается стратегия, гарантирующая выигрыш не меньший чем

 

 

 

 

 

 

E = max

 

 

 

ij

 

min {E } .

 

 

1≤ im

1≤ jn

 

Данный критерий ориентирует менеджера на наихудшие условия и рекомендует выбирать стратегию, для которой в самом тяжелом случае выигрыш максимален. Обычно критерий Вальда называют критерием крайнего пессимизма.

Критерий минимаксного риска Сэвиджа рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации. Сущность критерия Сэвиджа – любыми путями минимизировать риск. Критерий Сэвиджа также относится к критериям крайнего пессимизма, однако в этом случае, в отличие от критерия Вальда, худшим считается не минимальный выигрыш, а максимальная его потеря (максимальный риск).

 

 

 

 

 

 

r = min

 

 

ij

 

max{r } .

 

1≤ i

m

1≤ jn

 

Критерий пессимизма-оптимизма Гурвица рекомендует при выборе решения выбирать нечто среднее между крайним пессимизмом и оптимизмом

93

 

 

= max{α

min {Eij }+ (1− α ) max{Eij }}.

E

 

 

1≤ im

1≤ j

n

1≤ jn

 

 

 

 

 

Здесь α некий коэффициент (мера пессимизма), выбираемый экспертным путем из интервала между 0 и 1. Очевидно, что при α =1 критерий Гурвица превращается в критерий Вальда.

В качестве примера еще раз обратимся к распределительной задаче, описанной в 3.4.1. Пусть количество имеющихся ресурсов описывается набором значений b ={30,52; 51,11; 31,23; 26,28; 39,40; 57,47; 53,61; 44,30; 84,54}; матрица коэффициентов aij имеет вид табл. 3.2, в которой столбцы имеют смысл вида соответствующей продукции, а строки – вида ресурса. Будем считать, что входящий в состав коэффициентов значимости параметр c1 носит случайный характер и принимает два возможных значения z1= 9,20 и z2= 18,40. Тогда коэффициенты значимости каждого вида продукции cj могут иметь два возможных набора значений: {9,20; 7,15; 6,01; 7,61} и {18,40; 7,15; 6,01; 7,61}. Предположим, что имеет место игра с природой, т.е. z1, z2 определяют возможные стратегии природы N1 и N2 а не противника, как это было ранее. Будем считать, что в распоряжении менеджера также имеются две возможные стратегии M1 и M2. Построим платежную матрицу аналогично предыдущему. Значение E11 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N1 (z1= 9,20), а менеджера стратегия M1 (стратегия природы угадана). Это решение ранее уже было получено и представляет собой набор переменных X = {1,13; 0,00; 0,00; 3,10}, обеспечивающий максимальное значение целевой функции округленно равное 33,97 при общем суммарном расходе ресурсов равном 185,59. Значение E22 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N2 (z2= 18,40), а менеджер выбрал стратегию M2 (стратегия природы также угадана). Результат решения средствами пакета Excel дает набор переменных X = {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана стратегия M1 в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а природа использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15; 6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде принимаемого решения X ={2,68; 0,00; 0,00; 0,00}, а

94

природа использует стратегию N1. Век-

 

 

Таблица 3.17

тор значимости имеет значения {9,20;

 

Матрица рисков

 

7,15; 6,01; 7,61} и целевая функция имеет

 

 

 

 

 

rij

 

N1

 

N2

величину 24,65. Результаты вычислений

 

 

 

 

 

полностью аналогичны случаю игры с

M1

 

0

 

4,92

противником и совпадают с данными

M2

 

9,32

 

0

табл. 3.15. Построим матрицу рисков

 

 

 

 

 

 

 

(табл. 3.17).

Проанализируем платежную матрицу. Будем считать, что вероятности появления стратегий природы известны и равны соответственно q1= 0,4 и q2= 0,6. Используем выражение для максимального среднего выигрыша (3.19). Выигрыш менеджера по первой строке платежной матрицы табл. 3.12 составляет 40,21, а по второй – 39,43. Очевидно, что стратегией, максимизирующей средний выигрыш является стратегия M1. Риск менеджера по первой строке матрицы рисков (табл. 3.14) составляет 2,95, а по второй – 3,73. Стратегией, минимизирующей риск также является стратегия M1.Таким образом решением задачи является набор переменных X = {1,13; 0,00; 0,00; 3,10}.

Будем теперь считать, что менеджеру неизвестны вероятности появления стратегий природы. Воспользуемся критерием Вальда. Минимальный выигрыш по первой строке платежной матрицы табл. 3.12 составляет 33,97, а по второй – 24,65. Очевидно, что как и в предыдущем случае, оптимальной стратегией менеджера является стратегия M1 с соответствующим решением.

Расчеты по критерию Сэвиджа дают максимальное значение риска в первой строке равное 4,92, а во второй – 9,32. Следовательно, и в этом случае оптимальной стратегией менеджера является страте-

гия M1.

Решим задачу с использованием критерия Гурвица. Минимальное значение первой строки платежной матрицы составляет 33,97, максимальное 44,37. Соответствующие значения для второй строки 24,65 и 49,29. Пусть α = 0,5. Тогда расчеты по критерию Гурвица для первой строки дают 39,17, а для второй – 36,97. Следовательно, оптимальной является стратегия M1 с соответствующим решением. Изменим меру пессимизма менеджера и сделаем ее равной 0,3 (α = 0,3). Расчеты по строкам платежной матрицы дают соответственно 41,25 и 41,898. В этом случае оптимальной является стратегия M2 с решением X = {2,68; 0,00; 0,00; 0,00}.

95

Игры с природой с экспериментами

Рассмотренные выше игры с природой предусматривали необходимость принятия решения менеджером в условиях неопределенности на основе имеющихся у него данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.

Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а менеджер может только делать вывод о целесообразности его проведения на основании имеющейся у него априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки N конечен и известен заранее.

Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания менеджер может принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую-либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте) или быть неограниченным (неограниченный последовательный эксперимент).

Будем считать, что в распоряжении менеджера имеется набор m стратегий Mi, которые он может использовать в ответ на одну из n возможных стратегий природы Nj, появляющуюся с вероятностью qj при условии

96

n q j = 1. j=1

Известна также платежная матрица Eij. Для снижения неопределенности относительно действительного состояния природы менеджер может провести эксперимент, стоимость которого известна и равна C. Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.

Средний выигрыш менеджера Ei при использовании стратегии Mi может быть определен как

Ei = n Eij q j .

j=1

Вкачестве оптимальной стратегии может быть выбрана стратегия M , максимизирующая средний выигрыш менеджера

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

E = E(M ) = max

Eij q j .

 

 

 

 

1≤ im

j=1

 

 

 

 

 

 

 

 

Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы Nj. Очевидно, что в этом случае менеджер должен выбирать стратегию, обеспечивающую максимальный выигрыш

β j

= max {Eij }.

 

i=1,2,...,m

Оценим теперь средний возможный выигрыш после проведения эксперимента

 

 

 

 

βср = n

q jβ j C,

 

 

 

 

j=1

 

 

 

где C – стоимость проведения эксперимента. Отсюда появляется усло-

 

целесообразности проведения эксперимента

 

< βср или

вие

E

 

n

 

 

n

 

 

 

max{

E q

} <

β q C.

 

 

 

1≤ im

ij j

i i

 

 

 

 

j=1

 

 

j=1

 

 

 

97

Преобразовывая неравенство, имеем

n

 

 

 

 

n

 

 

n

 

 

 

C <

β q max{

E q } = min {

q (β

E )}.

(3.20)

i i

1≤

i

m

ij j

1≤ i

m

 

j

j ij

 

 

 

 

 

j=1

 

 

 

 

j=1

 

 

j=1

 

 

 

Выражение в круглых скобках в (3.20) есть ничто иное как риск

rij = β j Eij .

Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной выбрать стратегию, максимизирующую средний выигрыш или минимизирующую средний риск. Пример, решенный в подразд. 3.7, показывает, что стоимость эксперимента по определению состояния природы в рассмотренной там задаче не должна превышать 2,95.

Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из k несовместимых событий S1, S2,…, Sk, связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода Si эксперимента при условии стратегии природы Ni символом wij. Поскольку S1, S2,…, Sk образуют полную систему событий, справедливо

k

wij = 1;1 jn.

i=1

 

Будем считать, что все значения wij менеджеру известны, а также известна стоимость проведения эксперимента C. Нас по-прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать менеджеру при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат Sl. Определим апостериорные вероятности стратегий природы по теореме Байеса [14]

v jl = P(N j

Sl

) =

q j wij

.

(3.21)

n

 

 

 

 

q j wlj

 

 

j=1

98

Далее для каждой стратегии менеджера рассчитаем величину условного среднего выигрыша при условии результата эксперимента Sl

Eilср = т Eijv jl .

(3.22)

j=1

 

Очевидно, что оптимальной будет стратегия менеджера Mi, обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента Sl

 

 

= max{E

ср

}.

E

 

l

1≤

im

il

 

 

 

 

 

 

 

Вероятность появления условного выигрыша El совпадает с вероятностью появления события Sl. Обозначим ее символом hl. Тогда

 

hl = n

q j wlj .

(3.23)

 

 

j=1

 

 

 

 

Величина выигрыша с использованием эксперимента

 

 

 

эксп = k

 

l hl .

 

E

E

(3.24)

l=1

Сдругой стороны, выигрыш менеджера без проведения эксперимента определяется выражением

 

 

 

n

 

 

 

 

 

 

 

E = max

Eij q j .

 

 

1≤ im

j=1

 

 

 

 

 

 

Отсюда вытекает условие целесообразности проведения эксперимента

C < Eэксп Е.

Если проведение эксперимента признано целесообразным, то менеджер должен разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию Mi необходимо выбрать, если эксперимент дал результат Sl.

Вернемся к рассмотренному выше примеру. Пусть точно определить состояние природы не удается, но существует три возможных результата проведения эксперимента S1, S2, S3 (k=3). Зададим в табл. 3.18 матрицу условных вероятностей появления Si варианта эксперимента W={wij} при Nj состоянии природы.

99

Таблица 3.18

Таблица 3.19

Матрица условных

Матрица апостериорных

вероятностей соответствия

вероятностей соответствия

эксперимента природе

эксперимента природе

Экспери-

Стратегия

 

 

ìåíò

N1

N2

 

S1

0,3

0,7

S2

0,5

0,2

S3

0,2

0,1

Экспери-

Стратегия

 

 

ìåíò

N1

N2

 

S1

0,222222

0,777778

S2

0,625

0,375

S3

0,571429

0,428571

В табл. 3.19 занесем рассчитанные по теореме Байеса (3.21) апостериорные вероятности, сохранив старые значения априорных вероятностей природы q1= 0,4 и q2= 0,6.

Определим теперь величину условного среднего выигрыша (3.22), если эксперимент дал результат S1. При стратегиях менеджера M1 и M2 расчеты дают округленно {42,06; 43,81}. Если результат эксперимента S2, то соответствующие значения равны {37,87; 33,89}. Наконец, в случае S3 имеем {38,43; 35,21}. Отсюда получается решающее правило задачи в виде стратегии M2 с выигрышем 43,81 при первом исходе эксперимента, и стратегии M1 с выигрышами 37,87 и 38,43 при втором и третьем исходах. Отметим, что полученные значения выигрышей являются случайными, поскольку случайными являются результаты эксперимента. Определим теперь вероятности появления различных исходов эксперимента h1, h2, h3 (3.23). Результаты вычислений дают {0,54; 0,32; 0,14}. Тогда величина выигрыша с использованием эксперимента (3.24) Eэксп равна 41,08. Величина выигрыша без эксперимента была определена ранее при рассмотрении примера в подразд. 3.7 и составляет 40,21. Отсюда следует максимально допустимая стоимость эксперимента 0,87, при превышении которой проведение эксперимента делается бессмысленным.

Методы решения динамических задач в условиях неопределенности развиваются в рамках теории дифференциальных игр, представляющей собой самостоятельную математическую дисциплину. В целом аппарат теории игр может быть весьма полезен для решения задач стратегического планирования, анализа конкурентной борьбы и т.п.

100