УЧЕБНИКИ 3 Экономика / Управленческие решения / Степанов А.Г. Разработка управленческого решения средствами пакета Excel. 2001
.pdfопределяется как целевая функция при решении задачи в предположении, что противник выбрал стратегию N2 (z2=18,40), а менеджер стратегию M2 (стратегия противника также угадана). Результат решения средствами пакета Excel дает набор переменных {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана страте-
в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а противник использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15; 6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде прини-
маемого решения X ={2,68; 0,00; 0,00; 0,00}, а противник использует стратегию
N1. Тогда вектор значимости имеет зна- |
Стратегии |
N |
N |
|
чения {9,20; 7,15; 6,01; 7,61} и целевая |
|
1 |
2 |
|
M1 |
33,97 |
44,37 |
||
функция имеет величину 24,65. Резуль- |
||||
таты вычислений сведены в табл. 3.15. |
M2 |
24,65 |
49,29 |
|
Начнем обработку платежной матрицы. |
|
|
|
Минимальный выигрыш менеджера по стратегии M1 равен 33,97, а по стратегии M2– 24,65. Тогда нижняя цена игры α =33,97. Максимальный проигрыш противника по стратегии N1 равен 33,97, а по стратегии N2 – 49,29. Тогда верхняя цена игры β тоже равна 33,97. Это означает, что α = β = ν и игра имеет решение в чистых стратегиях, т.е. для минимизации своих потерь менеджеру выгодно идти по стратегии M1, а противнику по стратегии N1.
Игры с природой
Отличительной особенностью игр с природой является то обстоятельство, что природа рассматривается как некоторая незаинтересованная инстанция, поведение которой неизвестно, но, во всяком случае, не содержит элемента враждебности и сознательного противодействия достижению целей менеджера. Как и в случае игр с противником, менеджеру должна быть известна платежная матрица, соответствующая выигрышу менеджера при различных своих стратегиях и состояниях (стратегиях) природы. Если в случае игры с противником предполагать определенные вероятности появления его стратегий не представлялось возможным, то в рассматриваемой ситуации менеджеру полезно дополнительно располагать информацией о вероятностях появления воз-
91
можных состояний природы, заданной например в виде смешанных стратегий
SN |
|
N |
|
N |
...N |
|
|
= |
|
1 |
2 |
|
n |
, |
|
|
|
q1 |
q2...qn |
|
|
∑n q j = 1. j=1
Задача менеджера заключается в выборе в конкретных условиях наиболее выгодной собственной стратегии. Отбрасывать “невыгодные” с точки зрения природы стратегии нельзя. Исходя из этого в теории статистических решений [5] вводится понятие риска
|
|
|
|
rij = β j − Eij , |
|
|
Таблица 3.16 |
где r – риск менеджера при использова- |
|||
Пример матрицы рисков |
ij |
||||
нии стратегии Mi в ответ на состояние |
|||||
|
|
|
|
||
r |
N |
N |
природы Nj, а βj – максимально возмож- |
||
ij |
|
|
|
ный выигрыш менеджера при состоянии |
|
M |
r |
r |
|
||
природы N . Пример матрицы рисков |
|||||
|
|||||
M |
r |
r |
j |
||
представлен в табл. 3.16. |
Если менеджеру известны вероятности возможных состояний природы qj, то было бы логичным в качестве своей стратегии принять стратегию Mi, максимизирующую свой средний выигрыш
|
|
|
n |
|
|
|
|
|
∑ |
|
|
|
|
|
|||
E = max |
Eij q j . |
(3.19) |
|||
|
|
1≤ i≤ m |
j=1 |
|
|
|
|
|
|
|
|
Отметим, что указанная стратегия менеджера одновременно минимизирует его средний риск.
При выборе оптимальной стратегии одну из существенных трудностей представляет определение конкретного набора вероятностей qj. Если нет никаких гипотез о вероятности появления определенного состояния природы, то используется принцип недостаточного основания Лапласа, когда вероятности назначаются равными друг другу
q1 = q2 = ... = qn = 1 . n
92
Если у менеджера существуют некоторые предположения о вероятностях появления определенных событий, то он может их расставить в порядке убывания их правдоподобности (ранжировать) и поставить им в соответствие некоторый ряд чисел, определенный в том числе и экспертным путем. Отметим, что в любом случае справедливо утверждение
∑n q j = 1. j=1
Наиболее сложным случаем для выработки управленческого решения является ситуация, когда у менеджера полностью отсутствует любая (в том числе и экспертная) информация о вероятностях возможных состояний природы. В этом случае решение приходится принимать исходя из анализа платежной матрицы или матрицы рисков. Согласно максиминному критерию Вальда выбирается стратегия, гарантирующая выигрыш не меньший чем
|
|
|
|
|
|
E = max |
|
||||
|
|
ij |
|||
|
min {E } . |
||||
|
|
1≤ i≤ m |
1≤ j≤ n |
|
Данный критерий ориентирует менеджера на наихудшие условия и рекомендует выбирать стратегию, для которой в самом тяжелом случае выигрыш максимален. Обычно критерий Вальда называют критерием крайнего пессимизма.
Критерий минимаксного риска Сэвиджа рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации. Сущность критерия Сэвиджа – любыми путями минимизировать риск. Критерий Сэвиджа также относится к критериям крайнего пессимизма, однако в этом случае, в отличие от критерия Вальда, худшим считается не минимальный выигрыш, а максимальная его потеря (максимальный риск).
|
|
|
|
|
|
r = min |
|
|
ij |
||
|
max{r } . |
||||
|
1≤ i≤ |
m |
1≤ j≤ n |
|
Критерий пессимизма-оптимизма Гурвица рекомендует при выборе решения выбирать нечто среднее между крайним пессимизмом и оптимизмом
93
|
|
= max{α |
min {Eij }+ (1− α ) max{Eij }}. |
||
E |
|||||
|
|
1≤ i≤ m |
1≤ j≤ |
n |
1≤ j≤ n |
|
|
|
|
|
Здесь α некий коэффициент (мера пессимизма), выбираемый экспертным путем из интервала между 0 и 1. Очевидно, что при α =1 критерий Гурвица превращается в критерий Вальда.
В качестве примера еще раз обратимся к распределительной задаче, описанной в 3.4.1. Пусть количество имеющихся ресурсов описывается набором значений b ={30,52; 51,11; 31,23; 26,28; 39,40; 57,47; 53,61; 44,30; 84,54}; матрица коэффициентов aij имеет вид табл. 3.2, в которой столбцы имеют смысл вида соответствующей продукции, а строки – вида ресурса. Будем считать, что входящий в состав коэффициентов значимости параметр c1 носит случайный характер и принимает два возможных значения z1= 9,20 и z2= 18,40. Тогда коэффициенты значимости каждого вида продукции cj могут иметь два возможных набора значений: {9,20; 7,15; 6,01; 7,61} и {18,40; 7,15; 6,01; 7,61}. Предположим, что имеет место игра с природой, т.е. z1, z2 определяют возможные стратегии природы N1 и N2 а не противника, как это было ранее. Будем считать, что в распоряжении менеджера также имеются две возможные стратегии M1 и M2. Построим платежную матрицу аналогично предыдущему. Значение E11 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N1 (z1= 9,20), а менеджера стратегия M1 (стратегия природы угадана). Это решение ранее уже было получено и представляет собой набор переменных X = {1,13; 0,00; 0,00; 3,10}, обеспечивающий максимальное значение целевой функции округленно равное 33,97 при общем суммарном расходе ресурсов равном 185,59. Значение E22 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N2 (z2= 18,40), а менеджер выбрал стратегию M2 (стратегия природы также угадана). Результат решения средствами пакета Excel дает набор переменных X = {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана стратегия M1 в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а природа использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15; 6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде принимаемого решения X ={2,68; 0,00; 0,00; 0,00}, а
94
природа использует стратегию N1. Век- |
|
|
Таблица 3.17 |
||
тор значимости имеет значения {9,20; |
|
Матрица рисков |
|
||
7,15; 6,01; 7,61} и целевая функция имеет |
|
|
|
|
|
rij |
|
N1 |
|
N2 |
|
величину 24,65. Результаты вычислений |
|
|
|||
|
|
|
|||
полностью аналогичны случаю игры с |
M1 |
|
0 |
|
4,92 |
противником и совпадают с данными |
M2 |
|
9,32 |
|
0 |
табл. 3.15. Построим матрицу рисков |
|
|
|||
|
|
|
|
|
(табл. 3.17).
Проанализируем платежную матрицу. Будем считать, что вероятности появления стратегий природы известны и равны соответственно q1= 0,4 и q2= 0,6. Используем выражение для максимального среднего выигрыша (3.19). Выигрыш менеджера по первой строке платежной матрицы табл. 3.12 составляет 40,21, а по второй – 39,43. Очевидно, что стратегией, максимизирующей средний выигрыш является стратегия M1. Риск менеджера по первой строке матрицы рисков (табл. 3.14) составляет 2,95, а по второй – 3,73. Стратегией, минимизирующей риск также является стратегия M1.Таким образом решением задачи является набор переменных X = {1,13; 0,00; 0,00; 3,10}.
Будем теперь считать, что менеджеру неизвестны вероятности появления стратегий природы. Воспользуемся критерием Вальда. Минимальный выигрыш по первой строке платежной матрицы табл. 3.12 составляет 33,97, а по второй – 24,65. Очевидно, что как и в предыдущем случае, оптимальной стратегией менеджера является стратегия M1 с соответствующим решением.
Расчеты по критерию Сэвиджа дают максимальное значение риска в первой строке равное 4,92, а во второй – 9,32. Следовательно, и в этом случае оптимальной стратегией менеджера является страте-
гия M1.
Решим задачу с использованием критерия Гурвица. Минимальное значение первой строки платежной матрицы составляет 33,97, максимальное 44,37. Соответствующие значения для второй строки 24,65 и 49,29. Пусть α = 0,5. Тогда расчеты по критерию Гурвица для первой строки дают 39,17, а для второй – 36,97. Следовательно, оптимальной является стратегия M1 с соответствующим решением. Изменим меру пессимизма менеджера и сделаем ее равной 0,3 (α = 0,3). Расчеты по строкам платежной матрицы дают соответственно 41,25 и 41,898. В этом случае оптимальной является стратегия M2 с решением X = {2,68; 0,00; 0,00; 0,00}.
95
Игры с природой с экспериментами
Рассмотренные выше игры с природой предусматривали необходимость принятия решения менеджером в условиях неопределенности на основе имеющихся у него данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.
Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а менеджер может только делать вывод о целесообразности его проведения на основании имеющейся у него априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки N конечен и известен заранее.
Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания менеджер может принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую-либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте) или быть неограниченным (неограниченный последовательный эксперимент).
Будем считать, что в распоряжении менеджера имеется набор m стратегий Mi, которые он может использовать в ответ на одну из n возможных стратегий природы Nj, появляющуюся с вероятностью qj при условии
96
∑n q j = 1. j=1
Известна также платежная матрица Eij. Для снижения неопределенности относительно действительного состояния природы менеджер может провести эксперимент, стоимость которого известна и равна C. Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.
Средний выигрыш менеджера Ei при использовании стратегии Mi может быть определен как
Ei = ∑n Eij q j .
j=1
Вкачестве оптимальной стратегии может быть выбрана стратегия M , максимизирующая средний выигрыш менеджера
|
|
|
|
|
n |
|
|
|
|
|
|
∑ |
|
|
|
|
||||
E = E(M ) = max |
Eij q j . |
|||||
|
|
|
|
1≤ i≤ m |
j=1 |
|
|
|
|
|
|
|
|
Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы Nj. Очевидно, что в этом случае менеджер должен выбирать стратегию, обеспечивающую максимальный выигрыш
β j |
= max {Eij }. |
|
i=1,2,...,m |
Оценим теперь средний возможный выигрыш после проведения эксперимента
|
|
|
|
βср = ∑n |
q jβ j − C, |
||
|
|
|
|
j=1 |
|
|
|
где C – стоимость проведения эксперимента. Отсюда появляется усло- |
|||||||
|
целесообразности проведения эксперимента |
|
< βср или |
||||
вие |
E |
||||||
|
n |
|
|
n |
|
|
|
max{ |
E q |
} < |
β q − C. |
|
|
|
|
1≤ i≤ m |
∑ |
ij j |
∑ |
i i |
|
|
|
|
j=1 |
|
|
j=1 |
|
|
|
97
Преобразовывая неравенство, имеем
n |
|
|
|
|
n |
|
|
n |
|
|
|
C < |
β q − max{ |
E q } = min { |
q (β |
− E )}. |
(3.20) |
||||||
∑ |
i i |
1≤ |
i≤ |
m |
ij j |
1≤ i≤ |
m |
|
j |
j ij |
|
|
|
∑ |
∑ |
|
|
|
|||||
j=1 |
|
|
|
|
j=1 |
|
|
j=1 |
|
|
|
Выражение в круглых скобках в (3.20) есть ничто иное как риск
rij = β j − Eij .
Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной выбрать стратегию, максимизирующую средний выигрыш или минимизирующую средний риск. Пример, решенный в подразд. 3.7, показывает, что стоимость эксперимента по определению состояния природы в рассмотренной там задаче не должна превышать 2,95.
Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из k несовместимых событий S1, S2,…, Sk, связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода Si эксперимента при условии стратегии природы Ni символом wij. Поскольку S1, S2,…, Sk образуют полную систему событий, справедливо
∑k |
wij = 1;1 ≤ j≤ n. |
i=1 |
|
Будем считать, что все значения wij менеджеру известны, а также известна стоимость проведения эксперимента C. Нас по-прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать менеджеру при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат Sl. Определим апостериорные вероятности стратегий природы по теореме Байеса [14]
v jl = P(N j |
Sl |
) = |
q j wij |
. |
(3.21) |
|
∑n |
|
|||||
|
|
|
q j wlj |
|
|
j=1
98
Далее для каждой стратегии менеджера рассчитаем величину условного среднего выигрыша при условии результата эксперимента Sl
Eilср = ∑т Eijv jl . |
(3.22) |
j=1 |
|
Очевидно, что оптимальной будет стратегия менеджера Mi, обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента Sl
|
|
= max{E |
ср |
}. |
|||
E |
|||||||
|
l |
1≤ |
i≤ m |
il |
|
||
|
|
|
|
|
|
Вероятность появления условного выигрыша El совпадает с вероятностью появления события Sl. Обозначим ее символом hl. Тогда
|
hl = ∑n |
q j wlj . |
(3.23) |
|||
|
|
j=1 |
|
|
|
|
Величина выигрыша с использованием эксперимента |
|
|||||
|
|
эксп = ∑k |
|
l hl . |
|
|
E |
E |
(3.24) |
l=1
Сдругой стороны, выигрыш менеджера без проведения эксперимента определяется выражением
|
|
|
n |
|
|
|
|
∑ |
|
|
|
|||
E = max |
Eij q j . |
|||
|
|
1≤ i≤ m |
j=1 |
|
|
|
|
|
|
Отсюда вытекает условие целесообразности проведения эксперимента
C < Eэксп − Е.
Если проведение эксперимента признано целесообразным, то менеджер должен разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию Mi необходимо выбрать, если эксперимент дал результат Sl.
Вернемся к рассмотренному выше примеру. Пусть точно определить состояние природы не удается, но существует три возможных результата проведения эксперимента S1, S2, S3 (k=3). Зададим в табл. 3.18 матрицу условных вероятностей появления Si варианта эксперимента W={wij} при Nj состоянии природы.
99
Таблица 3.18 |
Таблица 3.19 |
Матрица условных |
Матрица апостериорных |
вероятностей соответствия |
вероятностей соответствия |
эксперимента природе |
эксперимента природе |
Экспери- |
Стратегия |
|
|
|
|
ìåíò |
N1 |
N2 |
|
||
S1 |
0,3 |
0,7 |
S2 |
0,5 |
0,2 |
S3 |
0,2 |
0,1 |
Экспери- |
Стратегия |
|
|
|
|
ìåíò |
N1 |
N2 |
|
||
S1 |
0,222222 |
0,777778 |
S2 |
0,625 |
0,375 |
S3 |
0,571429 |
0,428571 |
В табл. 3.19 занесем рассчитанные по теореме Байеса (3.21) апостериорные вероятности, сохранив старые значения априорных вероятностей природы q1= 0,4 и q2= 0,6.
Определим теперь величину условного среднего выигрыша (3.22), если эксперимент дал результат S1. При стратегиях менеджера M1 и M2 расчеты дают округленно {42,06; 43,81}. Если результат эксперимента S2, то соответствующие значения равны {37,87; 33,89}. Наконец, в случае S3 имеем {38,43; 35,21}. Отсюда получается решающее правило задачи в виде стратегии M2 с выигрышем 43,81 при первом исходе эксперимента, и стратегии M1 с выигрышами 37,87 и 38,43 при втором и третьем исходах. Отметим, что полученные значения выигрышей являются случайными, поскольку случайными являются результаты эксперимента. Определим теперь вероятности появления различных исходов эксперимента h1, h2, h3 (3.23). Результаты вычислений дают {0,54; 0,32; 0,14}. Тогда величина выигрыша с использованием эксперимента (3.24) Eэксп равна 41,08. Величина выигрыша без эксперимента была определена ранее при рассмотрении примера в подразд. 3.7 и составляет 40,21. Отсюда следует максимально допустимая стоимость эксперимента 0,87, при превышении которой проведение эксперимента делается бессмысленным.
Методы решения динамических задач в условиях неопределенности развиваются в рамках теории дифференциальных игр, представляющей собой самостоятельную математическую дисциплину. В целом аппарат теории игр может быть весьма полезен для решения задач стратегического планирования, анализа конкурентной борьбы и т.п.
100