Степанов А.Г. Разработка управленческого решения средствами пакета Excel. 2001

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ульяновское Высшее Авиационное Училище Гражданской Авиации

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

E = E(M ) = max

.pdf

Скачиваний:

120

Добавлен:

20.04.2015

Размер:

1.43 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1810 11 12 13 14 15 16 17 18 > Следующая >>>

Платежная матрица

Таблица 3.15

гия N1 и N2

определяется как целевая функция при решении задачи в предположении, что противник выбрал стратегию N2 (z2=18,40), а менеджер стратегию M2 (стратегия противника также угадана). Результат решения средствами пакета Excel дает набор переменных {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана страте-

в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а противник использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15; 6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде прини-

маемого решения X ={2,68; 0,00; 0,00; 0,00}, а противник использует стратегию

N1. Тогда вектор значимости имеет зна-	Стратегии	N	N
чения {9,20; 7,15; 6,01; 7,61} и целевая		1	2
чения {9,20; 7,15; 6,01; 7,61} и целевая	M1	33,97	44,37
функция имеет величину 24,65. Резуль-	M1	33,97	44,37
таты вычислений сведены в табл. 3.15.	M2	24,65	49,29
Начнем обработку платежной матрицы.

Минимальный выигрыш менеджера по стратегии M1 равен 33,97, а по стратегии M2– 24,65. Тогда нижняя цена игры α =33,97. Максимальный проигрыш противника по стратегии N1 равен 33,97, а по стратегии N2 – 49,29. Тогда верхняя цена игры β тоже равна 33,97. Это означает, что α = β = ν и игра имеет решение в чистых стратегиях, т.е. для минимизации своих потерь менеджеру выгодно идти по стратегии M1, а противнику по стратегии N1.

Игры с природой

Отличительной особенностью игр с природой является то обстоятельство, что природа рассматривается как некоторая незаинтересованная инстанция, поведение которой неизвестно, но, во всяком случае, не содержит элемента враждебности и сознательного противодействия достижению целей менеджера. Как и в случае игр с противником, менеджеру должна быть известна платежная матрица, соответствующая выигрышу менеджера при различных своих стратегиях и состояниях (стратегиях) природы. Если в случае игры с противником предполагать определенные вероятности появления его стратегий не представлялось возможным, то в рассматриваемой ситуации менеджеру полезно дополнительно располагать информацией о вероятностях появления воз-

можных состояний природы, заданной например в виде смешанных стратегий

SN		N		N	...N
SN	=		1	2		n	,
		q1		q2...qn

∑n q j = 1. j=1

Задача менеджера заключается в выборе в конкретных условиях наиболее выгодной собственной стратегии. Отбрасывать “невыгодные” с точки зрения природы стратегии нельзя. Исходя из этого в теории статистических решений [5] вводится понятие риска

			rij = β j − Eij ,
	Таблица 3.16		где r – риск менеджера при использова-
Пример матрицы рисков			ij
Пример матрицы рисков			нии стратегии Mi в ответ на состояние
			нии стратегии Mi в ответ на состояние
r	N	N	природы Nj, а βj – максимально возмож-
ij			ный выигрыш менеджера при состоянии
M	r	r	ный выигрыш менеджера при состоянии
			природы N . Пример матрицы рисков

M	r	r	j
M	r	r	представлен в табл. 3.16.

Если менеджеру известны вероятности возможных состояний природы qj, то было бы логичным в качестве своей стратегии принять стратегию Mi, максимизирующую свой средний выигрыш

		n
		∑

E = max			Eij q j .	(3.19)
	1≤ i≤ m	j=1

Отметим, что указанная стратегия менеджера одновременно минимизирует его средний риск.

При выборе оптимальной стратегии одну из существенных трудностей представляет определение конкретного набора вероятностей qj. Если нет никаких гипотез о вероятности появления определенного состояния природы, то используется принцип недостаточного основания Лапласа, когда вероятности назначаются равными друг другу

q1 = q2 = ... = qn = 1 . n

Если у менеджера существуют некоторые предположения о вероятностях появления определенных событий, то он может их расставить в порядке убывания их правдоподобности (ранжировать) и поставить им в соответствие некоторый ряд чисел, определенный в том числе и экспертным путем. Отметим, что в любом случае справедливо утверждение

∑n q j = 1. j=1

Наиболее сложным случаем для выработки управленческого решения является ситуация, когда у менеджера полностью отсутствует любая (в том числе и экспертная) информация о вероятностях возможных состояний природы. В этом случае решение приходится принимать исходя из анализа платежной матрицы или матрицы рисков. Согласно максиминному критерию Вальда выбирается стратегия, гарантирующая выигрыш не меньший чем


E = max
			ij
		min {E } .
	1≤ i≤ m	1≤ j≤ n

Данный критерий ориентирует менеджера на наихудшие условия и рекомендует выбирать стратегию, для которой в самом тяжелом случае выигрыш максимален. Обычно критерий Вальда называют критерием крайнего пессимизма.

Критерий минимаксного риска Сэвиджа рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации. Сущность критерия Сэвиджа – любыми путями минимизировать риск. Критерий Сэвиджа также относится к критериям крайнего пессимизма, однако в этом случае, в отличие от критерия Вальда, худшим считается не минимальный выигрыш, а максимальная его потеря (максимальный риск).


r = min				ij
r = min			max{r } .
	1≤ i≤	m	1≤ j≤ n

Критерий пессимизма-оптимизма Гурвица рекомендует при выборе решения выбирать нечто среднее между крайним пессимизмом и оптимизмом

	= max{α	min {Eij }+ (1− α ) max{Eij }}.
E	= max{α	min {Eij }+ (1− α ) max{Eij }}.
	1≤ i≤ m	1≤ j≤	n	1≤ j≤ n
				1≤ j≤ n

Здесь α некий коэффициент (мера пессимизма), выбираемый экспертным путем из интервала между 0 и 1. Очевидно, что при α =1 критерий Гурвица превращается в критерий Вальда.

В качестве примера еще раз обратимся к распределительной задаче, описанной в 3.4.1. Пусть количество имеющихся ресурсов описывается набором значений b ={30,52; 51,11; 31,23; 26,28; 39,40; 57,47; 53,61; 44,30; 84,54}; матрица коэффициентов aij имеет вид табл. 3.2, в которой столбцы имеют смысл вида соответствующей продукции, а строки – вида ресурса. Будем считать, что входящий в состав коэффициентов значимости параметр c1 носит случайный характер и принимает два возможных значения z1= 9,20 и z2= 18,40. Тогда коэффициенты значимости каждого вида продукции cj могут иметь два возможных набора значений: {9,20; 7,15; 6,01; 7,61} и {18,40; 7,15; 6,01; 7,61}. Предположим, что имеет место игра с природой, т.е. z1, z2 определяют возможные стратегии природы N1 и N2 а не противника, как это было ранее. Будем считать, что в распоряжении менеджера также имеются две возможные стратегии M1 и M2. Построим платежную матрицу аналогично предыдущему. Значение E11 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N1 (z1= 9,20), а менеджера стратегия M1 (стратегия природы угадана). Это решение ранее уже было получено и представляет собой набор переменных X = {1,13; 0,00; 0,00; 3,10}, обеспечивающий максимальное значение целевой функции округленно равное 33,97 при общем суммарном расходе ресурсов равном 185,59. Значение E22 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N2 (z2= 18,40), а менеджер выбрал стратегию M2 (стратегия природы также угадана). Результат решения средствами пакета Excel дает набор переменных X = {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана стратегия M1 в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а природа использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15; 6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде принимаемого решения X ={2,68; 0,00; 0,00; 0,00}, а

природа использует стратегию N1. Век-			Таблица 3.17
тор значимости имеет значения {9,20;		Матрица рисков
7,15; 6,01; 7,61} и целевая функция имеет
7,15; 6,01; 7,61} и целевая функция имеет	rij		N1	N2
величину 24,65. Результаты вычислений

полностью аналогичны случаю игры с	M1		0	4,92
противником и совпадают с данными	M2		9,32	0
табл. 3.15. Построим матрицу рисков	M2		9,32	0
табл. 3.15. Построим матрицу рисков

(табл. 3.17).

Проанализируем платежную матрицу. Будем считать, что вероятности появления стратегий природы известны и равны соответственно q1= 0,4 и q2= 0,6. Используем выражение для максимального среднего выигрыша (3.19). Выигрыш менеджера по первой строке платежной матрицы табл. 3.12 составляет 40,21, а по второй – 39,43. Очевидно, что стратегией, максимизирующей средний выигрыш является стратегия M1. Риск менеджера по первой строке матрицы рисков (табл. 3.14) составляет 2,95, а по второй – 3,73. Стратегией, минимизирующей риск также является стратегия M1.Таким образом решением задачи является набор переменных X = {1,13; 0,00; 0,00; 3,10}.

Будем теперь считать, что менеджеру неизвестны вероятности появления стратегий природы. Воспользуемся критерием Вальда. Минимальный выигрыш по первой строке платежной матрицы табл. 3.12 составляет 33,97, а по второй – 24,65. Очевидно, что как и в предыдущем случае, оптимальной стратегией менеджера является стратегия M1 с соответствующим решением.

Расчеты по критерию Сэвиджа дают максимальное значение риска в первой строке равное 4,92, а во второй – 9,32. Следовательно, и в этом случае оптимальной стратегией менеджера является страте-

гия M1.

Решим задачу с использованием критерия Гурвица. Минимальное значение первой строки платежной матрицы составляет 33,97, максимальное 44,37. Соответствующие значения для второй строки 24,65 и 49,29. Пусть α = 0,5. Тогда расчеты по критерию Гурвица для первой строки дают 39,17, а для второй – 36,97. Следовательно, оптимальной является стратегия M1 с соответствующим решением. Изменим меру пессимизма менеджера и сделаем ее равной 0,3 (α = 0,3). Расчеты по строкам платежной матрицы дают соответственно 41,25 и 41,898. В этом случае оптимальной является стратегия M2 с решением X = {2,68; 0,00; 0,00; 0,00}.

Игры с природой с экспериментами

Рассмотренные выше игры с природой предусматривали необходимость принятия решения менеджером в условиях неопределенности на основе имеющихся у него данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.

Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а менеджер может только делать вывод о целесообразности его проведения на основании имеющейся у него априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки N конечен и известен заранее.

Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания менеджер может принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую-либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте) или быть неограниченным (неограниченный последовательный эксперимент).

Будем считать, что в распоряжении менеджера имеется набор m стратегий Mi, которые он может использовать в ответ на одну из n возможных стратегий природы Nj, появляющуюся с вероятностью qj при условии

∑n q j = 1. j=1

Известна также платежная матрица Eij. Для снижения неопределенности относительно действительного состояния природы менеджер может провести эксперимент, стоимость которого известна и равна C. Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.

Средний выигрыш менеджера Ei при использовании стратегии Mi может быть определен как

Ei = ∑n Eij q j .

j=1

Вкачестве оптимальной стратегии может быть выбрана стратегия M , максимизирующая средний выигрыш менеджера

Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы Nj. Очевидно, что в этом случае менеджер должен выбирать стратегию, обеспечивающую максимальный выигрыш

β j	= max {Eij }.
	i=1,2,...,m

Оценим теперь средний возможный выигрыш после проведения эксперимента

				βср = ∑n	q jβ j − C,
				j=1
где C – стоимость проведения эксперимента. Отсюда появляется усло-
	целесообразности проведения эксперимента						< βср или
вие	целесообразности проведения эксперимента					E	< βср или
	n			n
max{		E q	} <	β q − C.
1≤ i≤ m	∑	ij j	∑	i i
	j=1			j=1

Преобразовывая неравенство, имеем

n					n			n
C <	β q − max{				E q } = min {			q (β		− E )}.	(3.20)
∑	i i	1≤	i≤	m	ij j	1≤ i≤	m		j	j ij	(3.20)
∑	i i			∑	ij j	∑			j	j ij
j=1					j=1			j=1

Выражение в круглых скобках в (3.20) есть ничто иное как риск

rij = β j − Eij .

Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной выбрать стратегию, максимизирующую средний выигрыш или минимизирующую средний риск. Пример, решенный в подразд. 3.7, показывает, что стоимость эксперимента по определению состояния природы в рассмотренной там задаче не должна превышать 2,95.

Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из k несовместимых событий S1, S2,…, Sk, связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода Si эксперимента при условии стратегии природы Ni символом wij. Поскольку S1, S2,…, Sk образуют полную систему событий, справедливо

∑k	wij = 1;1 ≤ j≤ n.
i=1

Будем считать, что все значения wij менеджеру известны, а также известна стоимость проведения эксперимента C. Нас по-прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать менеджеру при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат Sl. Определим апостериорные вероятности стратегий природы по теореме Байеса [14]

v jl = P(N j	Sl	) =	q j wij		.	(3.21)
			∑n
				q j wlj

j=1

Далее для каждой стратегии менеджера рассчитаем величину условного среднего выигрыша при условии результата эксперимента Sl

Eilср = ∑т Eijv jl .	(3.22)
j=1

Очевидно, что оптимальной будет стратегия менеджера Mi, обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента Sl

	= max{E				ср	}.
E
l		1≤	i≤ m	il

Вероятность появления условного выигрыша El совпадает с вероятностью появления события Sl. Обозначим ее символом hl. Тогда

	hl = ∑n		q j wlj .			(3.23)
		j=1
Величина выигрыша с использованием эксперимента
		эксп = ∑k			l hl .
	E	эксп = ∑k		E	l hl .	(3.24)

l=1

Сдругой стороны, выигрыш менеджера без проведения эксперимента определяется выражением

		n
		∑

E = max			Eij q j .
	1≤ i≤ m	j=1

Отсюда вытекает условие целесообразности проведения эксперимента

C < Eэксп − Е.

Если проведение эксперимента признано целесообразным, то менеджер должен разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию Mi необходимо выбрать, если эксперимент дал результат Sl.

Вернемся к рассмотренному выше примеру. Пусть точно определить состояние природы не удается, но существует три возможных результата проведения эксперимента S1, S2, S3 (k=3). Зададим в табл. 3.18 матрицу условных вероятностей появления Si варианта эксперимента W={wij} при Nj состоянии природы.

Таблица 3.18	Таблица 3.19
Матрица условных	Матрица апостериорных
вероятностей соответствия	вероятностей соответствия
эксперимента природе	эксперимента природе

Экспери-	Стратегия
Экспери-
ìåíò	N1	N2
	N1	N2
S1	0,3	0,7
S2	0,5	0,2
S3	0,2	0,1

Экспери-	Стратегия
Экспери-
ìåíò	N1	N2
	N1	N2
S1	0,222222	0,777778
S2	0,625	0,375
S3	0,571429	0,428571

В табл. 3.19 занесем рассчитанные по теореме Байеса (3.21) апостериорные вероятности, сохранив старые значения априорных вероятностей природы q1= 0,4 и q2= 0,6.

Определим теперь величину условного среднего выигрыша (3.22), если эксперимент дал результат S1. При стратегиях менеджера M1 и M2 расчеты дают округленно {42,06; 43,81}. Если результат эксперимента S2, то соответствующие значения равны {37,87; 33,89}. Наконец, в случае S3 имеем {38,43; 35,21}. Отсюда получается решающее правило задачи в виде стратегии M2 с выигрышем 43,81 при первом исходе эксперимента, и стратегии M1 с выигрышами 37,87 и 38,43 при втором и третьем исходах. Отметим, что полученные значения выигрышей являются случайными, поскольку случайными являются результаты эксперимента. Определим теперь вероятности появления различных исходов эксперимента h1, h2, h3 (3.23). Результаты вычислений дают {0,54; 0,32; 0,14}. Тогда величина выигрыша с использованием эксперимента (3.24) Eэксп равна 41,08. Величина выигрыша без эксперимента была определена ранее при рассмотрении примера в подразд. 3.7 и составляет 40,21. Отсюда следует максимально допустимая стоимость эксперимента 0,87, при превышении которой проведение эксперимента делается бессмысленным.

Методы решения динамических задач в условиях неопределенности развиваются в рамках теории дифференциальных игр, представляющей собой самостоятельную математическую дисциплину. В целом аппарат теории игр может быть весьма полезен для решения задач стратегического планирования, анализа конкурентной борьбы и т.п.

100

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1810 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в папке Управленческие решения