Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр для экономистов doc.doc
Скачиваний:
244
Добавлен:
10.02.2015
Размер:
6.54 Mб
Скачать

§2.1.8 Критерий Лапласа

Критерий Лапласа основан на гипотезе, согласно которой все состояния среды реализуются с одинаковыми вероятностями.

Если возможна реализация 2-х состояний А и В и нет никакой информации об их вероятностях, то естественно предполагать, что:

Р(А) = Р(В) = ½.

Если среда может принимать состояния у1, у2,..уn и нет информации о вероятностях этих значений, то естественно предполагать:

Р(у1) = Р(у2) = ...= Р(уn) = 1/n.

Пусть для задачи принятия решения, заданной Таблицей 1, принята гипотеза равной возможности. Для каждой стратегии xi определим значение функции L (xi):

L (xi) = 1/n*∑ f(xi,yj) (1.32)

Получим L(x1), L(x2),.. L(xn) – среднеарифметические выигрыши для каждой стратегии.

Выбираемая стратегия xi: L(xl) ≥ L(xi) (1.33)

Пример: Найти наилучшую стратегию по критерию Лапласа для задачи принятия решения, заданной платёжной матрицей Таблица 8:

Таблица 8

у1

у2

У3

L (xi)

х1

92

0

4

96/3=32

х2

30

50

10

90/3=30


Легко показать, что критерий Лапласа удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.

Тем не менее, у критерия Лапласа есть недостаток: по критерию Лапласа может быть выбрана рискованная стратегия.

Маленькие значения выигрыша при нахождении среднего перекрываются большими – эффект компенсации.

§2.1.9. Критерий Вальда (максиминный критерий)

Выбор критерия Вальда основан на гипотезе, согласно которой ЛПР стремится получить гарантированный результат при любом состоянии среды.

Пример: Найти наилучшую стратегию по критерию Вальда для задачи принятия решения, заданной платёжной матрицей Таблица 9:

Таблица 9

у1

у2

у3

у4

у5

аi

х1

1

3

2

4

5

1

х2

0

6

8

10

12

0


Решение. Найдём выбор по принципу максимина: для любого i min f(xi,yj) = ai – худший результат при выборе i.

maxmin f(xi,yj) = max ai = K.

Легко показать, что критерий Вальда удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.

Недостаток этого критерия: критерий Вальда отвергает хорошие гипотезы из-за своего крайнего пессимизма.

§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)

В основе этого критерия лежит гипотеза о том, что уровень пессимизма ЛПР принимает некоторое значение α: 0 ≤ α ≤ 1. Чем больше α, тем пессимистичнее настроен ЛПР. Для каждой строки xi определяется:

- число аi = min f((xi,yj);

- число bi = max f((xi,yj).

Затем для каждого значения xi и α рассчитывается число:

H(xi, α ) = α* аi + (1- α)* bi

и выбирается max H(xi, α ) = h(α).

Пример 3: Для Примера 2 найти наилучшую стратегию по критерию Гурвица, при значении α = ½ Таблица 10.

Таблица 10

у1

у2

у3

у4

у5

аi

bi

Hi(1/2)

х1

1

3

2

4

5

1

5

1*1/2+5*1/2=3

х2

0

6

8

10

12

0

12

0*1/2+12*1/2=6


Очевидно, что если α = 1, то критерий Гурвица превращается в критерий Вальда.

Докажем, что критерий Гурвица удовлетворяет принципу доминирования.

Доказательство. Пусть стратегия xi является доминирующей. Это значит, что для всех j, 1 ≤ j ≤ n и для всех k, 1 ≤ k ≤ m, k ≠ j, выполняется неравенство:

f(xi,yj) ≥ f(xk,yj). (1.34)

Из этого следует, что:

max f(xi,yj) ≥ max f(xk,yj). (*)

Докажем выполнение неравенства (*) подробнее:

max f(xi,yj) = f(xi,yp)

max f(xk,yj) = f(xk,yq)

f(xi,yj) ≤ f(xi,yp)

f(xk,yj) ≤ f(xk,yq)

Из (1.34) следует, что f(xk,yq) ≤ f(xi,yq) ≤ f(xi,yp).

Таким образом, получается bkbi.

Введём обозначения: min f(xi,yj) = аi = f(xi,yl),

min f(xk,yj) = ak = f(xk,yr)

Из неравенства доминирования (d) следует, что f(xk,yp) ≤ f(xi,yr)

аi = f(xi,yl) ≥ f(xk,yl) ≥ min f(xk,yl) = ak

аi ak

Так как α ≥ 0, 1- α ≥ 0, то:

α * аi ≥ α * аk

(1- α)* bi ≥ (1- α)* bk

Выполнение условий перестановки и аддитивной постоянной достаточно очевидно.

Недостаток критерия Гурвица: недостаточная обоснованность выбора параметра α (его значение основано на оценке отношения ЛПР к риску).