- •Теория игр для экономистов
- •Глава 1. Введение.
- •Покажем на популярных примерах игровых задач, как с помощью математической модели можно получить ответы на некоторые вопросы.
- •§1.2. Формальное описание игры.
- •§1.3. Классификация игр
- •Глава 2. Бескоалиционные игры
- •§2.1. Антагонистические игры
- •§2.1.1. Понятие антагонистической игры. Матричная игра.
- •§2.1.2. Доминирование стратегий. Редукция игры. Решение игры в доминирующих стратегиях.
- •§2.1.3. Решение игры в чистых стратегиях
- •§2.1.4. Смешанное расширение игры
- •§2.1.5. Решение игры в смешанных стратегиях
- •Свойства игры в смешанных стратегиях.
- •§2.1.6. Игра против природы
- •§2.1.7. Критерии оптимальности решения в условиях неопределённости
- •§2.1.8 Критерий Лапласа
- •§2.1.9. Критерий Вальда (максиминный критерий)
- •§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)
- •§2.1.11. Критерий Сэвиджа (критерий наименьших сожалений)
- •§2.1.12. Решение игры против природы в смешанных стратегиях
- •§ 2.2 Неантагонистические игры
- •§2.2.1. Понятие неантагонистической игры
- •§2.2.2. Биматричные игры
- •§2.2.3. Равновесие Нэша
- •§2.2.4. Эффективность по Парето2
- •§2.2.5. Повторяющиеся игры. Применение к микроэкономике.
- •§2.2.6. Последовательные игры
- •Глава 3. Кооперативные решения
- •§3. 1. Понятие коалиционной игры
- •§3.2. Определение решения игры
- •§3.3. Эффективность обмена. Ящик Эджворта
- •§3.4. Арбитражное решение
- •Практикум Матричная игра. Доминирование стратегий.
- •Решение игры в чистых стратегиях.
- •Решение игры в смешанных стратегиях.
- •Игра против природы. Критерии Лапласа, Вальда, Сэвиджа, Гурвица.
- •Равновесие Нэша.
- •Кооперативные решения
- •Типовой расчет по теории игр. Тема:кооперативное решение.
- •Литература
- •"Теория игр для экономистов "
- •156961, Г.Кострома, ул. 1 Мая,14
§2.1.8 Критерий Лапласа
Критерий Лапласа основан на гипотезе, согласно которой все состояния среды реализуются с одинаковыми вероятностями.
Если возможна реализация 2-х состояний А и В и нет никакой информации об их вероятностях, то естественно предполагать, что:
Р(А) = Р(В) = ½.
Если среда может принимать состояния у1, у2,..уn и нет информации о вероятностях этих значений, то естественно предполагать:
Р(у1) = Р(у2) = ...= Р(уn) = 1/n.
Пусть для задачи принятия решения, заданной Таблицей 1, принята гипотеза равной возможности. Для каждой стратегии xi определим значение функции L (xi):
L (xi) = 1/n*∑ f(xi,yj) (1.32)
Получим L(x1), L(x2),.. L(xn) – среднеарифметические выигрыши для каждой стратегии.
Выбираемая стратегия xi: L(xl) ≥ L(xi) (1.33)
Пример: Найти наилучшую стратегию по критерию Лапласа для задачи принятия решения, заданной платёжной матрицей Таблица 8:
Таблица 8
|
у1 |
у2 |
У3 |
L (xi) |
х1 |
92 |
0 |
4 |
96/3=32 |
х2 |
30 |
50 |
10 |
90/3=30 |
Легко показать, что критерий Лапласа удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.
Тем не менее, у критерия Лапласа есть недостаток: по критерию Лапласа может быть выбрана рискованная стратегия.
Маленькие значения выигрыша при нахождении среднего перекрываются большими – эффект компенсации.
§2.1.9. Критерий Вальда (максиминный критерий)
Выбор критерия Вальда основан на гипотезе, согласно которой ЛПР стремится получить гарантированный результат при любом состоянии среды.
Пример: Найти наилучшую стратегию по критерию Вальда для задачи принятия решения, заданной платёжной матрицей Таблица 9:
Таблица 9
|
у1 |
у2 |
у3 |
у4 |
у5 |
аi |
х1 |
1 |
3 |
2 |
4 |
5 |
1 |
х2 |
0 |
6 |
8 |
10 |
12 |
0 |
Решение. Найдём выбор по принципу максимина: для любого i min f(xi,yj) = ai – худший результат при выборе i.
maxmin f(xi,yj) = max ai = K.
Легко показать, что критерий Вальда удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.
Недостаток этого критерия: критерий Вальда отвергает хорошие гипотезы из-за своего крайнего пессимизма.
§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)
В основе этого критерия лежит гипотеза о том, что уровень пессимизма ЛПР принимает некоторое значение α: 0 ≤ α ≤ 1. Чем больше α, тем пессимистичнее настроен ЛПР. Для каждой строки xi определяется:
- число аi = min f((xi,yj);
- число bi = max f((xi,yj).
Затем для каждого значения xi и α рассчитывается число:
H(xi, α ) = α* аi + (1- α)* bi
и выбирается max H(xi, α ) = h(α).
Пример 3: Для Примера 2 найти наилучшую стратегию по критерию Гурвица, при значении α = ½ Таблица 10.
Таблица 10
|
у1 |
у2 |
у3 |
у4 |
у5 |
аi |
bi |
Hi(1/2) |
х1 |
1 |
3 |
2 |
4 |
5 |
1 |
5 |
1*1/2+5*1/2=3 |
х2 |
0 |
6 |
8 |
10 |
12 |
0 |
12 |
0*1/2+12*1/2=6 |
Очевидно, что если α = 1, то критерий Гурвица превращается в критерий Вальда.
Докажем, что критерий Гурвица удовлетворяет принципу доминирования.
Доказательство. Пусть стратегия xi является доминирующей. Это значит, что для всех j, 1 ≤ j ≤ n и для всех k, 1 ≤ k ≤ m, k ≠ j, выполняется неравенство:
f(xi,yj) ≥ f(xk,yj). (1.34)
Из этого следует, что:
max f(xi,yj) ≥ max f(xk,yj). (*)
Докажем выполнение неравенства (*) подробнее:
max f(xi,yj) = f(xi,yp)
max f(xk,yj) = f(xk,yq)
f(xi,yj) ≤ f(xi,yp)
f(xk,yj) ≤ f(xk,yq)
Из (1.34) следует, что f(xk,yq) ≤ f(xi,yq) ≤ f(xi,yp).
Таким образом, получается bk ≤ bi.
Введём обозначения: min f(xi,yj) = аi = f(xi,yl),
min f(xk,yj) = ak = f(xk,yr)
Из неравенства доминирования (d) следует, что f(xk,yp) ≤ f(xi,yr)
аi = f(xi,yl) ≥ f(xk,yl) ≥ min f(xk,yl) = ak
аi ≥ ak
Так как α ≥ 0, 1- α ≥ 0, то:
α * аi ≥ α * аk
(1- α)* bi ≥ (1- α)* bk
Выполнение условий перестановки и аддитивной постоянной достаточно очевидно.
Недостаток критерия Гурвица: недостаточная обоснованность выбора параметра α (его значение основано на оценке отношения ЛПР к риску).