- •Министерство образования и науки российской федерации
- •Часть 1 лекция 1 основные понятия теории статистических решений
- •1.1. Основные определения
- •1.2. Основные формулы
- •Лекция 2 стратегии принятия решений
- •2.1. Критерии и принципы принятия решений
- •Лекция 3 проверка гипотез
- •3.1. Проверка простой гипотезы против простой альтернативы
- •3.2. Многоальтернативная задача выбора решения
- •Часть 2 лекция 1 основные понятия исследования операций
- •1.1. Основные определения
- •Лекция 2 основные понятия теории игр Матричная игра
- •2.1. Основные определения
- •2.2. Матричная игра
- •Лекция 3 Матричная игра (продолжение)
- •3.1. Пример решения матричной игры в чистых стратегиях.
- •3.2. Пример решения матричной игры с седловой точкой.
- •Лекция 4 смешанное расширение Матричной игры
- •4.1. Смешанные стратегии
- •4.2. Основная теорема матричных игр
- •Лекция 5 методы решения Матричных игр в смешанных стратегиях
- •5.1. Решение матричной игры
- •Лекция 6 методы решения Матричных игр в смешанных стратегиях (продолжение)
- •6.1. Применение линейного программирования
- •Лекция 7 итерационный метод решения Матричной игры
- •7.1. Метод Брауна-Робинсона
- •Лекция 8 итерационный метод решения Матричной игры (продолжение)
- •8.1. Пример решения игрыметодом Брауна-Робинсона
- •8.2. Метод решения бесконечных игр
- •Лекция 9 неантагонистические игры двух игроков
- •9.1. Биматричная игра
- •9.2. Смешанное расширение биматричной игры
- •Лекция 10 неантагонистические игры n игроков
- •10.1. Бескоалиционная игра n игроков
- •10.2. Кооперативная игра n игроков
- •Лекция 11 неантагонистические игры n игроков (продолжение)
- •11.1. Пример решения кооперативной игры
- •Лекция 12 вектор шепли
- •12.1. Вектор и аксиомы Шепли
- •Лекция 13 вектор шепли (продолжение)
- •13.1. Пример расчета вектора Шепли
- •13.2. Понятие о дифференциальных играх
- •Содержание
- •Часть 1
- •Часть 2
Лекция 2 основные понятия теории игр Матричная игра
Теория игр это прикладная наука, предметом которой является математическое изучение конфликтных ситуаций, когда результат действия (решения) одной из сторон зависит от действий (решений) других сторон в условиях неполной статистической информации.
2.1. Основные определения
Игра это упрощенная формализованная модель конфликтной ситуации.
Для математического описания ситуации необходима ее формализация, которая состоит в том, что действия сторон подчиняются определенным правилам. Правила игры предопределяют возможные варианты действия сторон, объем информации каждой стороны о действиях других сторон, результат (исход) игры (выигрыш или проигрыш), который характеризуется числовым значением, при том или ином варианте действия сторон.
Парная игра это игра двух сторон (игроков) 1 и 2.
Игра с нулевой суммой это игра, в которой интересы игроков прямо противоположны (антагонистическая), а выигрыш одного из игроков равен проигрышу другого, и поэтому достаточно рассматривать только выигрыш игрока 1.
Стратегия игрока это правило действия игрока в каждой возможной ситуации игры.
В зависимости от числа возможных стратегий игроков различают конечные и бесконечные (непрерывные) игры.
2.2. Матричная игра
Матричная игра это конечная игра с нулевой суммой.
Пусть в конечной игре с нулевой суммой игрок 1 имеет стратегии x1, x2,…, xm, а игрок 2 имеет стратегии y1, y2,…, yn. Такая игра называется игрой . Выигрыш игрока1 при стратегиях сторон xi и yj обозначим aij (если выигрыш является случайной величиной, то aij средний выигрыш или математическое ожидание выигрыша).
Все значения выигрышей составляют матрицу A=[aij], которая называется матрицей игры(матрицей эффективности или платежной матрицей).
|
y1 |
y2 |
… |
yn |
x1 |
a11 |
a12 |
… |
a1n |
x2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
xm |
am1 |
am2 |
… |
amn |
Рассмотрим стратегии игрока 1. Выбирая стратегию xi, игрок 1 должен принять, что игрок 2 ответит на нее такой стратегией yj, которая дает игроку 1 минимальный выигрыш
(2.2.1)
Очевидно, игрок 1 должен выбрать ту из своих стратегий (строк матрицы), которой соответствует максимальное значение
(2.2.2)
Величину α называютнижней ценой игрыилимаксимином, а соответствующую строку матрицы игры―максиминной стратегией. Максиминная стратегия игрока 1 обеспечивает ему выигрыш не меньший, чем α при любой стратегии игрока 2.
Если игрок 1не информирован о действиях игрока 2, то есть не знает его конкретную стратегию yj, то максиминная стратегия является оптимальнойчистойгарантирующей стратегией игрока1, а величинаα―максимальным гарантированным выигрышем для него.
Рассмотрим теперь стратегии игрока 2. Игрок 2, выбирая свою стратегию yj, должен принять, что игрок1ответит на нее такой стратегиейxi, которая дает максимальный выигрыш
(2.2.3)
Очевидно, игрок 2 должен выбрать ту из своих стратегий (столбцов матрицы), которой соответствует минимальное значение
(2.2.4)
Величину β называютверхней ценой игрыилиминимаксом, а соответствующий столбец матрицы игры―минимаксной стратегией. Минимаксная стратегия игрока 2 гарантирует ему проигрыш не больший, чем β при любой стратегии игрока 1.
Если игрок 2 не информирован о действиях игрока 1, то есть не знает его конкретную стратегию xi, то минимаксная стратегия является оптимальнойчистойгарантирующей стратегией игрока2, а величинаβ―минимальным гарантированным проигрышем для него.
Максиминная и минимаксная гарантирующие стратегии соответствуют осторожному подходу к решению задачи. Они выбираются в условиях, когда каждый из игроков не информирован о действиях другого, но предполагает, что противник знает его конкретную стратегию и действует наиболее неблагоприятным для него способом.