- •Основные понятия теории игр
- •Классификация игр
- •Описание игры в развернутой форме
- •Бескоалиционные игры
- •Приемлемые ситуации и ситуации равновесия в игре
- •Стратегическая эквивалентность игр
- •Антагонистические игры. Общие сведения
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при использовании смешанных стратегий
- •Основная теорема антагонистических игр.
- •Верхние и нижние цены в s-игре
- •Разделительная и опорная гиперплоскость двух выпуклых множеств
- •Теорема о минимаксе
- •Геометрическая интерпретация минимакса
- •Решение антагонистических игр. Доминирующие и полезные стратегии
- •Игры с частными случаями платежных матриц
- •Решение матричных игр
- •Линейное программирование для решения матричных игр
- •Графическое решение игр 2*n и m*2
- •Бесконечные антагонистические игры
- •Строго выпуклые игры на единичном квадрате
- •Неантагонистические игры
- •Бескоалиционные игры
- •Охрана воздушного бассейна от загрязнений атмосферы
- •Принципы оптимальности в бескоалиционных играх
- •Принцип оптимальности по Парето
- •Смешанное расширение бескоалиционной игры
- •Коалиционные и кооперативные игры
- •Характеристическая функция коалиционной игры
- •Свойства характеристической функции
- •Дележи в кооперативной игре
- •Стратегическая эквивалентность кооперативных игр
- •Общие сведения об играх с природой или теория статистических решений.
- •Пространство стратегий природы
- •Пространство стратегий статистика и функция выигрыша
- •Критерии выбора решений при неопределённости
- •Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- •Допустимые стратегии в статистических играх
- •Геометрическая интерпретация выбора байесовской стратегии
- •Статистические игры с проведением единичного эксперимента Общие сведения
- •Пространство выборок
- •Функции риска
- •Принцип выбора стратегий в играх с единичным экспериментом.
- •Байесовский принцип.
- •Число чистых стратегий статистика в игре с единичным экспериментом.
- •Апостериорные распределения вероятности.
- •Определение байесовских решений с использованием апостериорных вероятностей
- •Двуальтернативная задача
- •Анализ целесообразности проведения экспериментов
- •Использование апостериорной вероятности для определения последовательных байесовских правил
- •Правило последовательных выборок
- •Функция риска при оптимальном последовательном правиле
Общие сведения об играх с природой или теория статистических решений.
В экономической практике часто приходится принимать решения при скудных априорных сведениях о протекании той или иной операции. В этих играх два игрока: 1-ый — активный игрок «статистик», 2-ой — пассивный, его выбор определяет условия протекания игры.
В результатах протекания игры второй игрок не заинтересован (он не выигрывает и не проигрывает). Таким образом, «природа» определяет всю совокупность внешних обстоятельств, которые учитываются активным игроком при выборе стратегии своего поведения.
Т. к. будущее состояние природы никогда не известно точно, то активному игроку приходится принимать решения в условиях неопределённости, но не в условиях прямого конфликта. Платой за недостаточную информированность о будущем состоянии природы является плата за ошибочное решение, которое может принять статистик. Возникает вопрос какие решения следует считать правильными, а какие — ошибочными? Каким образом можно выбрать правильное решение и отсечь неправильное?
Отсутствие сознательного противодействия со стороны природы лишь усложняет задачу выбора правильных решений. В играх с природой используются т. н. статистические решения. Соответственно, теория игр с природой называется теорией статистических решений.
Пространство стратегий природы
Предположим, что число возможных состояний природы z конечно. Z = — множество состояний природы. Если статистику точно известно z Z, то будем считать его способным принять наилучшее решение в этом состоянии z . В общем случае статистику может быть известно достаточно приближенно:
Известны частоты P’ и грубые оценки частот P’’. В каждом из этих случаев статистику приходится принимать решения, используя специфические методы теории принятия статистических решений. В первом случае надо принимать решение, которое не использует понятие вероятности состояния природы, во втором случае можно поступать двояко: можно принимать решения, используя грубые оценки частот (считая их за вероятность) или предпринять действия, позволяющие уточнить эти оценки частот. В третьем случае возникает вопрос: с помощью скольких экспериментов можно грубые оценки считать точными?
В дальнейшем вероятности состояния природы будем обозначать q(z ). Очевидно, что состояния природы и их вероятности образуют смешанную стратегию природы. Т.е. можно считать, что множество Z = и множество Q = ,…, образуют пространство состояний природы.
Пространство стратегий статистика и функция выигрыша
X — множество стратегий статистика, аналогичное множеству стратегий в антагонистических играх. Если множество X — дискретное, X = (x ,…, x ), тогда можно рассматривать множество ситуаций и множество выигрышей статистика в этих ситуациях: (x , z ), i = , j =
П = (a ) m*n
Эта функция П называется функцией потерь. Значение функции потерь позволяет игроку 1 (статистику) принимать предпринимать правильные действия.
Пример: Задача о яйцах и креме
-
Состояние яйца
Действие
Z1 - хорошее
Z2- испорченное
долить в остальные 5 яиц, x1
крем из 6 яиц
крема нет, загублено 5 хороших яиц
вылить разбитое яйцо на блюдце для контроля, x2
крем из 6 яиц, но надо мыть посуду (блюдце)
крем из 5 яиц, надо мыть блюдце "с отвращением"
выбросить яйцо, не глядя, x3
крем из пяти яиц, загублено 1 яйцо
крем из 5 яиц
Если каким-либо образом оцифровать описание ситуации в виде значений функций потерь, то получим игру с природой.
В описании игры с природой наблюдается полная аналогия с антагонистической игрой. Статистик может принимать чистые стратегии x X и их вероятностные оценки p = p(x ) P, (X, P) — пространство стратегий статистика.
А = (a ), i = ; j =
X = ,…, , m — чистые стратегии статистика;
n — чистые состояния природы;
Z = ,…,
Если используются смешанные стратегии, то каждому из состояний чистой стратегии сопоставляется значение p , i = . Определим вероятность использования смешанных стратегий.
x~ ,…,
z~ ,…, — вероятность состояний природы.
Если эти вероятности известны, то можно определить сравнительные вероятности статистика в этой игре:
M[S , S ] = a *p *q
S — множество (X*P)
S — множество (Z*Q)
p = ; q =
M[S , S ] = p *A*q
Задачу статистика в этой игре можно определить как нахождение такого S , при котором его выигрыш M[S , S ] max. Эта стратегия S может быть как чистой, так и смешанной.
Исходя из этого, в матрице платежей (a ) можно рассматривать доминирующие и доминируемые стратегии.
Доминирование по строкам и доминирование по столбцам теряет смысл, т. к. природа не выиграет и не проиграет, ей безразлично её состояние.
С учётом этого матрица платежей не в полной мере характеризует достоинства и недостатки каждой стратегии X = ,…, игрока.
Используют другую форму описания игры, которая более полно отражает степень удачливости в выборе игрока. Одним из таких показателей является матрица рисков:
A =
Номер столбца матрицы совпадает с состоянием природы, номер строки характеризует стратегию игрока. B = max a — максимальный выигрыш статистика при данном состоянии природы j.
R = (r ), i = , j =
r = B - a — разница между максимальным выигрышем и выигрышем, который получит статистик, выбирая стратегию x .
Матрица рисков: R = . В матрице рисков хотя бы один из элементов в каждом столбце должен равняться нулю.
Пример: А = ; R =
Если условием выбора стратегии является максимум среднего выигрыша, то по матрице рисков R min. Если же вероятности состояния природы известны (q ), то условие максимума среднего выигрыша и условие минимума среднего риска дают одни и те же стратегии.
Если V = ; V = max V или r = ; r =min r , то решение будут одинаковыми.
Пример: Матрица платежей: А = ; q = (0,2; 0,5; 0,3)
V = 1*0,2+ 3*0,5+ 1*0,3 = 2
V = 2*0,2+ 0,5+ 1,2 = 2,1
V = 2,1; x является предпочтительной стратегией: x даёт больший средний выигрыш V .
R = r = 0,2+ 0,9 = 1,1
r = 1 x — риск минимален.
О вероятностях состояния природы в лучшем случае известны их некоторые оценки q’. На практике достоверность этих оценок является слишком низкой для того, чтобы использовать их при оценке качества выбора решений статистика.
В таких условиях лучше:
Не пользоваться этими оценками и для выбора решения использовать критерий, который не пользуется понятием вероятности состояния природы;
Cчитать все состояния природы равновероятными q = 1/n, i= .
Критерий, позволяющий принять задачу выбора решения, называется критерием выбора решений при неопределённости.