Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Рязанский государственный радиотехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Теория игр. Конспект лекций(копия).doc

Скачиваний:

Добавлен:

09.11.2019

Размер:

3.06 Mб

Скачать

☆

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2818 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Общие сведения об играх с природой или теория статистических решений.

В экономической практике часто приходится принимать решения при скудных априорных сведениях о протекании той или иной операции. В этих играх два игрока: 1-ый — активный игрок «статистик», 2-ой — пассивный, его выбор определяет условия протекания игры.

В результатах протекания игры второй игрок не заинтересован (он не выигрывает и не проигрывает). Таким образом, «природа» определяет всю совокупность внешних обстоятельств, которые учитываются активным игроком при выборе стратегии своего поведения.

Т. к. будущее состояние природы никогда не известно точно, то активному игроку приходится принимать решения в условиях неопределённости, но не в условиях прямого конфликта. Платой за недостаточную информированность о будущем состоянии природы является плата за ошибочное решение, которое может принять статистик. Возникает вопрос какие решения следует считать правильными, а какие — ошибочными? Каким образом можно выбрать правильное решение и отсечь неправильное?

Отсутствие сознательного противодействия со стороны природы лишь усложняет задачу выбора правильных решений. В играх с природой используются т. н. статистические решения. Соответственно, теория игр с природой называется теорией статистических решений.

Пространство стратегий природы

Предположим, что число возможных состояний природы z конечно. Z = — множество состояний природы. Если статистику точно известно z Z, то будем считать его способным принять наилучшее решение в этом состоянии z . В общем случае статистику может быть известно достаточно приближенно:

Известны частоты P’ и грубые оценки частот P’’. В каждом из этих случаев статистику приходится принимать решения, используя специфические методы теории принятия статистических решений. В первом случае надо принимать решение, которое не использует понятие вероятности состояния природы, во втором случае можно поступать двояко: можно принимать решения, используя грубые оценки частот (считая их за вероятность) или предпринять действия, позволяющие уточнить эти оценки частот. В третьем случае возникает вопрос: с помощью скольких экспериментов можно грубые оценки считать точными?

В дальнейшем вероятности состояния природы будем обозначать q(z ). Очевидно, что состояния природы и их вероятности образуют смешанную стратегию природы. Т.е. можно считать, что множество Z = и множество Q = ,…, образуют пространство состояний природы.

Пространство стратегий статистика и функция выигрыша

X — множество стратегий статистика, аналогичное множеству стратегий в антагонистических играх. Если множество X — дискретное, X = (x ,…, x ), тогда можно рассматривать множество ситуаций и множество выигрышей статистика в этих ситуациях: (x , z ), i = , j =

П = (a ) m*n

Эта функция П называется функцией потерь. Значение функции потерь позволяет игроку 1 (статистику) принимать предпринимать правильные действия.

Пример: Задача о яйцах и креме

	Состояние яйца
Действие	Z1 - хорошее	Z2- испорченное
долить в остальные 5 яиц, x1	крем из 6 яиц	крема нет, загублено 5 хороших яиц
вылить разбитое яйцо на блюдце для контроля, x2	крем из 6 яиц, но надо мыть посуду (блюдце)	крем из 5 яиц, надо мыть блюдце "с отвращением"
выбросить яйцо, не глядя, x3	крем из пяти яиц, загублено 1 яйцо	крем из 5 яиц

Если каким-либо образом оцифровать описание ситуации в виде значений функций потерь, то получим игру с природой.

В описании игры с природой наблюдается полная аналогия с антагонистической игрой. Статистик может принимать чистые стратегии x X и их вероятностные оценки p = p(x ) P, (X, P) — пространство стратегий статистика.

А = (a ), i = ; j =

X = ,…, , m — чистые стратегии статистика;

n — чистые состояния природы;

Z = ,…,

Если используются смешанные стратегии, то каждому из состояний чистой стратегии сопоставляется значение p , i = . Определим вероятность использования смешанных стратегий.

x~ ,…,

z~ ,…, — вероятность состояний природы.

Если эти вероятности известны, то можно определить сравнительные вероятности статистика в этой игре:

M[S , S ] = a *p *q

S — множество (X*P)

S — множество (Z*Q)

p = ; q =

M[S , S ] = p *A*q

Задачу статистика в этой игре можно определить как нахождение такого S , при котором его выигрыш M[S , S ] max. Эта стратегия S может быть как чистой, так и смешанной.

Исходя из этого, в матрице платежей (a ) можно рассматривать доминирующие и доминируемые стратегии.

Доминирование по строкам и доминирование по столбцам теряет смысл, т. к. природа не выиграет и не проиграет, ей безразлично её состояние.

С учётом этого матрица платежей не в полной мере характеризует достоинства и недостатки каждой стратегии X = ,…, игрока.

Используют другую форму описания игры, которая более полно отражает степень удачливости в выборе игрока. Одним из таких показателей является матрица рисков:

A =

Номер столбца матрицы совпадает с состоянием природы, номер строки характеризует стратегию игрока. B = max a — максимальный выигрыш статистика при данном состоянии природы j.

R = (r ), i = , j =

r = B - a — разница между максимальным выигрышем и выигрышем, который получит статистик, выбирая стратегию x .

Матрица рисков: R = . В матрице рисков хотя бы один из элементов в каждом столбце должен равняться нулю.

Пример: А = ; R =

Если условием выбора стратегии является максимум среднего выигрыша, то по матрице рисков R min. Если же вероятности состояния природы известны (q ), то условие максимума среднего выигрыша и условие минимума среднего риска дают одни и те же стратегии.

Если V = ; V = max V или r = ; r =min r , то решение будут одинаковыми.

Пример: Матрица платежей: А = ; q = (0,2; 0,5; 0,3)

V = 1*0,2+ 3*0,5+ 1*0,3 = 2

V = 2*0,2+ 0,5+ 1,2 = 2,1

V = 2,1; x является предпочтительной стратегией: x даёт больший средний выигрыш V .

R = r = 0,2+ 0,9 = 1,1

r = 1 x — риск минимален.

О вероятностях состояния природы в лучшем случае известны их некоторые оценки q’. На практике достоверность этих оценок является слишком низкой для того, чтобы использовать их при оценке качества выбора решений статистика.

В таких условиях лучше:

Не пользоваться этими оценками и для выбора решения использовать критерий, который не пользуется понятием вероятности состояния природы;
Cчитать все состояния природы равновероятными q = 1/n, i= .

Критерий, позволяющий принять задачу выбора решения, называется критерием выбора решений при неопределённости.

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2818 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.04.201545.57 Кб12Темы по экологии.doc
#
10.11.2018201.22 Кб11Темы рефератов правоведение.doc
#
29.10.201830.24 Кб4Темы_английский.docx
#
07.08.2019133.06 Кб1Теоретическая часть.rtf
#
14.08.20191.16 Mб5ТЕОРИЯ ИГР (БАКАЛАВРЫ).doc
#
09.11.20193.06 Mб24Теория игр. Конспект лекций(копия).doc
#
23.09.2019386.56 Кб19теория статистики (Лекции)1.doc
#
24.09.20193.81 Mб22Теория функций комплексной переменной.docx
#
15.04.2015346.82 Кб7тервер.docx
#
15.07.2019250.37 Кб2Термины (академия).doc
#
21.11.2019668.67 Кб27Термохимия_типовые задачи.doc