Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Рязанский государственный радиотехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Теория игр. Конспект лекций(копия).doc

Скачиваний:

Добавлен:

09.11.2019

Размер:

3.06 Mб

Скачать

☆

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2820 21 22 23 24 25 26 27 28 > Следующая >>>

Допустимые стратегии в статистических играх

Допустим, что рассматривается смешанная стратегия:

P(x)= (a).

Возможно два случая:

Нельзя найти ’(а) — другая стратегия, когда потери:

L(V, ’) L(V, ), V Z

Если такая стратегия ’(a) существует, то стратегия (а) недопустима.

(а) a = x (a ) p(x )

Стратегия (а) — допустимая, если нельзя найти другую стратегию ’(a): L(V, ’) L(V, ) — условие допустимости стратегии (а).

Допустимая стратегия не обязательно является предпочтительной. Допустимую стратегию удобно рассматривать в рамках S-игры.

Если V=(V V ), то потери можно рассмотреть на плоскости.

Множество значений этих потерь можно сопоставить с выпуклой линейной оболочкой S*.

Рассмотрим некоторую точку S S*, проведём отрезок из начальных координат в эту точку. Очевидно, что все точки, расположенные на этом луче и множество S* будут давать потери, меньшие, чем потери S. Наименьшие потери будут а точке S , которая является пересечением луча и нижней левой границы выпуклой оболочки.

Допустимыми могут быть стратегии, принадлежащие участку линейной оболочки, который является дугой AB. Все стратегии, которые определяются точками линейного множества S*, не принадлежащие её левой нижней границе, можно исключить из рассмотрения. А точки, принадлежащие дуге АВ, в некотором смысле эквивалентны, т. к. при перемещении по этим точкам можно уменьшить потери в одном состоянии и увеличить в другом (сразу всё уменьшить невозможно).

Пример: «задача о технологической линии»

Нижняя левая граница состоит из точек C , C и С

WC +(1-W)C WC +(1-W)C

Смешанная стратегия (а) = (W, 1-W, 0), (a) = (0, W, 1-W)

Определим потери статистика для этих стратегий: L(V , ) = W*0 + 1*(1-W) = 1-W, L(V , ) = 5*W + 3(1-W) = 3 + 2W

L(V , ) = 1*W + 3(1-W) = 3 – 2W

L(V , ) = 3W + 2(1-W) = 2+ W

Рассмотрим возможные пути выбора смешанных стратегий статистика.

Принцип минимакса (min max);
Байесовский принцип.

Принцип минимакса ориентирует статистика на выбор такой смешанной стратегии (а), при которой его потери в наихудшем состоянии природы минимальны.

Применим этот принцип для выбора W в задаче.

1 случай:

В наихудшем состоянии природы эти потери определяются прямой V : W = 0 *(0 1 0), потери равны 3.

2 случай:

3 -2W = 2 + W

1 = 3W; W = 1/3

* (0 1/3 2/3); V = 7/3 (цена игры).

В наихудшем состоянии природы потери определяются верхней границей, минимум в точке О.

Иногда значение функции потерь удобно приводить к определённому нулевому уровню. Очевидно, для нахождения состояния природы L(V , a ) L(V , a )

Этот минимум определяет минимальные затраты, которые может понести статистик при каждом состоянии природы.

L’(V, ) = L(V, ) - L(V, a)

В предыдущей задаче о ПДК потери определялись бы следующим образом:

V	a1	a2	a3
V1	0	1-0=1	3-0=3
V2	5-2=3	3-2=1	2-2=0

Очевидно, что принцип минимакса можно применять и для дополнительных потерь.

Байесовский принцип направлен на принятие решения, исходя из априорных оценок вероятностей состояния природы.

q(V) (V)

Если q — априорная вероятность состояния природы, то можно говорить о потерях:

L( , ) =

Матрица потерь статистика в игре:

* =

(V ), i =

L( , ) = L(V , a ) * (a ) * (V ) min

Наилучшей стратегией будет та, при которой байесовские потери L( , ) будут минимальными. Аналогично можно применить байесовский принцип при дополнительных потерях.

Пример: (та же задача)

1 ситуация:

(V ) = 0,6. Найдём оптимальную байесовскую стратегию в этой задаче.

(V ) = 0,4

L( ) = (1-W)*0,6 + (3 + 2W)*0,4 = 1,8 + 0,2W 1,8 при W = 0.

(0, 1, 0) – нужно применять вторую технологию.

2 ситуация:

L( ) = 0,6*(3-2W) + 0,4(2 + W) = 2,6 – 0,8W min W=1

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2820 21 22 23 24 25 26 27 28 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.04.201545.57 Кб12Темы по экологии.doc
#
10.11.2018201.22 Кб11Темы рефератов правоведение.doc
#
29.10.201830.24 Кб4Темы_английский.docx
#
07.08.2019133.06 Кб1Теоретическая часть.rtf
#
14.08.20191.16 Mб5ТЕОРИЯ ИГР (БАКАЛАВРЫ).doc
#
09.11.20193.06 Mб24Теория игр. Конспект лекций(копия).doc
#
23.09.2019386.56 Кб19теория статистики (Лекции)1.doc
#
24.09.20193.81 Mб22Теория функций комплексной переменной.docx
#
15.04.2015346.82 Кб7тервер.docx
#
15.07.2019250.37 Кб3Термины (академия).doc
#
21.11.2019668.67 Кб27Термохимия_типовые задачи.doc