Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы ТПР.doc
Скачиваний:
49
Добавлен:
27.09.2019
Размер:
3.64 Mб
Скачать

34. Основные понятия теории статистических решений (природа, выбор стратегии, смешанная стратегия, средние потери, минимакс, априорные и апостериорные данные, эксперимент).

Статистические модели представляют собой игру двух лиц (человека и природы) с использованием человеком дополнительной статистической информации о состояниях природы.

Она существенно отличается от антагонистической игры двух лиц с нулевой суммой, где выигрыш одного равен проигрышу другого.

В статистической игре природа не является разумным игроком, который стремится выбрать для себя оптимальные страте­гии. Этот игрок не заинтересован в выигрыше. Другое дело -человек, в данном случае статистик. Он имеет целью выиграть игру с воображаемым противником, т. е. с природой.

Игрок-природа не выбирает оптимальной стратегии, но ста­тистик должен стремиться к определению распределения веро­ятностей состояния природы. Следовательно, основными отли­чиями статистической игры от стратегической являются:

• отсутствие стремления к выигрышу у игрока-природы, т. е. отсутствие антагонистического противника;

• возможность второго игрока - статистика провести статис­тический эксперимент для получения дополнительной информа­ции о стратегиях природы.

В теории игр стратегия игрока в игре или деловой ситуации — это полный план действий при всевозможных ситуациях, способных возникнуть.

Понятие стратегии иногда (ошибочно) путают с понятием хода. Ход является действием одного из игроков в какой-то момент игры.

Чистая стратегия даёт полную определённость каким образом игрок продолжит игру. В частности, она определяет результат для каждого возможного выбора, который игроку может придётся сделать. Пространством стратегий называют множество всех чистых стратегий доступных данному игроку.

Смешанная стратегия — является указанием вероятности каждой чистой стратегии. Это означает, что игрок выбирает одну из чистых стратегий, в соответствии с вероятностями заданными смешанной стратегией. Выбор осуществляется перед началом каждой игры и не меняется до её конца. Каждая чистая стратегия является частным случаем смешанной, когда вероятность данной чистой стратегии 1 и у всех других нулевая вероятность.

Информация Априорная (до эксперимента) — предварительные данные о процессе, источником которых могут быть теоретические соображения или статистические исследования.

Апостериорные данные-данные, полученные в процессе эксперимента.

Экспериме́нт (от лат. experimentum — проба, опыт) в научном методе — метод исследования некоторого явления в управляемых условиях.

Минимакс — правило принятия решений, используемое в теории игр, теории принятия решений, исследовании операций, статистике и философии для минимизации возможных потерь из тех, которые лицу принимающему решение нельзя предотвратить при развитии событий по наихудшему для него сценарию[1][2][3]. Критерий минимакса первоначально был сформулирован в теории игр для игры двух лиц с нулевой суммой в случаях последовательных и одновременных ходов, впоследствии получил развитие в более сложных играх и при принятии решений в условиях неопределённости. С понятием минимакса связано понятие максимина (значение минимакса не меньше значения соответствующего максимина).

35. Принцип минимакса в статистических и стратегических играх. Цена игры (верхняя и нижняя).

36. Смешанная игра без седловой точки.

37. Усреднение игры.

Игра, полученная путем усреднения случайных исходов, не полностью эквивалентна исходной игре, так как она характеризует не частный результат отдельной партии, а средние исходы большого числа партий.

38. Верхняя и нижняя цена усреднения игры.

39. Правила S – игры. Геометрия принципа минимакса.

Топология S-игры.

Игра, заданная множеством точек {с1, …, cn}, где с1 = (q11, …, qm1), …, cn = (q1n, …, qmn), qij = L(xi, yj), получила название S-игры.

Обозначим через S* выпуклую оболочку конечного множества точек {с1, …, cn}. Для S-игры это пространство S-стратегий.

Найдем нижнюю и верхнюю цены игры.

Нижняя цена S-игры будет определяться формулой:

Lг = ,

(C.0)

где S – скалярное произведение векторов  = ((1), …, (m)) и S = (S (1), …, S(m)).

Стратегия 0, удовлетворяющая такому соотношению, называется максиминной стратегией первого игрока, максимизирующего гарантированный выигрыш.

Предположим, что второй игрок применяет стратегию

S  S*. Нижняя цена игры будет определяться соотношением:

г = ,

(C.0)

Стратегия S0, удовлетворяющая данному соотношению, называется минимаксной стратегией второго игрока, минимизирующего гарантированный проигрыш. Соответственно формула имеет вид:

г = max ( , …, ) ,

(C.0)

Верхняя цена игры г равна максимальной из координат точки S0, определяющей минимальную стратегию второго игрока.

Если г = г = cг, то минимальные стратегии игроков 0 и S0 будут оптимальными – основное свойство теории конечных матричных игр.

Подставив значение множества точек {с1, …, cm} S-игры в формулу, можно определить графически оптимальную стратегию 0 и Lг.

Рассмотрим множество T, состоящее из точек t = (t(1), …, t(m)), таких, что t(i)г при i = 0, 1, … m. Область T определена в евклидовом пространстве n-размерности Еn и для нашего случае имеет вид прямоугольного гиперклина с вершиной, лежащей на прямой, проведенной из начала координат под углом 45 к каждой из осей абсцисс гиперпространства (см. Pиc. Ошибка! Стиль не определен. .1). Точка S0, определяющая минимаксную стратегию второго игрока, является граничной точкой области S*, причем такой, в которой гиперобласть T касается области S*.

Другими словами, в эвклидовом пространстве размерности Еm (для второго игрока) определяется СО (на множестве точек стратегий второго игрока, т.е. ) и специфическая область Т, равноудаленная от осей координат Еm. Область Т выдвигается по биссектрисе первого квадранта гиперпространства Еm до касания с (точка ). Максимальная координата точки касания определяет минимаксные потери игрока Y (потери по max проекция на Еm).

Двойственным алгоритмом действий определяется решения для игрока Х:

Еn  CO =  min , проекция точки на Еn

Rб – по Байесу.

Pиc. Ошибка! Стиль не определен..1 Пример топологии S-игры.