Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы теории Стохастических систем (лекции).doc
Скачиваний:
156
Добавлен:
21.03.2015
Размер:
19.08 Mб
Скачать

2. Основы теории статистических решений. Статистические игры

Специфическим видом игры, имеющим большое значение при анализе практических ситуаций, являются статистические игры, в которых в качестве одного из игроков выступает природа [10]. Природа не имеет злого умысла по отношению к игроку (человеку). Она развивается и действует по своим законам. Во многих случаях человек не знает законы природы или знает недостаточно полно. Платой за попытку получить решение в условиях неполной информации о законе природы является возможность принять ошибочные решения.

Правда у человека есть возможность изучить природу посредством постановки эксперимента. Но проведение эксперимента требует времени и затрата средств. Поэтому важной задачей является принятие решения о том, нужно ли проводить эксперимент и какие действия предпринять после окончания эксперимента.

Пространство стратегий природы. Понимается полная совокупность внешних условий, в которых приходится принимать решения. Эту совокупность называют состоянием природы.

Пространство стратегий природы Θ=(ν1, ν2, ν3, …. ν m),

где νi – чистые стратегии природы.

Если бы знали заранее, какую из своих чистых стратегий примет природа в каждом конкретном случае, то принимали бы решение на основе полного знания о природе.

Однако бывает известен только перечень чистых стратегий и априорное распределение вероятностей на пространстве состояний природы Θ: ε(ν). Θ – это смешенная стратегия природы.

Пространство стратегий статистика (ЛПР) и функции потерь. Задача статистика состоит в принятии какого-либо решения из совокупности решений. Чистые стратегии статистика, это его действия по выбору а1, а2, а3, .. аl. Совершая действия статистик может потерпеть убыток, описываемый функцией потерь L(ν, a), которая заранее должна быть определена для всех возможных комбинаций a A и ν € Θ и представлена матрицей потерь:

Q=||qij||, (4)

где qij=L(νi,aj).

Знание функции потерь позволяет статистику предпринять действия, которые являются наилучшими в условиях имеющейся у него информации.

Статистику бывает известна смешенная стратегия природы, т.е априорное распределение вероятностей ε(ν) на пространстве стратегий природы Θ. Знание этой информации позволяет определить средние потери, которые несет статистик выполняя те или иные действия: Средние потери статистика:

L(ε, a) = ∑L(ν,a) ε(ν). (5)

νΘ

Наилучшим действием статистика является байесовское действие a*, при котором средние потери будут минимальными:

R*(ε) = L(ε, a*) = min L(ε, a) (6)

aA

Статистик не обязательно должен ограничиваться использованием только чистых стратегий. Он может использовать смесь чистых стратегий в соответствии с некоторым вероятностным законом распределений – смешанную стратегию.

Статистик с вероятностями η(a)=(η1, η2, η3,ηl) может использовать чистые стратегии a1, a2, a3, al . В общем случае он располагает некоторым набором смешанных стратегий H={η1(a), … ην(a)}, образующих пространство смешанных стратегий статистика.

Если статистик принимает смешанную стратегию η(a), а природа смешанную стратегию ε(ν), то средние потери статистика составят:

L(ε, ν) = ∑L(ν, a)ε(ν)η(a) (7)

ν,a

В этом случае задача статиста состоит в том, чтобы выбирать такую смешанную стратегию η*(a)€H, при котором его средние потери L(ε, η*) будут минимальными:

L(ε, η*) = min L(ε, η) (8)

η€H

В рассматриваем случае статистик определяет наилучшую стратегию действий только на основании имеющейся априорной информации о состоянии природы. Данный тип статистической игры называется статистической игрой без эксперимента.

Пример. Задача о замене оборудования. Установленные на ВЦ предприятия ЭВМ после К лет эксплуатации могут оказаться в следующем состоянии:

υ1 – ЭВМ вполне работоспособно и требует только небольшого текущего ремонта;

υ2 – некоторые устройства значительно износились и требуют серьезного ремонта или замены;

υ3 – основные устройства износились настолько, что дальнейшая эксплуатация ЭВМ невозможна.

Прошлый опыт эксплуатации технических средств ВЦ показывает, что 20% случаев оно может находиться в состоянии υ1, в 50% случаев в состоянии υ2 и в 30% случаев - υ3.

Для предприятия возможны три различных способа действия:

а1 – оставить ЭВМ в работе еще на год, проведя незначительный ремонт своими силами;

а2 – провести капитальный ремонт технических средств ВЦ с вызовом сторонних специалистов;

а3 – заменить технические средства ВЦ новыми.

Априорные вероятности состояний природы (технических средств ВЦ) и потери в задаче о замене оборудования приведены в таблице 1.

Таблица 1.

υ

ε(ν)

А

а1

а2

а3

υ1

υ2

υ3

0,2

0,5

0,3

1

5

7

3

2

6

5

4

3

В величину потерь входят стоимость ремонта или замены технических средств (ТС) ВЦ, а также убытки, связанные с неисправностями в ТС. В этой же таблице приведены априорные вероятности различных состояний ТС ВЦ (природы), т.е. смешенная стратегия природы ε(ν).

Для заданной смешанной стратегии ε(ν) средние потери при различных способах действия составят (5):

L(ε, a1) = ∑L(ν,a) ε(ν)=1*0,2+5*0,5+7*0,3=4,8;

ν

L(ε, a2)=3,4; L(ε, a3)=3,9.

Необходимо выбрать чистую стратегию а2 , при которой средние потери минимальны.