Добавил:

Mymnan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

Теория принятия решений

Файл:

ТПР. Всё в 1 файле / Прикладные Инст сист.pdf

Скачиваний:

303

Добавлен:

15.09.2014

Размер:

1.43 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 3031 / 3631 32 33 34 35 36 > Следующая >>>

C(Ai , Aj ),если dk (Ai , Aj ) ≤ C(Ai , Aj ), k;

δ(Ai Aj ) = C(Ai , Aj ) ∏ 1−dk (Ai , Aj ); j I * 1−Ck (Ai , Aj )

Здесь I* – множество критериев, для которых dk (Ai , Aj ) > C(Ai , Aj ) .

Величину δ(Ai Aj ) можно интерпретировать как меру уверенности в справедливости

гипотезы о том, что Аi предпочтительнее Аj.	На этом этапе сначала определяется
Этап исследования альтернатив [12].	На этом этапе сначала определяется
λ = max δ(Ai Aj ) . Устанавливается достаточно	близкий к λmax уровень, при котором
Ai , Aj

принимается гипотеза о превосходстве альтернативы Аi над Аj. Далее для каждой альтернативы Аi подсчитываются два индекса:

•индекс «силы» – число альтернатив, доминируемых Аi;

•индекс «слабости» – число альтернатив, доминирующих Аj.

Альтернативе Аi присваивается характеризующее ее число, равное разности индексов «силы» и «слабости».

Затем строится сверху вниз первый полный порядок альтернатив, аналогично тому, как делается в методе ELECTRE II. Альтернативы с наибольшим значением λ удаляются, для оставшихся опять выделяется ядро на основе подсчета тех же числе и т.д. Другой порядок определяется при подходе снизу вверх. На основе полных двух порядков строится средний, аналогично тому, как делается в методе ELECTRE II.

Лекция 20. Основные понятия и математическая модель игровых методов обоснования решений

20.1. Основные понятия теории игр

В практической деятельности часто приходится рассматривать явления и ситуации, в которых участвуют две или более стороны, имеющие различные цели и обладающие возможностями применять для достижения своих целей разнообразные действия. Такие ситуации принято называть конфликтными (или конфликтами).

Типичный конфликт характеризуется тремя основными составляющими:

1)заинтересованными сторонами,

2)возможными действиями сторон,

3)интересами сторон.

Примеры конфликтных ситуаций весьма многообразны: военные действия, экономика, судопроизводство, спорт и т.д.

Необходимость изучения и анализа таких ситуаций, представляемых в виде упрощенных математических моделей, вызвала к жизни специальный математический аппарат – теорию игр. Теория игр – это математическая теория конфликтных ситуаций.

Опишем некоторые понятия, используемые в этой теории.

Игра – это математическая модель конфликтной ситуации, возникающей при взаимодействии двух или более оперирующих сторон, которые имеют несовпадающие интересы. Заинтересованные стороны называются игроками, исход конфликта (результат игры) – выигрышем.

От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Правила – это система условий, которые определяют:

•возможные варианты действий игроков,

•объем информации каждой стороны о поведении другой,

•результат (исход) игры, к которому приводит каждая совокупность действий.

Игра носит название антагонистической, если число игроков равно двум, а выигрыш одного из игроков равен проигрышу другого (игра с нулевой суммой).

Ходом в теории игр называется выбор одно из предусмотренных правилами игры действий и его осуществление.

Стратегия игрока – это совокупность правил, определяющих выбор варианта действий при каждом ходе игрока в зависимости от ситуации, сложившейся в ходе игры.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш).

20.2. Математическая модель игры

Рассмотрим игру, в которой игрок А имеет т стратегий: А1, А2,…, Ат, а игрок В – п стратегий: В1, В2,…, Вп.

Пусть игрок А выбрал стратегию Аi, а игрок В – стратегию Вk. Будем считать, что выбор игроками стратегий Аi и Вk однозначно определяет исход игры – выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

bik = –аik.

Последнее условие показывает, что выигрыш одного из игроков равен выигрышу другого, взятому с противоположным знаком. Поэтому при анализе такой игры можно рассматривать выигрыши только одного из игроков. Пусть это будут выигрыши игрока А.

Если нам известны значения аik выигрыша при каждой паре стратегий {Аi, Вk}, i = 1, 2,... m, k = 1, 2, …, п, то их удобно записывать

или в виде прямоугольной таблицы, строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В,

В1

В2

…

Вп

А1

а11

а12

…

а1п

А2

а21

а22

…

а2п

…

. . . .

. . . . . . . . . . . .

Ат

ат1

ат2

…

атп

или в виде матрицы

a11 a12

... a1n

А =

... a

.....................

am1 am2 ... amn

Полученная матрица имеет размер т х п и называется матрицей игры или платежной матрицей. Рассматриваемую игру называют т х п или т х п – игрой.

Пример 20.1. Каждый из двух игроков А и В одновременно и независимо записывают на листе бумаги любое целое число. Если записанные числа имеют разную четность, то игрок А получает от игрока В 1 руб., а если одинаковую, то, наоборот, игрок А платит игроку

В1 руб.

Уигрока А две стратегии: А1 – записать четное число и А2 – записать нечетное число.

У игрока В такие же две стратегии: В1 – записать четное число и В2 – записать нечетное число.

Выбор игроками соответственно стратегий Аi и Вk однозначно определяет исход игры:

аik – выигрыш игрока А.

Матрица (2 х 2)-игры имеет следующий вид:

−11 −11 .

В этой матрице строки соответствуют стратегиям игрока А, а столбцы – игрока В.

20.3. Нижняя и верхняя цена игры. Принцип минимакса

Рассмотрим произвольную матричную игру:

a11 a12 ... a1n

А= a21 a22 ... a2n

.....................

am1 am2 ... amn

иопишем алгоритм, с помощью которого можно определить наилучшую стратегию [5,28]. В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к

получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом.

Действия игрока А.

1-й шаг. В каждой строке матрицы А находится минимальный элемент

αi = min аik, i = 1, 2,... m.

Полученные числа

α1, α2,…, αт

приписываются к заданной таблице в виде правого добавочного столбца:

		а11	а12	…	а1п	α1
		а21	а22	…	а2п	α2
		. . .	. . .	. . .	. . .	. . .
		ат1	ат2	… атп		αт
Выбирая стратегию Аi, игрок			А должен рассчитывать на то, что в результате разумных
действий игрока В он выиграет не меньше, чем αi.
2-й шаг. Среди чисел
α1, α2,…, αт
выбирается максимальное число
α = max αi,
	i
или α = max min аik.
i	k

Выбранное число α является одним из элементов заданной матрицы А.

Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок А должен остановиться на той стратегии Аi, для которой число αi является максимальным.

Если игрок А будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока В игроку А гарантирован выигрыш, не меньший α.

Число α называется нижней ценой игры.

Принцип построения стратегии игрока А, основанный на максимизации минимальных выигрышей, называется принципом максимина, а выбираемая в соответствии с эти принципом стратегия Ai0 – максиминной стратегией игрока А.

Действия игрока В.

1-й шаг. В каждой строке матрицы А находится максимальный элемент

βk = max аik, k = 1, 2, …, п.

Полученные числа

β1, β2,…, βп

приписываются к заданной таблице в виде нижней добавочной стоки:

а11	а12	…	а1п	α1
а21	а22	…	а2п	α2
. . .	. . .	. . .	. . .	. . .
ат1	ат2	… атп		αт
β1	β2	…	βп

Выбирая стратегию Вk, игрок В должен рассчитывать на то, что в результате разумных

действий игрока А он проиграет не больше, чем βk. 2-й шаг. Среди чисел

β1, β2,…, βп

выбирается минимальное число

β = min βk, k

или β = min max аik. k i

Выбранное число β является одним из элементов заданной матрицы А.

Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок В должен остановиться на той стратегии Вk, для которой число βk является минимальным.

Если игрок В будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока А игроку В гарантирован выигрыш, не больший β.

Число β называется верхней ценой игры.

Принцип построения стратегии игрока В, основанный на минимизации максимальных потерь, называется принципом минимакса, а выбираемая в соответствии с эти принципом стратегия Вk 0 – минимаксной стратегией игрока В.

Нижняя цена игры α и верхняя цена игры β всегда связаны неравенством α ≤ β. Если α = β, или

max min аik = min max аik.
i k	k i

то ситуация ( Ai0 , Вk 0 ) оказывается равновесной и ни один из игроков не заинтересован

втом, чтобы ее нарушить.

Втом случае, когда нижняя цена игры равна верхней цене игры, их общее значение называется чистой ценой игры и обозначается через ν.

Цена игры совпадает с элементом aiok o матрицы игры А, расположенным на пересечении io-й строки (стратегия Ai0 игрока А) и ko-го столбца (стратегия Вk 0 игрока В), –

минимальным в своей строке и максимальным в своем столбце.

Этот элемент называют седловой точкой матрицы А или точкой равновесия, а про игру говорят, что она имеет седловую точку.

Стратегии Ai0 и Вk 0 , соответствующие седловой точке, называются оптимальными, а

совокупность оптимальных ситуаций и цена игры – решением матричной игры с седловой точкой.

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 3031 / 3631 32 33 34 35 36 > Следующая >>>

Соседние файлы в папке ТПР. Всё в 1 файле

#
15.09.2014150.53 Кб39Контрольная работа!!!!!!.doc
#
15.09.201428.24 Кб35Контрольная работа.docx
#
15.09.2014409.73 Кб94Математ_методы_диагностики_в_м.pdf
#
15.09.20142.15 Mб201Нейрокомпьютеры.pdf
#
15.09.20141.43 Mб303Прикладные Инст сист.pdf
#
15.09.2014125.44 Кб33Рабочая программа ТПР заочное 2010.doc