Добавил:

Mymnan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

Теория принятия решений

Файл:

ТПР. Всё в 1 файле / Прикладные Инст сист.pdf

Скачиваний:

303

Добавлен:

15.09.2014

Размер:

1.43 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2627 / 3627 28 29 30 31 32 33 34 35 36 > Следующая >>>

Лекция 16. Оценка многокритериальных альтернатив с помощью теории полезности

16.1. Теория полезности

Теория полезности – это раздел теории принятия решений, который связан с задачей измерения величины выигрыша лицом, принимающим решения. Полезность – это цена результата, величина, которую в процессе выбора максимизирует личность.

Задачи принятия решений с применением полезностей и вероятностей состоят в следующем: человек выбирает какие-то действия в условиях, когда на получаемый результат (исход) действия влияют случайные события. Имея некоторые знания о вероятностях этих событий, человек может рассчитать наиболее выгодный для себя вариант действий.

Известно, что в условиях рационального выбора, имеющего аксиоматическое обоснование, существует числовая функция полезности U, определенная на множестве исходов и имеющая следующие свойства [12]:

1)исход х предпочтительнее исхода у тогда и только тогда, когда U(x) ≥ U(y);

2)U(x, p, y) = р U(x) + (1 – р) U(y), р – вероятность исхода.

Отсюда следует, что нужно выбирать вариант (действие) с наибольшей полезностью.

16.2. Принятие решения на основе значения ожидаемой полезности

Рассмотрим задачу принятия решения на основе значения ожидаемой полезности. Исходные данные для задачи приведены в табл. 16.1. Лицу, принимающему решения, необходимо выбрать один из вариантов капиталовложений (А, В, не делать капиталовложений) при различных состояниях фондовой биржи: 1) индекс Доу–Джонса растет, 2) индекс Доу–Джонса падает, 3) индекс Доу–Джонса остается без изменений. Каждому из состояний фондовой биржи соответствуют вероятности 0,2; 0,3 и 0,5. В табл. 16.1 указаны значения выигрыша ЛПР при выборе любого из вариантов действия (знак минус означает проигрыш).

Таблица 16.1 Варианты капиталовложений при различных состояниях фондовой биржи

Возможные		Состояния фондовой биржи
альтернативы	Рост		Падение	Без изменений
	(р = 0,2)		(р = 0,3)	(р = 0,5)
Капиталовложения А	100000		– 40000	5000
Капиталовложения В	90000		– 50000	45000
Не делать капитало-	0		0	0
вложений

Используя платежную таблицу 16.1, припишем значения полезности наибольшему выигрышу (100000) и наибольшему проигрышу (– 50000). Абсолютная величина полезности не имеет значения, важно лишь то, чтобы наибольшему выигрышу соответствовала наибольшая величина полезности, а наименьшему выигрышу – наименьшая. Для простоты установим U(100000) = 10, U(–50000) = 0. Теперь мы можем определить величину полезности для каждого выигрыша в таблице. Для этого мы должны узнать у ЛПР, какой вариант из двух он предпочтет:

1.Гарантированный выигрыш 90000.

2.Лотерею с выигрышем 100000 с вероятностью р, либо проигрышем –50000 с вероятностью 1 – р. Лотереей называется игра с двумя исходами: исходом х, получаемым с вероятностью р, и исходом у, получаемым с вероятностью 1 – р.

Если р = 1, то ЛПР предпочтет лотерею, т.е. предпочтет выигрыш в 100000 выигрышу в 90000. Будем уменьшать величину р, пока не наступит состояние безразличия между двумя возможностями выбора. Поскольку вероятность р выиграть 100000 падает, а вероятность (1– р) проигрыша растет, то лотерея начинает выглядеть менее привлекательно. Наконец, будет достигнуто некоторое значение вероятности, при которой ЛПР больше не будет отдавать предпочтение лотерее и будет оставаться безразличным при выборе между двумя

вариантами действия. Это значение называется вероятностью безразличия Р .

Допустим, что ЛПР стало безразличным при Р = 0,95. Это означает, что ЛПР безразлично между гарантированным выигрышем 90000 и 95%-ным шансом выиграть

100000 (55%-ным шансом потерять 50000).

Теперь выберем следующий по величине выигрыш 45000 и повторим опыт. Зададим вопрос ЛПР, что он предпочтет: гарантированный выигрыш 45000 или лотерею с установленной вероятностью выигрыша 100000. Далее будем поступать, как в рассмотренном выше шаге, пока не наступит состояние безразличия. Пусть вероятность безразличия для 45000 равна 0,84.

Повторим эти действия для всех выигрышей табл. 16.1, устанавливая значение вероятности безразличия в каждом случае. Задав эти вероятности, мы можем определить величину полезности всех выигрышей. Полезность выигрыша U для наилучшего и наихудшего случая определится как

U(Выигрыша) = Р · U(100000) + (1 – Р )·U(–50000).

Полезность U(45000), которой соответствует вероятность безразличия 0,84, равна

U(45000) = 0,84·10 + (1 – 0,84) · 0 = 8,4.

Все вычисленные величины полезностей приведены в табл. 16.2.

Таблица 16.2

Значения полезностей и вероятностей безразличия

Выигрыш	Вероятность	Полезность
	безразличия
100000	–	10,0
90000	0,95	9,5
45000	0,84	8,4
5000	0,79	7,9
0	0,72	7,2
–40000	0,22	2,2
–50000	–	0

Подставляя эти значения полезностей в табл.16.1, получим табл. 16.3.

	Полезность выигрышей			Таблица 16.3
	Полезность выигрышей

Возможные		Состояния фондовой биржи
альтернативы	Рост		Падение	Без изменений
	(р = 0,2)		(р = 0,3)	(р = 0,5)
Капиталовложения А	10		2.2	7,9
Капиталовложения В	9,5		0	8,4
Не делать капитало-	7,2		7,2	7,2
вложений С

Теперь можно рассчитать ожидаемую полезность ЕU(·) каждого из вариантов капиталовложений:

ЕU(А) = 0,2 · 10 + 0,3 · 2,2 + 0,5 · 7,9 = 6,61, ЕU(В) = 0,2 · 9,5 + 0,3 · 0 + 0,5 · 8,4= 6,1, ЕU(С) = 0,2 · 7,2 + 0,3 · 7,2 + 0,5 · 7,2 = 7,2.

На основании этих значений ожидаемой полезности ЛПР может выбрать подходящую альтернативу, так как функция полезности является мерой относительного предпочтения для ЛПР.

На рис. 16.1 показаны функции полезности для трех типов ЛПР: 1) ЛПР, которое согласно рисковать, 2) ЛПР, которое избегает риска, 3) лицо, принимающее решения с нейтральным риском.

Полезность

	1
3	2

Выигрыш

Рис. 16.1. Функция полезности: 1 – для ЛПР, которое согласно рисковать, 2 – ЛПР, которое избегает риска, 3 – лицо, принимающее решения с нейтральным риском.

Кривая 1 имеет плоский участок, указывающий, что полезность не растет слишком быстро при высоких денежных значениях. Для кривой 2 (случай, когда ЛПР идет на рискованное предприятие) полезность возрастает, когда рискуют большими суммами. Для линейной функции полезности 3 доказано, что максимизация ожидаемого денежного выигрыша дает такое же решение, как и максимизация ожидаемой полезности. Если размер возможного выигрыша в задаче принятия решения на слишком большой, довольно часто используется линеаризация функции полезности вида 1 или 2, а затем применяется критерий Байеса (см. лекц. 24).

16.3. Многокритериальная теория полезности (MAUT)

Многокритериальная теория полезности MAUT (Multi-Attribute Utility Theory) представляет собой дальнейшее развитие теории полезности и позволяет решить следующие задачи [12]:

•построить функцию полезности, имеющую математическое обоснование;

•проверить в диалоге с ЛПР некоторые условия, определяющие форму этой функции;

•упорядочить по качеству все возможные альтернативы и произвести их оценку на основании найденного решающего правила.

Наиболее целесообразно применять методы MAUT для задач с большим числом альтернатив.

Основные этапы подхода MAUT. Перечислим этапы решения задачи с помощью многокритериальной теории полезности.

1.Разработать перечень критериев.

2.Построить функции полезности по каждому из критериев.

3.Проверить некоторые условия, определяющие общий вид функции полезности.

4.Построить зависимость между оценками альтернатив по критериям и общим качеством альтернативы.

5.Оценить все имеющиеся альтернативы и выбрать наилучшую.

Аксиоматическое обоснование [12]. Так же, как и классическая теория полезности, многокритериальная теория полезности имеет аксиоматическое обоснование. Условия, которым должна удовлетворять функция полезности, формулируются в виде аксиом. Если условия удовлетворяются, дается доказательство существования функции полезности. В MAUT эти условия можно разделить на две группы: 1) аксиомы общего характера, которые использовались в теории полезности и 2) аксиомы независимости, специфичные для MAUT.

Рассмотрим аксиомы первой группы.

1.Аксиома полноты, утверждающая, что может быть установлено отношение между полезностями любых альтернатив: либо одна из них превосходит другую, либо они равны.

2.Аксиома транзитивности: из превосходства полезности альтернативы А над полезностью альтернативы В и превосходства полезности В над полезностью С следует превосходство полезности альтернативы А над полезностью альтернативы С.

3.Для соотношений между полезностями альтернатив А, В, С, имеющими вид

U(А) > U(В) > U(С), 0 ≤ α ≤ 1; 0 ≤ β ≤ 1,

можно найти такие числа, что:

αU(А) + (1 – α) U(С) = U(В),

(1 – β) U(А) + β U(В) > U(В).

Аксиома 3 основана на предположении, что функция полезности непрерывна и что можно использовать любые малые части полезностей альтернатив.

Приведем несколько условий независимости, относящихся к аксиомам второй группы. 1. Независимость по разности. Предпочтения между двумя альтернативами, отличающимися лишь оценками по порядковой шкале одного критерия С1, не зависят от

одинаковых оценок по другим критериям С2, …, Ст.

2. Независимость по полезности. Критерий С1 называется независимым по полезности от критериев С2, …, Ст, если порядок предпочтения лотерей, в которых меняются лишь уровни критерия С1, не зависит от фиксированных значений по другим критериям.

3. Независимость по предпочтению. Два критерия С1 и С2 независимы по предпочтению от других критериев С3, …, Ст, если предпочтения между альтернативами, различающимися лишь оценками по С1, С2 не зависят от фиксированных значений по другим критериям.

Первые два условия независимости относились к независимости одного критерия от остальных, третье условие – к независимости пары критериев от прочих.

Основная теорема. Если аксиомы первой группы и некоторые условия независимости выполнены, то из этого следует строгий вывод о существовании многокритериальной функции полезности в определенном виде.

Можно сформулировать теорему, на которой основаны практические методы оценки альтернатив: если условия независимости по полезности и независимости по предпочтению выполнены, то функция полезности является аддитивной

m	m
U(х) = ∑wiUi (x) при	∑wi = 1
i=1	i=1
либо мультипликативной
m	m
1 + k U(х) =∏(1+ kwiwjUi (x)) при ∑wi ≠ 1,
i+1	i=1

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2627 / 3627 28 29 30 31 32 33 34 35 36 > Следующая >>>

Соседние файлы в папке ТПР. Всё в 1 файле

#
15.09.2014150.53 Кб39Контрольная работа!!!!!!.doc
#
15.09.201428.24 Кб35Контрольная работа.docx
#
15.09.2014409.73 Кб94Математ_методы_диагностики_в_м.pdf
#
15.09.20142.15 Mб201Нейрокомпьютеры.pdf
#
15.09.20141.43 Mб303Прикладные Инст сист.pdf
#
15.09.2014125.44 Кб33Рабочая программа ТПР заочное 2010.doc