Интеллектуальные информационные системы

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ставропольский государственный педагогический институт

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

p(E1|Hi ) × p(E2

|H i)×Κ × p(En|Hi ) × p(H i)

p(Hi |E1E2Κ En) =

å p(E1|H k ) × p(E2|H k )×Κ × p(En|H k ) × p(H k )

.pdf

Скачиваний:

116

Добавлен:

19.02.2016

Размер:

1.61 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1912 13 14 15 16 17 18 19 > Следующая >>>

Эти вероятностные интерпретации используют и различные схе- мы вывода. Однако существует всего две школы вероятностных рас- четов: школа Паскаля (или общепринятая), школа Бэкона (или ин- дуктивная). Расчеты по Паскалю используют байесовские правила для проверки и обработки мер доверия. Вычисления по Бэкону ис- пользуют правила логики для доказательства или опровержения ги- потез. Таким образом, общепринятые вероятности (по Паскалю) не могут быть получены из индуктивных вероятностей (по Бэкону) и, наоборот. Объективистский и субъективный взгляды используют расчеты по Паскалю. Те, кто поддерживают логические выводы, ис- пользуют расчеты по Бэкону.

Существуют ЭС, построенные на обоих из этих направлений. Од- нако в ЭС базы знаний накапливают человеческие знания, поэтому для представления знаний экспертов с учетом вероятностей наибо-

лее подходящими являются интерпретация на основе субъективных доверий. В результате чего и большинство современных ЭС, исполь- зующих теорию вероятностей, являются «байесовскими».

Байесовское оценивание

Перед тем, как ввести теорему Байеса, рассмотрим некоторые фундаментальные понятия теории вероятностей. Пусть А некоторое событие реального мира. Совокупность всех элементарных событий

называется выборочным пространством или пространство событий (Ω). Вероятность события А обозначается р(А,) и каждая вероятно- стная функция р должна удовлетворять трем аксиомам:

1. Вероятность любого события А является неотрицательной, т.е. p(A) ³ 0 для "A ÎW

2. Вероятность всех событий выборочного пространства равна 1, т.е. p(Ω) = 1.

3. Если k событий А1, А2, …, Аk являются взаимно независимыми (т.е. не могут подойти одновременно), то вероятность, по крайней мере, од- ного из этих событий равна сумме отдельных вероятностей, или

		k
p(A1 È A2 È ...	È Ak )	= å p(Ai)
		i=1
Аксиомы 1 и 2 можно объединить, что дает
1 ³ p(A) ³ 0	для	"A ÎW .

111

Это утверждение показывает, что вероятность любого события находится между 0 и 1. По определению, когда р(А) = 0, то событие

Аникогда не произойдет. В том случае и когда р(А) = 1, то событие

Адолжно произойти обязательно.

Дополнение к А, обозначаемое (¬A), содержит совокупность всех событий в W за исключением А. Т.к. А и ¬A являются взаимонезави- симыми (т.е. А È ¬A= W), то из аксиомы 3 следует:

р(А) + р(¬A) = р(А È ¬A) = р(W ) = 1 .

Переписывая это равенство в виде р(¬A) = 1 – р(А), мы получает путь для получения р(¬A) из р(А).

Предположим теперь, что В Î W некоторое другое событие. Тогда вероятность того, что произойдет А при условии, что произошло В записывается в виде р(А | B) и называется условной вероятностью события А при заданном событии В.

Вероятность того, что оба события А и В произойдут р(АÇВ) на-

зывается совместной вероятностью событий А и В. Условная веро-

ятность р(А|B) равна отношению совместной вероятности р(АÇВ) к вероятности события В, при условии, что она не равна 0, т. е.

p(A|B) = p(A Ç B) p(B)

Аналогично условная вероятность события В при условии А, обо- значаемая р(В | А) равна:

p(B|A) = p(B Ç A) p(A)

и таким образом

p(B Ç A) = p(B|A) ´ p(A) .

Так, как совместная вероятность коммутативна (т.е. от переста- новки мест сумма не меняется), то

p(A Ç B) = p(B Ç A) = p(B|A) ´ p(A) .

Подставляя это равенство в ранее полученное выражение для ус- ловной вероятности р(А| В ) получим правило Байеса:

p(A|B) = p(B|A) ´ p(A) . p(B)

В ряде случае наше знание того, что произошло событие В, не влияет на вероятность события А (или наоборот А на В). Другими

112

словами, вероятность события А не зависит от того, что произошло или нет событие В, так что

р(А | В) = р(А) и р(В | А) = р(В) .

В этом случае говорят, что события А и В являются независимыми.

Теорема Байеса как основа управления неопределенностью

Приведенные выше соотношения предполагают определенную связь между теорией вероятностей и теорией множеств. Если А и В являются непересекающимися множествами, то объединение мно- жеств соответствует сумме вероятностей, а пересечение – произве- дению вероятностей, т. е.

р(А È В) = р(А) + р(В) и р(А Ç В) = р(А) * р(В)

Без предположения независимости эта связь является неточной и формулы должны содержать дополнительные члены включения и исключения (так например, р(АÈВ)=р(А)+р(В)–р(АÇВ) ). Продолжая теоретико – множественное обозначение В можно записать как:

В = (В Ç А) È (В Ç ¬A)

Так как это объединение явно непересекающееся, то:

р(В)=р((ВÇА)È(ВÇ¬A))=р(ВÇА)+ р(ВÇ¬A) = р(В|А) р(А) + р(В|¬A)р(В)

Возвращаясь к обозначению событий, а не множеств, последнее равенство может быть подставлено в правило Байеса:

p(B|A) × p(A)

p(A|B) = p(B|A) × p(A) + P(B|¬A) × p(¬A) .

Это равенство является основой для использования теории веро- ятности в управлении неопределенностью. Оно обеспечивает путь для получения условной вероятности события В при условии А. Это соотношение позволяет ЭС управлять неопределенностью и «делать вывод вперед и назад».

2.8. Логический вывод на основе субъективной вероятности

Простейший логический вывод

Рассмотрим случай, когда все правила в экспертной системе от- ражаются в форме:

если < H является истинной >, то <E будет наблюдаться с ве- роятностью р>.

113

Очевидно, если H произошло, то это правило говорит о том, что событие E происходит с вероятностью p. Но что будет, если состоя- ние H неизвестно, а E произошло? Использование теоремы Байеса позволяет вычислить вероятность того, что H истинно. Замена «A» и «B» на «H» и «E» не существенна для формулы Байеса, но с её по-

мощью мы можем покинуть общую теорию вероятности и перейти к анализу вероятностных вычислений в ЭС. В этом контексте:

H – событие, заключающееся в том, что данная гипотеза верна; E – событие, заключающееся в том, что наступило определён- ное доказательство (свидетельство), которое может подтвердить

правильность указанной гипотезы.

Переписывая формулу Байеса в терминах гипотез и свидетельств, получим:

p(E|H ) × p(H )

p(H |E) = p(E|H ) × p(H ) + p(E|¬H ) × p(¬H ) .

Это равенство устанавливает связь гипотезы со свидетельством и, в то же время наблюдаемого свидетельства с пока ещё не подтвер- ждённой гипотезой. Эта интерпретация предполагает также опреде- ление априорной вероятности гипотезы p(H), назначаемой H до на- блюдения или получения некоторого факта.

В экспертных системах вероятности, требуемые для решения не- которой проблемы, обеспечивается экспертами и запоминается в ба- зе знаний. Эти вероятности включают:

априорные вероятности всех возможных гипотез p(H);

условные вероятности возникновения свидетельств при условии существования каждой из гипотез p(E | H).

Так, например, в медицинской диагностике эксперт должен задать априорные вероятности всех возможных болезней в некоторой ме- дицинской области. Кроме того, должны быть определены условные вероятности проявления тех или иных симптомов при каждой из бо- лезней. Условные вероятности должны быть получены для всех симптомов и болезней, предполагая, что все симптомы независимы в рамках одной болезни.

Два события E1 и E2 являются условно независимыми, если их со- вместная вероятность при условии некоторой гипотезы H равна произ- ведению условных вероятностей эти событий при условии H, то есть

p(E1 E2 | H) = p(E1| H) × p(E2 | H).

114

Пользователи дают ЭС информацию о наблюдениях (наличии оп- ределённых симптомов) и ЭС вычисляет p(Hi|Ej ... Ek) для всех гипо- тез (H1, ...,Hm) в свете предъявленных симптомов (Ej, ...,Ek) и вероят- ностях, хранимых в БЗ.

Вероятность p(Hi | Ej ... Ek) называется апостериорной вероятно- стью гипотез Hi по наблюдениям (Ej, ...,Ek). Эти вероятности дают сравнительное ранжирование всех возможных гипотез, то есть гипо- тез с ненулевыми апостериорными вероятностями. Результатом вы- вода ЭС является выбор гипотезы с наибольшей вероятностью.

Однако приведённая выше формула Байеса ограничена в том, что каждое свидетельство влияет только на одну гипотезу. Можно обобщить это выражение на случай множественных гипотез (H1,

...,Hm) и множественных свидетельств (E1, ..., En). Вероятности каж-

дой из гипотез при условии возникновения некоторого конкретного

свидетельства E можно определить из выражения:
	p(E\|H i ) × p(H i )
p(H i \|E) =	p(E\|H i ) × p(H i )	,	i = 1, m .
p(H i \|E) =	m	,	i = 1, m .
	å p(E\|H k ) × p(H k )

k=1

ав случае множественных свидетельств:

	p(E1E2Κ En	\|H i ) × p(H i )
p(H i \|E1E2Κ En ) =	p(E1E2Κ En	\|H i ) × p(H i )	,	i = 1, m .
p(H i \|E1E2Κ En ) =	m		,	i = 1, m .
	å p(E1E2Κ En \|H k ) × p(H k )

k=1

Ксожалению, данное выражение имеет ряд недостатков. Так,

знаменатель требует от нас знания условных вероятностей всех воз- можных комбинаций свидетельств и гипотез, что делает правило Байеса малопригодным для ряда приложений. Однако в тех случаях, когда возможно предположить условную независимость свиде- тельств, правило Байеса можно привести к более простому виду:

k =1

Вместе с тем предположения о независимости событий в ряде случаев подавляют точности суждений и свидетельств в ЭС.

Распространение вероятностей в ЭС

115

Вероятности событий распространяются по БЗ экспертной систе-

мы на основе правила Байеса для вычисления всех апостериорных вероятностей гипотез при условии наблюдаемых свидетельств. Эти

апостериорные вероятности дают ранжированную информацию о потенциально истинной гипотезе. Рассмотрим пример, иллюстри- рующий этот процесс.

Пример. Предположим, что в некоторой БЗ имеется всего три вза- имно независимых гипотезы: H1, H2, H3, которые имеют априорные вероятности: p(H1), p(H2), p(H3), соответственно. Правила БЗ содер- жат два условно независимых свидетельства, которые поддерживают исходные гипотезы в различной степени. Априорные и условные ве- роятности всех гипотез и свидетельств этого примера имеют сле- дующие значения:

				При этом исходные гипотезы
p() i	1	2	3
				характеризуют событие, связан-
p(Hi)	0,5	0,3	0,2
				ное с определением надежности
p(E1\|Hi)	0,4	0,8	0,3
				некоторой фирмы:
p(E2\|Hi)	0,7	0,9	0,0

H1 – средняя надежность фирмы,

H2 – высокая надежность фирмы,

H3 – низкая надежность фирмы.

Событиями, являющимися условно независимыми свидетельства- ми, поддерживающими исходные гипотезы являются: Е1 – наличие прибыли у фирмы и Е2 – своевременный расчет с бюджетом.

В процессе сбора фактов вероятности гипотез будут повышаться, если факты поддерживают их или уменьшаться, если опровергают их. Предположим, что мы имеем только одно свидетельство E1 (то есть с вероятностью единица наступил факт E1). Наблюдая E1, мы вычисляем апостериорные вероятности для гипотез согласно форму- ле Байеса для одного свидетельства:

p(H i \|E1) =		p(E1\|H i ) × p(H i )		,		i = 123,, .
p(H i \|E1) =		3		,		i = 123,, .
		å p(E1\|H k ) × p(H k )
Таким образом:		k =1
Таким образом:		0,4 × 0,5
p(H1\|E1) =		0,4 × 0,5				= 0,40 ,
p(H1\|E1) =	0,4 × 0,5 + 0,8 × 0,3		+ 0,3		× 0,2	= 0,40 ,
	0,4 × 0,5 + 0,8 × 0,3		+ 0,3		× 0,2
		116

p(H2	\|E1) =		0,8	× 0,3	= 0,48		,
		0,4	× 0,5 + 0,8	× 0,3 + 0,3 × 0,2

p(H3	\|E1) =		0,3	× 0,2		= 012, .
		0,4	× 0,5 + 0,8	× 0,3 + 0,3 × 0,2

После того как E1 произошло доверие к гипотезам H1 и H3 пони- зилось, в то время как доверие к H2 возросло. В тех случаях, когда имеются факты, подтверждающие как событие E1, так и событие E2,

то апостериорные вероятности исходных гипотез также могут быть вычислены по правилу Байеса:

p(H	\|E E	) =	p(E1E2\|Hi ) × p(H i )	,	i = 12,,3 .
p(H	\|E E	) =	3	,	i = 12,,3 .
i	1 2		3
			å p(E1E2\|H k ) × p(H k )

k =1

Так как события E1 и E2 условно независимые при данных гипоте- зах Hi, то формулу Байеса можно переписать в виде:

	p(H	\|E E		) =		p(E1\|H i ) × p(E2\|H i ) × p(H i)	,	i = 12,,3 .
	p(H	\|E E		) =		3	,	i = 12,,3 .
	i	1 2				3
						å p(E1\|H k ) × p(E2\|H i ) × p(H k )
Откуда:						k =1
Откуда:						0,4 × 0,7 × 0,5
p(H1\|E1E2) =						0,4 × 0,7 × 0,5			= 0393,	,
p(H1\|E1E2) =			0,4		× 0,7 × 0,5 + 08, × 0,9 × 0,3 + 03, × 0,0			× 0,2	= 0393,	,
			0,4		× 0,7 × 0,5 + 08, × 0,9 × 0,3 + 03, × 0,0			× 0,2
p(H2	\|E1E2) =					0,8 × 09, × 03,			= 0607,	,
p(H2	\|E1E2) =		0,4		× 0,7 × 0,5 + 08, × 0,9 × 0,3 + 03, × 0,0			× 0,2	= 0607,	,
			0,4		× 0,7 × 0,5 + 08, × 0,9 × 0,3 + 03, × 0,0			× 0,2
p(H3	\|E1E2) =					0,3 × 09, × 02,			= 00, .
p(H3	\|E1E2) =		0,4		× 0,7 × 0,5 + 08, × 0,9 × 0,3 + 03, × 0,0			× 0,2	= 00, .
			0,4		× 0,7 × 0,5 + 08, × 0,9 × 0,3 + 03, × 0,0			× 0,2

Хотя исходным ранжированием было H1, H2, и H3, только H1 и H2 остались после получения свидетельств E1 и E2. При этом H1, более вероятно, чем H2. На этом примере мы рассмотрели процесс распро-

странения вероятностей по элементам ЭС при поступлении в неё тех или иных свидетельств.

Последовательное распространение вероятностей

Однако реально распространение вероятностей происходит по-

этапно с суммированием отдельных свидетельств и их влияния на условную вероятность по мере поступления отдельных Ei. Это мож- но сделать, используя априорные и апостериорные вероятности, сле- дующим образом:

117

1.Задаём p(Hi) – априорную вероятность событий Hi.

2.Для полученных свидетельств Ej записываем p(Ej | Hi ).

3.С учётом теоремы Байеса подсчитываем p(Hi | Ej ) в зависимости от исхода Ej, то есть вычисляем апостериорную вероятность события Hi.

4.Теперь можно не обращать внимания на все наступившие Ej и переобозначить текущую апостериорную вероятность события Hi, как новую априорную вероятность Hi. Итак, пусть p(Hi) равна

p(Hi|Ej) в зависимости от значения Ej.

5. Затем выберем новое свидетельство для рассмотрения и перей- дём к п.2.

Проиллюстрируем эту последовательность на приведенном выше примере в предположении, что сначала поступило свидетельство E2.

Тогда

p(H1\|E2 ) =				0,7	× 0,5	= 0,565	,
		0,7	× 0,5	+ 0,9	× 0,3 + 0,0 × 0,2

p(H2	\|E2 ) =			0,9 × 0,3		= 0,435	,
		0,7	× 0,5	+ 0,9 × 0,3 + 0,0 × 0,2

p(H3	\|E2 ) =			0,0 × 0,2		= 0,0 .
		0,7	× 0,5	+ 0,9 × 0,3 + 0,0 × 0,2

Полученные вероятности можно принять за новые апостериорные вероятности гипотез H1, H2, и H3, то есть

~	~	2 ) = 0,435 ,	~	3 ) = 0,0
p(H1) = 0,565 ,	p(H	2 ) = 0,435 ,	p(H	3 ) = 0,0

И если теперь дополнительно поступит свидетельство E2, то но-

вые апостериорные вероятности гипотез могут быть вычислены только на основе вновь поступившего свидетельства:

p(H

~
1\|E1E2 ) = p(H1\|E1) =
~		\|E2 ) =
2\|E1E2) = p(H	2
~		\|E2 ) =
3\|E1E2) = p(H	3

0,4 × 0,565			= 0,393	,
0,4 × 0,565 + 0,8 × 0,435 + 0,3 × 0,0
0,8 × 0,435			= 0,607	,
	0,4 × 0,565 + 0,8	× 0,435 + 0,3 × 0,0
0,3		× 0,0	= 0,0 .
	0,4 × 0,565 + 0,8	× 0,435 + 0,3 × 0,0

Из приведенного примера видно, что итерационная процедура по-

следовательного распределения вероятностей по мере поступления свидетельств позволяет получить результаты аналогичные непо- средственному применению правила Байеса для случая одновремен- ного двух поступивших свидетельств.

118

2.9. Байесовские сети доверия как средства разработки экспертных систем

Основные понятия и определения

Сети доверия — это новый инструмент для решения перечислен- ных проблем, в которых регулируются информационные потоки. При представлении информации в базе знаний при помощи байесов- ских сетей можно создать согласованную и непротиворечивую веро- ятностную базу знаний без необходимости в предположении услов- ной независимости.

Байесовские сети доверия – Bayesian Belief Network – использу- ются в тех областях, которые характеризуются наследованной неоп- ределённостью. Эта неопределённость может возникать вследствие:

неполного понимания предметной области; неполных знаний; когда задача характеризуется случайностью.

Таким образом, байесовские сети доверия (БСД) применяют для моделирования ситуаций, содержащих неопределённость в некото- ром смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случай- ные события соединены причинно-следственными связями.

Соединения методом причин и следствий позволяют более просто оценивать вероятности событий. В реальном мире оценивание наи- более часто делается в направлении от “наблюдателя” к “наблюде- нию”, или от “эффекта” к “следствию”, которое в общем случае бо- лее сложно оценить, чем направление “следствие –> эффект”, то есть в направлении от следствии.

Рассмотрим пример сети (рисунок 2.9), в которой вероятность пребывания вершины «e» в различных состояниях (ek) зависит от со- стояний (ci, dj) вершин «c» и «d» и определяется выражением:

p(ek ) = åå p(ek |ci ,dj ) × p(ci , dj )

i j

где p(ek | ci, dj) – вероятность пребывания в состоянии ek в зависи- мости от состояний ci, dj. Так как события, представленные верши- нами «c» и «d» независимы, то:

p(ek | ci, dj) = p(ci) × p(dj).

Рассмотрим пример более сложной сети (рисунок 2.10). Данный рисунок иллюстрирует условную независимость событий. Для оцен-

119

ки вершин «c» и «d» используются те же выражения, что и для вы- числения p(ek), тогда

p(ci ) = åå p(ci |A1m , B1n ) × p(A1m ) × p(B1n ) ,

m n

p(dj ) = åå p(dj |A2m , B2n ) × p(A2m ) × p(B2n ) .

m n

Из этих выражений видно, что вершина «e» условно не зависит от вершин A1, A2, B1, B2, так как нет стрелок непосредственно соеди- няющих эти вершины.


		Рассмотрев эти		примеры,

c	d	попробуем теперь более точно
		определить	основные		поня-

		тия, используемые в БСД.
e		Байесовские сети доверия —
		это направленный		ацикличе-
		ский граф, обладающий сле-
		дующими свойствами:
Рисунок 2.9. Пример
		каждая	вершина		пред-
простейшей байесовской
сети доверия.		ставляет	собой	событие,

описываемое случайной ве- личиной, которая может иметь несколько состояний;

все вершины, связанные с “родительскими” определяются табли-

цей условных		вероят-
ностей (ТУВ)		или	A 1	B 1	A2	B2
функцией условных ве-			A 1	B 1	A2	B2
функцией условных ве-
роятностей (ФУВ);
для вершин без “ро-				c	d
дителей”	вероятности			c	d
дителей”	вероятности
её состояний являются					e
безусловными		(марги-			e
безусловными		(марги-
нальными).
нальными).			Рисунок 2.10. Двухуровневая
Другими	словами, в		Рисунок 2.10. Двухуровневая
Другими	словами, в				БСД.
байесовских сетях до-					БСД.
байесовских сетях до-

верия вершины представляют собой случайные переменные, а дуги – вероятностные зависимости, которые определяются через таблицы условных вероятностей. Таблица условных вероятностей каждой вершины содержит вероятности состояний этой вершины при усло- вии состояний её “родителей”.

120

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1912 13 14 15 16 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.02.201645.06 Кб18заходи Добрик.doc
#
19.02.2016499.2 Кб27Збірка Добрик.doc
#
19.02.2016288.77 Кб9Земельное право.DOC
#
19.02.201621.64 Кб97Игрушки для детей раннего возраста.docx
#
19.02.201646.08 Кб26Игры на знакомство и сплочение.doc
#
19.02.20161.61 Mб116Интеллектуальные информационные системы.pdf
#
12.09.20191.85 Mб17Информатика, ДЗ на 24.04.12.doc
#
19.02.201647.44 Кб14Информатика.docx
#
19.02.2016765.44 Кб9История мира Warcraft.doc
#
19.02.2016484.67 Кб32История.pdf
#
19.02.201612.3 Кб61КАРТОЧКА.docx

свидетельства E можно определить из выражения:
	p(E\|H i ) × p(H i )
p(H i \|E) =	p(E\|H i ) × p(H i )	,	i = 1, m .
p(H i \|E) =	m	,	i = 1, m .
	å p(E\|H k ) × p(H k )

~
1\|E1E2 ) = p(H1\|E1) =
~		\|E2 ) =
2\|E1E2) = p(H	2
~		\|E2 ) =
3\|E1E2) = p(H	3