БАЙЕСОВСКИЕ СЕТИ КАК ИНСТРУМЕНТАЛЬНОЕ
СРЕДСТВО РАЗРАБОТКИ ЭКСПЕРТНЫХ СИСТЕМ
Байесовские сети доверия
2.1.1. Основные понятия и определения
Байесовские сети доверия (Bayesian Belief Network) — это направленный анали-тический граф, обладающий следующими свойствами:
каждая вершина представляет случайную величину, которая может иметь несколько состояний;
все вершины, связанные с «родительскими» определяются таблицей условных вероятностей (ТУВ) или функцией условных вероятностей (ФУВ);
для вершин без «родителей» вероятности её состояний являются безусловным (мар-гинальными).
Другими словами, в байесовской сети доверия вершины представляют случайные переменные, а дуги – вероятностные зависимости, которые определяются через таблицы условных вероятностей. Таблица условных вероятностей каждой вершины содержит вероятности состояний этой вершины при условии состояний её «родителей».
Байесовские сети доверия используются в тех областях, которые характеризуются наследованной неопределённостью. Эта неопределённость может возникать в следствие неполного понимания предметной области, неполных знаний и когда задача характеризуется случайностью.
Таким образом, байесовские сети доверия применяют для моделирования ситуаций, содержащих неопределённость в некотором смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случайные события соединены причинно-следственными связями.
Соединения методом причин и следствий позволяют более просто оценивать вероятности событий. В реальном мире оценивание наиболее часто делается в направлении от «наблюдателя» к «наблюдателю», или от «эффекта» к «следствию», которое в общем случае более сложно оценить, чем направление «следствие
эффект», то есть в направлении от следствия.
Если две вершины сети соединены дугой, то подразумевается, что нам известны условные вероятности состояний вершины(наследника), в которую входит данная дуга, при определённом состоянии вершины(родителя), из которой данная дуга исходит. Когда вершина имеет несколько родителей, то задаются условные вероятности состояния вершины - наследникапри определённой комбинации сос-тояний вершин-родителей.
Вероятности состояний каждой вершины рассчитываются по формуле полной вероятности:
m
P( ck ) = ∑ p(ck | Aj) ∙ P(Aj) (2.1)
j = 1
где
Aj = a1 xj ∩ a2 xj ∩…∩ aN xj - j-ое сочетание состояний родительских вершин-шансов;
m - количество таких сочетаний;
N - число вершин-родителейвершины С;
p(ck | Aj ) - значение из таблицыусловных вероятностей вершины С, соответствую-щее j-ому сочетанию состояний вершин - родителей.
Расчёт может проводится и в обратном ориентации дуг направлении. Так , если вер-
шина A - родительская для C, то вероятности её состояний при изменившихся вероят-ностях состояний наследника вычисляются по формуле полной вероятности следую-щим образом:
m
P( ak ) = ∑ p(ak | c j) ∙ P(c j) , гдеa k иc j - состояния этих вершин.
j = 1
Условные вероятности p(ak | c j) рассчитываются по формуле Байеса:
n
p(ak | c j) = p(c j | a k) ∙ P(a k) / ∑ p(c i | a k) ∙ P(a k) , где
i = 1
p(c j | a k) - вероятности из ТУВ, P(a k) - априорная вероятность состоянияa k .
Формула Байеса для расчёта апостериорных вероятностей в общем случае:
m
p( hk | E) = p(E | h k) ∙ P(h k) / ∑ p(E | h k) ∙ P(h k) (2.2)
i = 1
где
hi - i -ое состояние исследуемой вершины, вероятность которого рассчи-
тывается;
m - число состояний вершины Н;
E - набор поступивших свидетельств:E = e1 x ∩ e2 x ∩…∩ en x.
С поступлением новой информации(свидетельств) о состояниях некоторых вершин производится пересчёт вероятностей состояний остальных вершин по приведённым выше формулам.
Рассмотрим пример сети (рис 2.1) в которой вероятность вершины «e» зависит от
вершин «c» и «d» и определяется выражением (2.1):
где p(ek ci , dj) – вероятность пребывания в состоянииek в зависимости от состояний ci , dj.
Так как события, представленные вершинами «c» и «d» независимы, то
p(ci , dj) = p(ci) p(dj).
Рис. 2.1. БСД 1.
Рассмотрим более сложный пример сети (рис. 2.2) :
Рис. 2.2. БСД 2.
Данный рисунок иллюстрирует условную независимость. Для оценки вершин «c» и «d» используются выражения, аналогичные приведённым выше для вычисленияp(ek), тогда в соответствии с (2.1) :