Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции и вопросы Интеллектуальные ИС (2010, акк....doc
Скачиваний:
50
Добавлен:
11.12.2018
Размер:
954.37 Кб
Скачать

3.3. Методы классификации образов

Метод решающих функций. Уравнение разделяющей прямой

d(x) = w1x1+w2x2+w3 = 0

обеспечивает значение d(x)>0 для любого образа объекта из класса W1 и d(x)<0 для любого образа объекта из класса W2.

Таким образом, знак функции d(x) при подстановке значений признаков каждого конкретного объекта позволяет классифицировать этот объект. Функцию d(x) можно использовать в качестве решающей (или дискриминантной) функции.

Как будет видно в дальнейшем, этот метод нетрудно распространить на большее число классов, на классы с большим числом признаков, а также на случай нелинейных границ в любом конечномерном евклидовом пространстве.

Успех применения данной схемы зависит от двух факторов:

    1. вида самой функции;

    2. возможности определения ее коэффициентов.

В n-мерном случае функция d(x) имеет вид:

d(x) = w1x1+w2x2+w3x3+…+ wnxn + wn+1= wx + wn+1,

где вектор w называют весовым или параметрическим.

Часто последнее уравнение пишут в форме

d(x) = w`x,

где w`= (w1, w2, w3, …, wn, wn+1), а x = (x1, x2, x3, …, xn, 1) – пополненные векторы весов и образов  соответственно. Пример линейной решающей функции для случая двух признаков дан на рис. 3.1. Предполагается, что в случае разбиения на два класса решающая функция d(x) обладает свойством:

Рассмотрим случаи разбиения на несколько классов.

Случай 1. Каждый класс отделяется от остальных одной разделяющей поверхностью (рис. 3.3). В этом случае существует M разделяющих поверхностей и, соответственно, M решающих функций со свойствами:

где индекс i = 1, 2, 3, …, M, а весовой вектор wi = (w1i, w2i, w3i, …, wn i, wn+1, i)  весовой вектор, соответствующий i-й решающей функции.

Пусть решающие функции имеют вид

d1(x) = x1+x2, d2(x) = x1+x25, d3(x) = x2 +1.

Соответственно три разделяющие границы определяются уравнениями:

x1+x2 = 0, x1+x2=5, x2 = 1.

Любой образ, для которого выполняются условия d1(x)>0, d2(x)<0 и d3(x)<0, зачисляется в класс W1, при d1(x)<0, d2(x)>0 и d3(x)<0  в класс W2, при d1(x)<0, d2(x)<0 и d3(x)>0  в класс W3. Например, образ x=(6,5) дает d1(x)=1, d2(x)= 6 и d3(x)= 4. Это позволяет зачислить его в класс W2.

Следует отметить, что в областях, где вектор x дает более одного положительного результата, или все отрицательные  данная схема разделения не срабатывает. Это – области неопределенных решений. Объект в этом случае относиться сразу к двум или же ни к одному классу.

Случай 2. Каждый класс отъединяется от любого другого отдельной разделяющей поверхностью. Классы попарно разделимы. В этом случае существует M(M-1)/2 (число сочетаний из M по 2) поверхностей (рис. 3.4). Разделяющие функции имеют вид

dij(x) > 0, если i≠j.

Кроме того, dij(x) =  dji(x).

Пусть решающие функции имеют вид

d12(x) = x1x2+5, d13(x) = x1+3, d23(x) = x1 + x2.

Здесь области решений могут иметь несколько зон, где соответствующие функции положительны. В частности, область, отвечающая классу W1, определяется значениями, при которых d12(x) > 0 и d13(x)>0. Значение функции d23(x) для выделения класса W1 роли не играет, т.к. делит классы W2 и W3 . Для примера рассмотрим вектор x = (4,3). Он дает d12(x) = 2, d13(x) = 1, d23(x) = 1. Из свойства симметрии по индексам следует, что d21(x) = 2, d31(x) = 1, d32(x) = 1. Т.к. d3j(x)>0, объект принадлежит классу W3.

Случай 3. Существуют M решающих функций dk(x)=wk`x; k = 1, 2, 3, …, M, таких, что если образ x принадлежит классу Wi, то

di(x)> dj(x) для всех i≠j.

Эта ситуация – разновидность ситуации 2, т.к. можно положить, что

dij(x)= di(x)dj(x)= (wi wj)`x = wij x.

Легко убедиться, что если di(x)>dj(x) для всех i≠j, то dij(x)>0 для всех i≠j.

Пусть решающие функции имеют вид

d1(x) = x1+x2, d2(x) = x1+x21, d3(x) = x2.

Разделяющие границы для трех классов выглядят при этом так:

d1(x)  d2(x) = 2x1+1=0;

d1(x) d3(x) = x1+ 2x2= 0;

d2(x)  d3(x) = x1+2x21=0.

Чтобы определить область решений для класса W1 надо выделить область, в которой d1(x)>d2(x) и d1(x)> d3(x). Эта область совпадает с положительными зонами для прямых 2x1+1=0 и x1+ 2x2= 0. В случае 3 области неопределенности отсутствуют, за исключением собственно разделяющих границ.

Нелинейные решающие функции.

d(x) = w1 f1(x)+w2 f2(x)+w3 f3(x)+…+ wK fK(x) + wK+1= .

Классификация образов с помощью функций расстояния

Случай единственного эталона. Рассмотрим M классов; пусть эти классы допускают представление с помощью эталонных образов z1, z2, … zM. Рассмотрим евклидово расстояние между произвольным вектором образа zi и классифицируемым образом x. Оно равно

Di = || x zi || = ,

где n - число координат пространства признаков.

Образ зачисляется в тот класс, для которого расстояние Di наименьшее. Другими словами, образ x приписывается к классу Wi, если Di < Dj для всех j ≠ i.

Этой формуле можно придать более удобный вид:

Di2 = || x zi ||2 = (x zi)` (x zi) =

= x`x 2 x`zizi`zi = x`x 2 (x`zizi`zi/2)  .

Поскольку первое слагаемое в последнем выражении не зависит от выбора эталона класса, легко видеть, что требование минимума Di2 – это требование максимума

di(x) = (x`zizi`zi/2).

Т.е. di(x)  это линейная разделяющая функция с которыми мы познакомились на предыдущей лекции. Причем образ зачисляется в класс i, если di(x) > di(x) для всех j ≠ i. (случай 3).

Таким образом, классификация по признаку минимума расстояния – это классификация с помощью линейной разделяющей функции.

Случай множественного эталона. Если класс описывается несколькими эталонами («область класса» не связная, имеет более одного кластера), функция определяющая расстояние может быть записана в виде:

Di = || x zil ||, где l = 1, 2, …, Ni

где Ni – количество эталонов класса, l – индекс по эталонам.. Следуя процедуре, рассмотренной выше, мы в качестве решающей функции будем рассматривать

di(x) = { (x`zil  (zil)`zil / 2) }.

Как и ранее, образ x зачисляется в класс Wi, если условие

Классификация по принципу ближайшего соседа. Предположим, что у нас имеется N образов с уже известной классификацией: S = {s1, s2, … sN }. Классификация по принципу ближайшего соседа состоит в том, что неизвестный образ x относится к тому или иному классу в зависимости от того, к какому классу принадлежит его ближайший сосед из набора S (1-БС-правило):

D(si, x) = { D(sl, x)}, где l = 1, 2, …, Ni

Обобщением данного подходя является q-БС-правило. Согласно ему, объект x зачисляется в тот класс, к которому принадлежит большинство из q его ближайших соседей. По сути дела – это ни что иное, как распознавание при множественности эталонов, если в качестве D брать евклидово расстояние.

Байесовский классификатор. Если классификатор принимает решение о принадлежности x классу Wj тогда, как на самом деле он принадлежит классу Wi, то классификатор терпит убытки размером Lij. Так как образ на самом деле может принадлежать любому из M классов Wi, где i = 1, … M, то математическое ожидание потерь равно

rj = .

В теории статистических решений эту величину называют условным средним риском или условными средними потерями. Классификация осуществляется так, что образ x причисляют к тому классу, для которого rj минимально. Такой классификатор называется байесовским. Со статистической точки зрения байесовский классификатор соответствует оптимальному качеству классификации.

Согласно формуле Байеса:

p(Wi| x) =

можно записать, что

rj = ,

где p(x|Wi) называют функцией правдоподобия для класса Wi. Поскольку величина p(x) входит во все формулы вычисления средних потерь, мы можем ее «забыть» и записать последнее выражение, как

rj = .

При M=2 получается:

r1 = L11 p(x|W1) p(W1) + L21 p(x|W2) p(W2);

r2 = L12 p(x|W1) p(W1) + L22 p(x|W2) p(W2).

Образ зачисляется в класс W1, если r1 < r2 . Это то же самое, что

L11 p(x|W1) p(W1) + L21 p(x|W2) p(W2) < L12 p(x|W1) p(W1) + L22 p(x|W2) p(W2),

или

(L11  L12 ) p(x|W1) p(W1) < (L22  L21 ) p(x|W2) p(W2).

Наконец (т.к. L11 < L12 и L22 < L21),

.

Величину l12(x) часто называют отношением правдоподобия, а 12пороговым значением. Образ зачисляется в класс W1, если выполняется условие l12(x) > 12 и в класс W1, если l12(x) < 12. В случае равенства l12(x) = 12 решение выбирается произвольным образом.

В случае разделения на несколько классов условие принадлежности образа x классу Wk принимает вид:

,

для всех j ≠ k.