Глава 3 оценка параметров и обучение с учителем

3.1. Оценка параметров и обучение с учителем

В гл. 2 рассматривались вопросы разработки оптимального классификатора в случае, когда известны априорные вероятности Р(ω_j) и плотности p(x|ω_j), условные по классу. К сожалению, на практике при распознавании образов полная вероятностная структура задачи в указанном смысле известна далеко не всегда. В типичном случае имеется лишь неопределенное общее представление об исследуемой ситуации и некоторый набор конструктивных выборок — конкретных представителей образов, подлежащих классификации ^¹. Задача, следовательно, заключается в том, чтобы найти способ построения классификатора, используя эту информацию.

Один из подходов к задаче заключается в ориентировочной оценке неизвестных вероятностей и плотностей по выборкам и последующем использовании полученных оценок, как если бы они были истинными значениями. Оценка априорных вероятностей в типичных задачах классификации образов не представляет большой трудности. Иначе обстоит дело с вопросом оценки условных по классу плотностей. Имеющееся количество выборок всегда представляется слишком малым для их оценки, и если размерность вектора признаков х велика, то задача сильно усложняется. Трудность значительно уменьшится, если возможна параметризация условных плотностей, исходя из общего представления о задаче. Допустим, например, что есть некоторые основания предположить, что p(x|ω_j) соответствует нормальному распределению со средним значением μ_j и ковариационной матрицей ∑_j хотя точные значения указанных величин неизвестны. Это упрощает задачу, сводя ее вместо определения функции p(x|ω_j), к оценке параметров μ_j и ∑_j.

Задача оценки параметров, относящаяся к классическим задачам математической статистики, может быть решена различными способами. Мы рассмотрим два общепринятых способа — оценку по максимуму правдоподобия и байесовскую оценку. Несмотря на то, что результаты часто оказываются весьма близкими, подход к решению при применении этих способов принципиально различен. При использовании методов максимального правдоподобия значения параметров предполагаются фиксированными, но неизвестными. Наилучшая оценка определяется как величина, при которой вероятность реально наблюдаемых выборок максимальна. При байесовских методах параметры рассматриваются как случайные переменные с некоторым априорно заданным распределением. Исходя из результатов наблюдений выборок, это распределение преобразуют в апостериорную плотность, используемую для уточнения имеющегося представления об истинных значениях параметров.

Как мы увидим, в байесовском случае характерным следствием привлечения добавочных выборок является заострение формы функции апостериорной плотности, подъем ее вблизи истинных значений параметров. Это явление принято называть байесовским обучением. Следует различать обучение с учителем и обучение без учителя. Предполагается, что в обоих случаях выборки х получаются посредством выбора состояния природы ω_j, с вероятностью Р(ω_j), а затем независимого выбора х в соответствии с вероятностным законом p(x|ω_j). Различие состоит в том, что при обучении с учителем известно состояние природы (индекс класса) для каждого значения, тогда как при обучении без учителя оно неизвестно. Как и следовало ожидать, задача обучения без учителя значительно сложнее. В данной главе будет рассмотрен только случай обучения с учителем, рассмотрение же случая обучения без учителя отложим до гл. 6.

1 / 121 2 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC