Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_po_IS_2001-2002.doc
Скачиваний:
174
Добавлен:
13.04.2015
Размер:
3.13 Mб
Скачать

Лекция 10. Постановка задач распознавания.

Способность «распознавать» считается основным свойством человеческих существ, как, впрочем, и других живых организ­мов.

Образпредставляет собой описание объекта.

В соответствии с характером распознаваемых образов акты распознавания можно разделить на два основных типа: распо­знавание конкретных объектов и распознавание абстрактных объектов. Мы распознаем символы, рисунки, музыку и объекты, нас окружающие. Процесс, включающий распознавание зритель­ных и слуховых образов, можно определить как «сенсорное» распознавание. Процессы этого типа обеспечивают идентифика­цию и классификацию пространственных и временных образов. С другой стороны, мы в состоянии с закрытыми ушами и гла­зами опознать старый довод или найти решение задачи.

Распознавание человеком конкретных образов можно рас­сматривать как психофизиологическую задачу, связанную с про­цессом взаимодействия индивида с определенным физическим раздражителем. Когда индивид воспринимает образ, он реали­зует процесс индуктивного вывода и устанавливает ассоциатив­ную связь между своим восприятием и определенными обобщен­ными понятиями или «ориентирами», установленными им на основании прошлого опыта. В сущности распознавание челове­ком образов можно свести к вопросу оценки относительных шансов на то, что исходные данные соответствуют тому или иному из известных множеств статистических совокупностей, определяющихся прошлым опытом человека и предоставляющих ориентиры и априорнуюинформацию для распознавания. Таким образом, задачу распознавания образов можно рассматривать как задачу установления различий между исходными данными.

В задачах распознавания образов можно основных направления.

1. Изучение способностей к распознаванию, которыми обладают человеческие существа и другие живые организмы;

2. Развитие теории и методов построения устройств, предназначенных для решения отдельных задач распознавания образов в определенных прикладных областях.

Предмет распознавания образовобъединяет ряд научных дисциплин; их связывает поиск решения общей задачи - выделить элементы, принадлежащие конкретному классу, среди множества размытых элементов, относящихся к нескольким классам. Под классом образов понимается некоторая категория, определяющаяся рядом свойств, общих для всех ее элементов.

Образ– это описание любого элемента как представителя соот­ветствующего класса образов. В случае, когда множество обра­зов разделяется на непересекающиеся классы, желательно использовать для отнесения этих образов к соответствующим классам какое-либо автоматическое устройство. Считывание и обработка погашенных банковских чеков являются примером задачи распознавания образов. Подобные задачи могут вы­полняться и людьми; машина, однако, справляется с ними много быстрее. С другой стороны, некоторые задачи распознавания таковы, что человек едва ли в состоянии решать их. Примером задач такого рода служит выделение из множества морских сигналов и шумов тона подводной лодки посредством анализа подводных звуковых сигналов.

Очевидное, но совсем уж «бесхитростное» решение задачи распознавания заключается в применении к отдельным предъяв­ленным образам ряда простых тестов для выделения признаков каждого класса. Совокупность этих тестов должна различать все допустимые образы из разных классов. Рассмотрим, напри­мер, следующие четыре китайских иероглифа:

Эти простые символы можно распознать с помощью тестов, про­веряющих наличие вертикальной черточки, горизонтальной чер­точки, отдельной точки, открытой верхней части, открытой ниж­ней части и последовательности точек, подсчитав затем коли­чества и последовательности черточек. На рис. 10.1 призем­лена функциональная блок-схема, иллюстрирующая описанный подход к распознаванию образов.

Рис. 10.1. Блок-схема простой логической процедуры клас­сификации символов.

Если следовать такому интуитивному подходу, то построение автоматической системы распознавания образов может пока­заться довольно простой задачей. Не существует, однако, общей теории, позволяющей определить, какие из всего множества мыслимых тестов следует применить к предъявленным образам. Очень ограниченное количество или небрежный выбор тестов не дадут возможности получить характеристики предъявленных для распознавания образов, достаточные для отнесения их к со­ответствующим классам. Слишком много тестов, с другой сто­роны, необоснованно усложнят вычисления, осуществляемые в процессе дальнейшего анализа. Отсутствует какое-либо общее правило для получения неких ориентиров, способствующих определению набора таких тестов. Подобный подход чрезмерно зависит от опыта и технической интуиции разработчика и по­этому часто не дает удовлетворительного решения задач распо­знавания образов, встречающихся в практической деятельности.

Задачи, возникающие при построении автоматической систе­мы распознавания образов, можно обычно отнести к нескольким основным областям.Перваяиз них связана с представлением исходных данных, полученных как результаты измерений для подлежащего распознаванию объекта. Это проблема чувстви­тельности. Каждая измеренная величина является некоторой характеристикой образа или объекта. Допустим, например, что образами являются буквенно-цифровые символы. В таком слу­чае в датчике может быть успешно использована измерительная сетчатка, подобно приведенной на рис. 10.2а. Если сетчатка состоит изпэлементов, то результаты измерений можно пред­ставить в видевектора измеренийиливектора образа

,

где каждый элемент хiпринимает, например, значение 1,если через 1-ю ячейку сетчатки проходит изображение символа, и значение 0 в противном случае. В последующем изложении бу­дем называть векторы образов просто образами в тех случаях, когда это не приводит к изменению смысла.

Второй пример проиллюстрирован на рис. 10.2,б. В этом слу­чае образами служат непрерывные функции (типа звуковых сигналов) переменной t.Если измерение значений функций про­изводится в дискретных точкахt1, t2, …, tn,вектор образа можно сформировать, принявx1=f(t1), x2=f(t2), …, xn=f(tn).

а б

Рис. 10.2. Две простые схемы порождения вектора образа.

Когда измерения приводят к информации, пред­ставленной действительными числами, часто оказывается полез­ным рассматривать векторы образов в качестве точек n-мерного евклидова пространства. Множество образов, принадлежащих одному классу, соответствует совокупности точек, рассеянных в некоторой области пространства измерений. Соответствующий простой пример приведен на рис. 10.3 для случая двух классов, обозначенныхw1иw2.В этом примере предполагается, что классыw1иw2представляют соответственно группы футболи­стов-профессионалов и жокеев. Каждый «образ» характери­зуется результатами двух измерений: ростом и весом. Как следует из рис. 10.3, эти два класса образуют непересекающиеся множества, что объясняется характером измерявшихся параметров.

Рис. 10.3. Два непересекающихся класса образов.

Вторая задачараспознавания образов связана с выделением характерных признаков или свойств из полученных исходных данных и снижением размерности векторов образов. Эту за­дачу часто определяют как задачу предварительной обработки и выбора признаков. При распознавании речи, например, можно отличать гласные и полугласные звуки от фрикативных и неко­торых других консонант, измеряя частотное распределение энер­гии в спектрах. Шире всего при распознавании речи исполь­зуются такие признаки, как длительность звука, отношения величин энергии в различных диапазонах частот, расположение пиков спектров (или формант) и их смещение во времени.

Признаки класса образов представляют собой характерные свойства, общие для всех образов данного класса. Признаки, характеризующие различия между отдельными классами, можно интерпретировать как межклассовые признаки. Внутриклассовые признаки, общие для всех рассматриваемых классов, не несут полезной информации с точки зрения распознавания и могут не приниматься во внимание. Выбор признаков считается одной из важных задач, связанных с построением распознающих систем. Если результаты измерений позволяют получить полный набор различительных признаков для всех классов, собственно распознавание и классификация образов не вызовут особых за­труднений. Автоматическое распознавание тогда сведется к процессу простого сопоставления или процедурам типа про­смотра таблиц. В большинстве практических задач распознава­ния, однако, определение полного набора различительных при­знаков оказывается делом исключительно трудным, если вообще не невозможным.

Третья задача, связанная с построением систем распознава­ния образов, состоит в отыскании оптимальных решающих про­цедур, необходимых при идентификации и классификации. После того как данные, собранные о подлежащих распознаванию об­разах, представлены точками или векторами измерений в пространстве образов, предоставим машине выяснить, какому классу образов эти данные соответствуют. Пусть машина пред­назначена для различенияМклассов, обозначенныхw1,w2, ...,wm. В таком случае пространство образов можно считать состоящим изМобластей, каждая из которых содержит точки, соответствующие образам из одного класса. При этом задача распознавания может рассматриваться как построение границ областей решений, разделяющихМклассов, исходя из зарегистрированных векторов измерений. Пусть эти границы опреде­лены, например, решающими функциямиd1(x), d2(х), ..., dm(х).Эти функции, называемые также дискриминантными функциями, представляют собой скалярные и однозначные функ­ции образах. Еслиdi(х)>dj(х)для всехi,j= 1, 2, ..., М, ji, то образхпринадлежит классуwi. Другими словами, еслиi-я решающая функцияdi(x)имеет наибольшее значение, тохwi. Содержательной иллюстрацией подобной схемы автома­тической классификации, основанной на реализации процесса принятия решения, служит приведенная на рис. 10.4 блок-схема (на схеме ГРФ означает «генератор решающих функций»).

Рис. 10.4. Блок-схема системы классификации образов.

Решение задачи предварительной обработки и выделения признаков и задачи получения оптимального решения и класси­фикации обычно связано с необходимостью оценки и оптимиза­ции ряда параметров. Это приводит к задаче оценки параметров. Кроме того, понятно, что и процесс выделения признаков, и процесс принятия решений могут быть существенно усовершен­ствованы за счет использования информации, заключенной в контексте образов. Информация, содержащаяся в контексте, может быть измерена с помощью условных вероятностей, линг­вистических статистик и близких вариантов. В некоторых при­ложениях просто необходимо использовать контекстуальную информацию для точного распознавания. В частности, полная автоматизация распознавания речи возможна только при нали­чии контекстуальной и лингвистической информации, дополняю­щей информацию, содержащуюся в записи звуковых сигналов речи. По аналогичным причинам крайне желательно привлече­ние контекстуальной информации при распознавании скорописи и классификации отпечатков пальцев. Пытаясь построить рас­познающую систему, устойчивую по отношению к помехам, спо­собную справиться с существенными отклонениями распозна­ваемых объектов и обладающую способностью к самонастройке, мы встречаемся с задачей адаптации.

Проведенное выше беглое обсуждение основных задач при­водит к помещенной на рис. 10.5 функциональной блок-схеме, содержательно иллюстрирующей адаптивную систему распозна­вания образов. Эта блок-схема показывает, как можно наибо­лее естественно и разумно разделить функции, которые должна выполнять распознающая система. Функциональные блоки вы­делены для удобства анализа, что отнюдь не означает их изо­ляцию и отсутствие межблочного взаимодействия. Хотя разли­чия между получением оптимального решения и предваритель­ной обработкой или выделением признаков несущественны, идея функционального разделения создает четкую картину, поясняю­щую задачу распознавания образов.

Объекты (образы), подлежащие распознаванию и классифи­кации с помощью автоматической системы распознавания обра­зов, должны обладать набором измеримых характеристик. Когда для целой группы образов результаты соответствующих измере­ний оказываются аналогичными, считается, что эти объекты .принадлежат одному классу. Цель работы системы распознава­ния образов заключается в том, чтобы на основе собранной информации определить класс объектов с характеристиками, аналогичными измеренным у распознаваемых объектов. Пра­вильность распознавания зависит от объема различающей ин­формации, содержащейся в измеряемых характеристиках, и эффективности использования этой информации. Если бы мы были в состоянии измерить все возможные характеристики и обладали неограниченным временем для обработки собранной информации, то можно было бы достичь вполне адекватного уровня распознавания, используя самые примитивные ме­тоды. В обычной практике, однако, ограничения по времени, пространству и затратам требуют развития реалистических подходов.

Рис. 10.5. Функциональная блок-схема адаптивной системы распознавания образа.

В основе идеи синтеза систем автоматического распознава­ния лежат способы, с помощью которых описываются и разде­ляются классы образов. Когда класс харак­теризуется перечнем входящих в него членов, построение си­стемы распознавания образов может быть основано на принципе принадлежности к этому перечню. Когда класс характеризуется некоторыми общими свойствами, присущими всем его членам, построение системы распознавания может основываться на прин­ципе общности свойств. Когда при рассмотрении класса обна­руживается тенденция к образованию кластеров в простран­стве образов, построение системы распознавания может основываться на принципе кластеризации. Под кластером понимают обычно группу объектов (образов), обра­зующих в пространстве описания компактную в некотором смысле область. Эти три основных принципа построения систем распознавания образов обсуж­даются ниже.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]