Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донецкий национальный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lektsii_po_IS_2001-2002.doc

Скачиваний:

174

Добавлен:

13.04.2015

Размер:

3.13 Mб

Скачать

☆

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 2914 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Лекция 10. Постановка задач распознавания.

Способность «распознавать» считается основным свойством человеческих существ, как, впрочем, и других живых организмов.

Образпредставляет собой описание объекта.

В соответствии с характером распознаваемых образов акты распознавания можно разделить на два основных типа: распознавание конкретных объектов и распознавание абстрактных объектов. Мы распознаем символы, рисунки, музыку и объекты, нас окружающие. Процесс, включающий распознавание зрительных и слуховых образов, можно определить как «сенсорное» распознавание. Процессы этого типа обеспечивают идентификацию и классификацию пространственных и временных образов. С другой стороны, мы в состоянии с закрытыми ушами и глазами опознать старый довод или найти решение задачи.

Распознавание человеком конкретных образов можно рассматривать как психофизиологическую задачу, связанную с процессом взаимодействия индивида с определенным физическим раздражителем. Когда индивид воспринимает образ, он реализует процесс индуктивного вывода и устанавливает ассоциативную связь между своим восприятием и определенными обобщенными понятиями или «ориентирами», установленными им на основании прошлого опыта. В сущности распознавание человеком образов можно свести к вопросу оценки относительных шансов на то, что исходные данные соответствуют тому или иному из известных множеств статистических совокупностей, определяющихся прошлым опытом человека и предоставляющих ориентиры и априорнуюинформацию для распознавания. Таким образом, задачу распознавания образов можно рассматривать как задачу установления различий между исходными данными.

В задачах распознавания образов можно основных направления.

1. Изучение способностей к распознаванию, которыми обладают человеческие существа и другие живые организмы;

2. Развитие теории и методов построения устройств, предназначенных для решения отдельных задач распознавания образов в определенных прикладных областях.

Предмет распознавания образовобъединяет ряд научных дисциплин; их связывает поиск решения общей задачи - выделить элементы, принадлежащие конкретному классу, среди множества размытых элементов, относящихся к нескольким классам. Под классом образов понимается некоторая категория, определяющаяся рядом свойств, общих для всех ее элементов.

Образ– это описание любого элемента как представителя соответствующего класса образов. В случае, когда множество образов разделяется на непересекающиеся классы, желательно использовать для отнесения этих образов к соответствующим классам какое-либо автоматическое устройство. Считывание и обработка погашенных банковских чеков являются примером задачи распознавания образов. Подобные задачи могут выполняться и людьми; машина, однако, справляется с ними много быстрее. С другой стороны, некоторые задачи распознавания таковы, что человек едва ли в состоянии решать их. Примером задач такого рода служит выделение из множества морских сигналов и шумов тона подводной лодки посредством анализа подводных звуковых сигналов.

Очевидное, но совсем уж «бесхитростное» решение задачи распознавания заключается в применении к отдельным предъявленным образам ряда простых тестов для выделения признаков каждого класса. Совокупность этих тестов должна различать все допустимые образы из разных классов. Рассмотрим, например, следующие четыре китайских иероглифа:

Эти простые символы можно распознать с помощью тестов, проверяющих наличие вертикальной черточки, горизонтальной черточки, отдельной точки, открытой верхней части, открытой нижней части и последовательности точек, подсчитав затем количества и последовательности черточек. На рис. 10.1 приземлена функциональная блок-схема, иллюстрирующая описанный подход к распознаванию образов.

Рис. 10.1. Блок-схема простой логической процедуры классификации символов.

Если следовать такому интуитивному подходу, то построение автоматической системы распознавания образов может показаться довольно простой задачей. Не существует, однако, общей теории, позволяющей определить, какие из всего множества мыслимых тестов следует применить к предъявленным образам. Очень ограниченное количество или небрежный выбор тестов не дадут возможности получить характеристики предъявленных для распознавания образов, достаточные для отнесения их к соответствующим классам. Слишком много тестов, с другой стороны, необоснованно усложнят вычисления, осуществляемые в процессе дальнейшего анализа. Отсутствует какое-либо общее правило для получения неких ориентиров, способствующих определению набора таких тестов. Подобный подход чрезмерно зависит от опыта и технической интуиции разработчика и поэтому часто не дает удовлетворительного решения задач распознавания образов, встречающихся в практической деятельности.

Задачи, возникающие при построении автоматической системы распознавания образов, можно обычно отнести к нескольким основным областям.Перваяиз них связана с представлением исходных данных, полученных как результаты измерений для подлежащего распознаванию объекта. Это проблема чувствительности. Каждая измеренная величина является некоторой характеристикой образа или объекта. Допустим, например, что образами являются буквенно-цифровые символы. В таком случае в датчике может быть успешно использована измерительная сетчатка, подобно приведенной на рис. 10.2а. Если сетчатка состоит изпэлементов, то результаты измерений можно представить в видевектора измеренийиливектора образа

где каждый элемент х_iпринимает, например, значение 1,если через 1-ю ячейку сетчатки проходит изображение символа, и значение 0 в противном случае. В последующем изложении будем называть векторы образов просто образами в тех случаях, когда это не приводит к изменению смысла.

Второй пример проиллюстрирован на рис. 10.2,б. В этом случае образами служат непрерывные функции (типа звуковых сигналов) переменной t.Если измерение значений функций производится в дискретных точкахt₁, t₂, …, t_n,вектор образа можно сформировать, принявx₁=f(t₁), x₂=f(t₂), …, x_n=f(t_n).

а б

Рис. 10.2. Две простые схемы порождения вектора образа.

Когда измерения приводят к информации, представленной действительными числами, часто оказывается полезным рассматривать векторы образов в качестве точек n-мерного евклидова пространства. Множество образов, принадлежащих одному классу, соответствует совокупности точек, рассеянных в некоторой области пространства измерений. Соответствующий простой пример приведен на рис. 10.3 для случая двух классов, обозначенныхw₁иw₂.В этом примере предполагается, что классыw₁иw₂представляют соответственно группы футболистов-профессионалов и жокеев. Каждый «образ» характеризуется результатами двух измерений: ростом и весом. Как следует из рис. 10.3, эти два класса образуют непересекающиеся множества, что объясняется характером измерявшихся параметров.

Рис. 10.3. Два непересекающихся класса образов.

Вторая задачараспознавания образов связана с выделением характерных признаков или свойств из полученных исходных данных и снижением размерности векторов образов. Эту задачу часто определяют как задачу предварительной обработки и выбора признаков. При распознавании речи, например, можно отличать гласные и полугласные звуки от фрикативных и некоторых других консонант, измеряя частотное распределение энергии в спектрах. Шире всего при распознавании речи используются такие признаки, как длительность звука, отношения величин энергии в различных диапазонах частот, расположение пиков спектров (или формант) и их смещение во времени.

Признаки класса образов представляют собой характерные свойства, общие для всех образов данного класса. Признаки, характеризующие различия между отдельными классами, можно интерпретировать как межклассовые признаки. Внутриклассовые признаки, общие для всех рассматриваемых классов, не несут полезной информации с точки зрения распознавания и могут не приниматься во внимание. Выбор признаков считается одной из важных задач, связанных с построением распознающих систем. Если результаты измерений позволяют получить полный набор различительных признаков для всех классов, собственно распознавание и классификация образов не вызовут особых затруднений. Автоматическое распознавание тогда сведется к процессу простого сопоставления или процедурам типа просмотра таблиц. В большинстве практических задач распознавания, однако, определение полного набора различительных признаков оказывается делом исключительно трудным, если вообще не невозможным.

Третья задача, связанная с построением систем распознавания образов, состоит в отыскании оптимальных решающих процедур, необходимых при идентификации и классификации. После того как данные, собранные о подлежащих распознаванию образах, представлены точками или векторами измерений в пространстве образов, предоставим машине выяснить, какому классу образов эти данные соответствуют. Пусть машина предназначена для различенияМклассов, обозначенныхw₁,w₂, ...,w_m. В таком случае пространство образов можно считать состоящим изМобластей, каждая из которых содержит точки, соответствующие образам из одного класса. При этом задача распознавания может рассматриваться как построение границ областей решений, разделяющихМклассов, исходя из зарегистрированных векторов измерений. Пусть эти границы определены, например, решающими функциямиd₁(x), d₂(х), ..., d_m(х).Эти функции, называемые также дискриминантными функциями, представляют собой скалярные и однозначные функции образах. Еслиd_i(х)>d_j(х)для всехi,j= 1, 2, ..., М, ji, то образхпринадлежит классуw_i. Другими словами, еслиi-я решающая функцияd_i(x)имеет наибольшее значение, тохw_i. Содержательной иллюстрацией подобной схемы автоматической классификации, основанной на реализации процесса принятия решения, служит приведенная на рис. 10.4 блок-схема (на схеме ГРФ означает «генератор решающих функций»).

Рис. 10.4. Блок-схема системы классификации образов.

Решение задачи предварительной обработки и выделения признаков и задачи получения оптимального решения и классификации обычно связано с необходимостью оценки и оптимизации ряда параметров. Это приводит к задаче оценки параметров. Кроме того, понятно, что и процесс выделения признаков, и процесс принятия решений могут быть существенно усовершенствованы за счет использования информации, заключенной в контексте образов. Информация, содержащаяся в контексте, может быть измерена с помощью условных вероятностей, лингвистических статистик и близких вариантов. В некоторых приложениях просто необходимо использовать контекстуальную информацию для точного распознавания. В частности, полная автоматизация распознавания речи возможна только при наличии контекстуальной и лингвистической информации, дополняющей информацию, содержащуюся в записи звуковых сигналов речи. По аналогичным причинам крайне желательно привлечение контекстуальной информации при распознавании скорописи и классификации отпечатков пальцев. Пытаясь построить распознающую систему, устойчивую по отношению к помехам, способную справиться с существенными отклонениями распознаваемых объектов и обладающую способностью к самонастройке, мы встречаемся с задачей адаптации.

Проведенное выше беглое обсуждение основных задач приводит к помещенной на рис. 10.5 функциональной блок-схеме, содержательно иллюстрирующей адаптивную систему распознавания образов. Эта блок-схема показывает, как можно наиболее естественно и разумно разделить функции, которые должна выполнять распознающая система. Функциональные блоки выделены для удобства анализа, что отнюдь не означает их изоляцию и отсутствие межблочного взаимодействия. Хотя различия между получением оптимального решения и предварительной обработкой или выделением признаков несущественны, идея функционального разделения создает четкую картину, поясняющую задачу распознавания образов.

Объекты (образы), подлежащие распознаванию и классификации с помощью автоматической системы распознавания образов, должны обладать набором измеримых характеристик. Когда для целой группы образов результаты соответствующих измерений оказываются аналогичными, считается, что эти объекты .принадлежат одному классу. Цель работы системы распознавания образов заключается в том, чтобы на основе собранной информации определить класс объектов с характеристиками, аналогичными измеренным у распознаваемых объектов. Правильность распознавания зависит от объема различающей информации, содержащейся в измеряемых характеристиках, и эффективности использования этой информации. Если бы мы были в состоянии измерить все возможные характеристики и обладали неограниченным временем для обработки собранной информации, то можно было бы достичь вполне адекватного уровня распознавания, используя самые примитивные методы. В обычной практике, однако, ограничения по времени, пространству и затратам требуют развития реалистических подходов.

Рис. 10.5. Функциональная блок-схема адаптивной системы распознавания образа.

В основе идеи синтеза систем автоматического распознавания лежат способы, с помощью которых описываются и разделяются классы образов. Когда класс характеризуется перечнем входящих в него членов, построение системы распознавания образов может быть основано на принципе принадлежности к этому перечню. Когда класс характеризуется некоторыми общими свойствами, присущими всем его членам, построение системы распознавания может основываться на принципе общности свойств. Когда при рассмотрении класса обнаруживается тенденция к образованию кластеров в пространстве образов, построение системы распознавания может основываться на принципе кластеризации. Под кластером понимают обычно группу объектов (образов), образующих в пространстве описания компактную в некотором смысле область. Эти три основных принципа построения систем распознавания образов обсуждаются ниже.

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 2914 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.08.2019220.09 Кб9LECTURE_5.rtf
#
24.08.20194.27 Mб4lecture_6.rtf
#
13.04.2015324.1 Кб15Lekcii_po_istorii_zarubezhnoj_literatury-182.doc
#
07.08.2019150.53 Кб3Lektsia-1_GPU.doc
#
01.09.2019258.56 Кб1Lektsii_na_vtoroy_modul.doc
#
13.04.20153.13 Mб174Lektsii_po_IS_2001-2002.doc
#
16.11.2019696.32 Кб5Lektsii_po_Kramarenko.doc
#
20.11.2019201.69 Кб12Lektsiya_3_Ekonomichna_sistema_suspilstva_Vidno...docx
#
22.11.201988.06 Кб1Lektsiyi1.doc
#
27.04.201940.29 Кб4Lektsya_2.docx
#
17.08.201984.99 Кб3Lekts_Srednev_sokr.doc