- •Лекция 1. Общие сведения об интеллектуальных системах.
- •Лекция 2. Основные понятия нейробиологии. Нейроны. Нейронные сети.
- •Модель Маккаллока—Питтса
- •Другие модели.
- •Лекция 3. Конечные автоматы и нейронные сети.
- •Лекция 4. Машины Тьюринга.
- •Лекция 5. Рекурсивные множества и тезис Тьюринга. Идея эффективной процедуры.
- •Лекция 6. Регулярные и представимые события
- •Лекция 7. Нейронные сети. Методы обучения нейронных сетей
- •Обучение однослойного персептрона
- •Обучение многослойного персептрона
- •Обучение без учителя
- •Нейронные сети Хопфилда и Хэмминга
- •Лекция 8. Персептрон Розенблатта
- •Лекция 9. Теорема Новикова
- •Лекция 10. Постановка задач распознавания.
- •1. Принцип перечисления членов класса
- •2. Принцип общности свойств
- •3. Принцип кластеризации
- •1. Эвристические методы
- •2. Математические методы
- •3. Лингвистические (синтаксические) методы
- •Простая модель распознавания образов.
- •Лекция 11. Структура знания. Представление знаний об окружающей среде
- •Модель окружающей среды. Исходные понятия
- •Формальные и неформальные отношения.
- •Природа времени.
- •Лекция 12. Представление знаний и вывод на знаниях Данные и знания
- •Модели представления знаний
- •Вывод на знаниях
- •Нечеткие знания
- •Лекция 13. Введение в основы нечеткой логики
- •Лекция 14. Экспертные системы, базовые понятия
- •Лекция 15. Машинная эволюция
- •Лекция 16. Игровые программы.
- •Конец повторять
- •Лекция 17. Интеллектуальные системы в Интернет
- •Машины поиска.
- •Неспециализированные и специализированные поисковые агенты
- •Системы интеллектуальных поисковых агентов
- •Система marri
- •Оглавление.
Лекция 10. Постановка задач распознавания.
Способность «распознавать» считается основным свойством человеческих существ, как, впрочем, и других живых организмов.
Образпредставляет собой описание объекта.
В соответствии с характером распознаваемых образов акты распознавания можно разделить на два основных типа: распознавание конкретных объектов и распознавание абстрактных объектов. Мы распознаем символы, рисунки, музыку и объекты, нас окружающие. Процесс, включающий распознавание зрительных и слуховых образов, можно определить как «сенсорное» распознавание. Процессы этого типа обеспечивают идентификацию и классификацию пространственных и временных образов. С другой стороны, мы в состоянии с закрытыми ушами и глазами опознать старый довод или найти решение задачи.
Распознавание человеком конкретных образов можно рассматривать как психофизиологическую задачу, связанную с процессом взаимодействия индивида с определенным физическим раздражителем. Когда индивид воспринимает образ, он реализует процесс индуктивного вывода и устанавливает ассоциативную связь между своим восприятием и определенными обобщенными понятиями или «ориентирами», установленными им на основании прошлого опыта. В сущности распознавание человеком образов можно свести к вопросу оценки относительных шансов на то, что исходные данные соответствуют тому или иному из известных множеств статистических совокупностей, определяющихся прошлым опытом человека и предоставляющих ориентиры и априорнуюинформацию для распознавания. Таким образом, задачу распознавания образов можно рассматривать как задачу установления различий между исходными данными.
В задачах распознавания образов можно основных направления.
1. Изучение способностей к распознаванию, которыми обладают человеческие существа и другие живые организмы;
2. Развитие теории и методов построения устройств, предназначенных для решения отдельных задач распознавания образов в определенных прикладных областях.
Предмет распознавания образовобъединяет ряд научных дисциплин; их связывает поиск решения общей задачи - выделить элементы, принадлежащие конкретному классу, среди множества размытых элементов, относящихся к нескольким классам. Под классом образов понимается некоторая категория, определяющаяся рядом свойств, общих для всех ее элементов.
Образ– это описание любого элемента как представителя соответствующего класса образов. В случае, когда множество образов разделяется на непересекающиеся классы, желательно использовать для отнесения этих образов к соответствующим классам какое-либо автоматическое устройство. Считывание и обработка погашенных банковских чеков являются примером задачи распознавания образов. Подобные задачи могут выполняться и людьми; машина, однако, справляется с ними много быстрее. С другой стороны, некоторые задачи распознавания таковы, что человек едва ли в состоянии решать их. Примером задач такого рода служит выделение из множества морских сигналов и шумов тона подводной лодки посредством анализа подводных звуковых сигналов.
Очевидное, но совсем уж «бесхитростное» решение задачи распознавания заключается в применении к отдельным предъявленным образам ряда простых тестов для выделения признаков каждого класса. Совокупность этих тестов должна различать все допустимые образы из разных классов. Рассмотрим, например, следующие четыре китайских иероглифа:
Эти простые символы можно распознать с помощью тестов, проверяющих наличие вертикальной черточки, горизонтальной черточки, отдельной точки, открытой верхней части, открытой нижней части и последовательности точек, подсчитав затем количества и последовательности черточек. На рис. 10.1 приземлена функциональная блок-схема, иллюстрирующая описанный подход к распознаванию образов.
Рис. 10.1. Блок-схема простой логической процедуры классификации символов.
Если следовать такому интуитивному подходу, то построение автоматической системы распознавания образов может показаться довольно простой задачей. Не существует, однако, общей теории, позволяющей определить, какие из всего множества мыслимых тестов следует применить к предъявленным образам. Очень ограниченное количество или небрежный выбор тестов не дадут возможности получить характеристики предъявленных для распознавания образов, достаточные для отнесения их к соответствующим классам. Слишком много тестов, с другой стороны, необоснованно усложнят вычисления, осуществляемые в процессе дальнейшего анализа. Отсутствует какое-либо общее правило для получения неких ориентиров, способствующих определению набора таких тестов. Подобный подход чрезмерно зависит от опыта и технической интуиции разработчика и поэтому часто не дает удовлетворительного решения задач распознавания образов, встречающихся в практической деятельности.
Задачи, возникающие при построении автоматической системы распознавания образов, можно обычно отнести к нескольким основным областям.Перваяиз них связана с представлением исходных данных, полученных как результаты измерений для подлежащего распознаванию объекта. Это проблема чувствительности. Каждая измеренная величина является некоторой характеристикой образа или объекта. Допустим, например, что образами являются буквенно-цифровые символы. В таком случае в датчике может быть успешно использована измерительная сетчатка, подобно приведенной на рис. 10.2а. Если сетчатка состоит изпэлементов, то результаты измерений можно представить в видевектора измеренийиливектора образа
,
где каждый элемент хiпринимает, например, значение 1,если через 1-ю ячейку сетчатки проходит изображение символа, и значение 0 в противном случае. В последующем изложении будем называть векторы образов просто образами в тех случаях, когда это не приводит к изменению смысла.
Второй пример проиллюстрирован на рис. 10.2,б. В этом случае образами служат непрерывные функции (типа звуковых сигналов) переменной t.Если измерение значений функций производится в дискретных точкахt1, t2, …, tn,вектор образа можно сформировать, принявx1=f(t1), x2=f(t2), …, xn=f(tn).
а б
Рис. 10.2. Две простые схемы порождения вектора образа.
Когда измерения приводят к информации, представленной действительными числами, часто оказывается полезным рассматривать векторы образов в качестве точек n-мерного евклидова пространства. Множество образов, принадлежащих одному классу, соответствует совокупности точек, рассеянных в некоторой области пространства измерений. Соответствующий простой пример приведен на рис. 10.3 для случая двух классов, обозначенныхw1иw2.В этом примере предполагается, что классыw1иw2представляют соответственно группы футболистов-профессионалов и жокеев. Каждый «образ» характеризуется результатами двух измерений: ростом и весом. Как следует из рис. 10.3, эти два класса образуют непересекающиеся множества, что объясняется характером измерявшихся параметров.
Рис. 10.3. Два непересекающихся класса образов.
Вторая задачараспознавания образов связана с выделением характерных признаков или свойств из полученных исходных данных и снижением размерности векторов образов. Эту задачу часто определяют как задачу предварительной обработки и выбора признаков. При распознавании речи, например, можно отличать гласные и полугласные звуки от фрикативных и некоторых других консонант, измеряя частотное распределение энергии в спектрах. Шире всего при распознавании речи используются такие признаки, как длительность звука, отношения величин энергии в различных диапазонах частот, расположение пиков спектров (или формант) и их смещение во времени.
Признаки класса образов представляют собой характерные свойства, общие для всех образов данного класса. Признаки, характеризующие различия между отдельными классами, можно интерпретировать как межклассовые признаки. Внутриклассовые признаки, общие для всех рассматриваемых классов, не несут полезной информации с точки зрения распознавания и могут не приниматься во внимание. Выбор признаков считается одной из важных задач, связанных с построением распознающих систем. Если результаты измерений позволяют получить полный набор различительных признаков для всех классов, собственно распознавание и классификация образов не вызовут особых затруднений. Автоматическое распознавание тогда сведется к процессу простого сопоставления или процедурам типа просмотра таблиц. В большинстве практических задач распознавания, однако, определение полного набора различительных признаков оказывается делом исключительно трудным, если вообще не невозможным.
Третья задача, связанная с построением систем распознавания образов, состоит в отыскании оптимальных решающих процедур, необходимых при идентификации и классификации. После того как данные, собранные о подлежащих распознаванию образах, представлены точками или векторами измерений в пространстве образов, предоставим машине выяснить, какому классу образов эти данные соответствуют. Пусть машина предназначена для различенияМклассов, обозначенныхw1,w2, ...,wm. В таком случае пространство образов можно считать состоящим изМобластей, каждая из которых содержит точки, соответствующие образам из одного класса. При этом задача распознавания может рассматриваться как построение границ областей решений, разделяющихМклассов, исходя из зарегистрированных векторов измерений. Пусть эти границы определены, например, решающими функциямиd1(x), d2(х), ..., dm(х).Эти функции, называемые также дискриминантными функциями, представляют собой скалярные и однозначные функции образах. Еслиdi(х)>dj(х)для всехi,j= 1, 2, ..., М, ji, то образхпринадлежит классуwi. Другими словами, еслиi-я решающая функцияdi(x)имеет наибольшее значение, тохwi. Содержательной иллюстрацией подобной схемы автоматической классификации, основанной на реализации процесса принятия решения, служит приведенная на рис. 10.4 блок-схема (на схеме ГРФ означает «генератор решающих функций»).
Рис. 10.4. Блок-схема системы классификации образов.
Решение задачи предварительной обработки и выделения признаков и задачи получения оптимального решения и классификации обычно связано с необходимостью оценки и оптимизации ряда параметров. Это приводит к задаче оценки параметров. Кроме того, понятно, что и процесс выделения признаков, и процесс принятия решений могут быть существенно усовершенствованы за счет использования информации, заключенной в контексте образов. Информация, содержащаяся в контексте, может быть измерена с помощью условных вероятностей, лингвистических статистик и близких вариантов. В некоторых приложениях просто необходимо использовать контекстуальную информацию для точного распознавания. В частности, полная автоматизация распознавания речи возможна только при наличии контекстуальной и лингвистической информации, дополняющей информацию, содержащуюся в записи звуковых сигналов речи. По аналогичным причинам крайне желательно привлечение контекстуальной информации при распознавании скорописи и классификации отпечатков пальцев. Пытаясь построить распознающую систему, устойчивую по отношению к помехам, способную справиться с существенными отклонениями распознаваемых объектов и обладающую способностью к самонастройке, мы встречаемся с задачей адаптации.
Проведенное выше беглое обсуждение основных задач приводит к помещенной на рис. 10.5 функциональной блок-схеме, содержательно иллюстрирующей адаптивную систему распознавания образов. Эта блок-схема показывает, как можно наиболее естественно и разумно разделить функции, которые должна выполнять распознающая система. Функциональные блоки выделены для удобства анализа, что отнюдь не означает их изоляцию и отсутствие межблочного взаимодействия. Хотя различия между получением оптимального решения и предварительной обработкой или выделением признаков несущественны, идея функционального разделения создает четкую картину, поясняющую задачу распознавания образов.
Объекты (образы), подлежащие распознаванию и классификации с помощью автоматической системы распознавания образов, должны обладать набором измеримых характеристик. Когда для целой группы образов результаты соответствующих измерений оказываются аналогичными, считается, что эти объекты .принадлежат одному классу. Цель работы системы распознавания образов заключается в том, чтобы на основе собранной информации определить класс объектов с характеристиками, аналогичными измеренным у распознаваемых объектов. Правильность распознавания зависит от объема различающей информации, содержащейся в измеряемых характеристиках, и эффективности использования этой информации. Если бы мы были в состоянии измерить все возможные характеристики и обладали неограниченным временем для обработки собранной информации, то можно было бы достичь вполне адекватного уровня распознавания, используя самые примитивные методы. В обычной практике, однако, ограничения по времени, пространству и затратам требуют развития реалистических подходов.
Рис. 10.5. Функциональная блок-схема адаптивной системы распознавания образа.
В основе идеи синтеза систем автоматического распознавания лежат способы, с помощью которых описываются и разделяются классы образов. Когда класс характеризуется перечнем входящих в него членов, построение системы распознавания образов может быть основано на принципе принадлежности к этому перечню. Когда класс характеризуется некоторыми общими свойствами, присущими всем его членам, построение системы распознавания может основываться на принципе общности свойств. Когда при рассмотрении класса обнаруживается тенденция к образованию кластеров в пространстве образов, построение системы распознавания может основываться на принципе кластеризации. Под кластером понимают обычно группу объектов (образов), образующих в пространстве описания компактную в некотором смысле область. Эти три основных принципа построения систем распознавания образов обсуждаются ниже.