Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции и вопросы Интеллектуальные ИС (2010, акк....doc
Скачиваний:
50
Добавлен:
11.12.2018
Размер:
954.37 Кб
Скачать

Раздел 3. Системы интеллектуального интерфейса и распознавание образов

3.1. Общее представление об интеллектуальных интерфейсах. Роль и место теории распознавания образов при разработке интеллектуального интерфейса

Из истории развития вычислительной техники известно 4 поколения ЭВМ:

 1-е – это ЭВМ на радиолампах (до них были и ЭВМ с релейными элементами);

 2-е – транзисторные ЭВМ;

 3-е – ЭВМ на интегральных схемах;

 4-е  ЭВМ на больших и сверхбольших интегральных схемах.

Однако в конце 80-х, начале 90-х гг. XX века японские ученые и инженеры объявили о разработке ЭВМ 5-го поколения, под которым понималась машина, способная «думать», «рассуждать», быть обучаемой и самообучаемой, ставить цели и находить способы их достижения. Важнейшим признаком такой ЭВМ рассматривалась возможность общаться с человеком привычным для него способом: понимать визуальные образы, исполнять голосовые команды на естественном языке и т.п. В рамках этого направления сформировалось представление об интеллектуальных интерфейсах, как таких, которые обеспечивают подобное общение.

Данное представление зародилось не на пустом месте. Уже в 50-е гг. XX столетия были получены результаты в области т.н. «распознавания образов». Ученые и инженеры пытались научить компьютер читать машинописные и рукописные тексты, понимать голосовые команды, ориентироваться во внешнем мире (задачи анализа сцен). Несмотря на определенные и, порой, достаточно серьезные успехи в этом направлении задача разработки полноценного интеллектуального интерфейса не решена и поныне. Это стало одной из причин того, что ЭВМ 5-го поколения пока не состоялась. Однако положительные и вполне ощутимые плоды этих исследований мы уже пожинаем в виде сканеров с программным обеспечением, переводящим изображения страниц текста в текстовый файл, компьютеров (в т.ч. бытовых) управляемых голосом хозяина, систем автоматизированной навигации летательных аппаратов и т.п.

Теоретическим фундаментом достижений в области интеллектуальных интерфейсов стала теория распознавания образов, с классическими основами которой полезно познакомиться.

3.2. Формализация образов в теории распознавания

Объекты и признаки. Понятия объекта и признака обычно раскрываются через примеры. Примерами объектов являются технические системы, звуки, предметы и их изображения на фотографиях, графические символы, и т.в. Короче все – что можно так или иначе выделить, обнаружить, оценить, измерить. Как правило, в процессе выделения любого объекта происходит выделение некоторых иных, сопутствующих объектов, которые так или иначе связаны с исходным. Например, выделяя на фотографии изображения к.-л. предметов (т.е. мы имеем дело с объектами – изображениями предметов, что следует отличать от собственно предметов, которые, впрочем, также являются объектами) мы замечаем (выделяем) особенности их геометрии, цвет, яркость, взаимное расположение, возможно – функциональное назначение и т.п. Такие «сопутствующие» объекты называют признаками.

Признаки принято подразделять на количественные и качественные. Количественные признаки можно измерить. Так, измеряются объем, вес, скорость перемещения физических тел, процентное соотношение смесей, количество годовых колец у дерева, частота и амплитуда звуковой волны. К качественным относятся признаки, которые нет необходимости или невозможно измерять. В таком случае говорят просто о наличии или отсутствии признака, регистрируя этот факт, например, единицей (признак есть) или нулем (признака нет). Примерами подобных признаков являются наличие или отсутствие у человека высшего образования, его пол, наличие или отсутствие тех или иных функциональных блоков у технического устройства, превышение/непревышение критического порога количественной величиной и т.п. К качественным можно отнести также признаки, связанные с выбором одного качества из некоторого «обозримого множества» качеств, как, например, цвет тела из множества основных цветов, тип движителя у корабля (весельный, ветровой, колесный, винтовой и т.д.).

Формальное представление образов в теории распознавания. Не зависимо от вида признака его всегда можно выразить числом. Собственно количеством – для количественных признаков, 0 или 1 для простых качественных признаков, натуральным числом для качественных признаков, связанных с выбором одного из нескольких качеств.

Поскольку объект характеризуется признаками, а сами признаки представимы в числовой форме, мы можем описать объект значениями его признаков. Признаки для этого следует каким-то образом (неважно каким) упорядочить. Упорядочение признаков можно трактовать как упорядочение их числовых значений. Таким образом мы можем говорить о векторе признаков того или иного объекта (вектор – это упорядоченная n-ка чисел).

Вектор признаков объекта называется его образом.

Все множество значений, которые может принять такой вектор, образуют т.н. пространство признаков. Образ – точка в этом пространстве.

Проблема избыточности. Выше говорилось, что задачи распознавания образов подразделяются на два подкласса: классификации и идентификации. И в том и в другом случае решение ищется на основе анализа значений признаков. При этом, как правило, оказывается, что какие-то признаки оказываются существенными для решения, а какими-то можно пренебречь. Например узнавая (идентифицируя) своего знакомого мы обращаем внимание на черты лица, форму тела, манеру речи и т.д. Но нам зачастую безразличны его одежда (на может быть любой), местонахождение, прическа и т.д. Т.е. какие-то признаки оказываются информативными, а какие-то нет. Очевидно, что признак тем более информативен, чем меньшему количеству объектов или классов объектов (при классификации) он присущ. И наоборот – чем большее число объектов обладает им, тем менее надежно распознавание на его основе. При решении задачи распознавания очень важно выбрать систему информативных признаков. Лишние, малоинформативные признаки породят проблему избыточности, когда система вынуждена обрабатывать много дополнительной и малополезной информации, забирающей ресурсы ЭВМ и слабо влияющей на конечный итог. В теории распознавания разрабатываются специальные алгоритмы поиска информативных признаков, однако немалую роль может сыграть интуиция и опыт самого исследователя.

Гипотеза компактности. Для решения задачи классификации существенное значение имеет еще один момент. Как уже говорилось, каждый образ представляет собой точку в пространстве признаков. Классификацию осуществить проще, когда образы каждого класса образуют отдельные «облака», «сгустки», характеризующиеся тем, что расстояние между образами одного класса (т.е. внутри облака) заметно меньше, чем расстояние между самими облаками. Подобные облака иногда называют кластерами, а проблему их автоматизированного выявления – задачей кластеризации. Чем меньше пересекаются кластеры, тем выше качество классификации. Возможность разделения образов на непересекающиеся кластеры во многом зависит от выбранной системы признаков. Так, на рисунке 3.1. показано, что разделение двух классов: W1 и W2 можно провести только на основе анализа признака X1, но практически невозможно сделать это на основе анализа признака X2 (компактность обеспечивается уже одним только признаком X1). Этот рисунок иллюстрирует также важность правильного выбора системы признаков.

Количественными характеристиками кластеров могут быть положение ri и взаимное удаление их центров r12, средняя величина разброса точек-образов вокруг центров: 1 и 2, отношение разброса к расстоянию между центрами: i/ r12, где i = 1, 2, и т.д.