1.3. Распознавание образов

Разработка систем обработки изображений всегда тесно связана с большим объемом тестирования и экспериментальной работы, который необходимо выполнить для достижения приемлемого решения поставленной задачи.

Изображение представляет собой двумерную функцию f (x, у), где х и у — это пространственные координаты, а амплитуда f в любой точке с парой координат (х, у) называется интенсивностью или уровнем серого цвета изображения в этой точке. Если переменные x, у и f принимают значения их конечного (дискретного) множества, то говорят о цифровом изображении. Под цифровой обработкой изображений подразумевается обработка цифровых изображений с помощью цифровых вычислительных машин (компьютеров). Отметим, что цифровое изображение состоит из конечного числа элементов, каждый из которых расположен в конкретном месте и имеет определенное значение. Эти элементы принято называть элементами изображения или пикселями.

Зрение является самым совершенным из наших органов чувств, поэтому зрительные образы играют такую важную роль в человеческом восприятии. Однако в отличие от людей, которые способны воспринимать лишь электромагнитное световое излучение видимого диапазона, машинная обработка изображений покрывает практически весь спектр электромагнитных волн от гамма-излучения до радиоволн.

В своей работе мы будем иметь дело с топографическими картами. Они содержат в себе несколько цветов, то есть это цветные изображения, на них есть линии, цифры, водные объекты, которые нам необходимо будет распознать.

Задача распознавания образов является основной в большинстве интеллектуальных систем. Распознавание образов - процесс отнесения объекта по фиксированной группе его свойств к одному объекту из множества образов по заранее оговоренному правилу.

Подходы к компьютеризации распознавания образов можно разделить на две основные категории: методы, основанные на теории решений, и структурный анализ. Первая категория имеет дело с образами, которые описываются количественными дескрипторами, такими как длина, площадь, текстура и многими другими дескрипторами, а вторая категория методов ориентирована на образы, которые можно хорошо представить символьной информацией, например, символьными строками, и которые можно описать свойствами и взаимоотношениями между этими символами.

Выделим наиболее важные шаги в процедуре распознавания:

1. Восприятие образа. На этом этапе производят получение значений характеристических свойств объекта (измерения линейных замеров, фотографирование, оцифровка звука);

2. Предварительная обработка (удаление шумов, представление изображения в черно-белом варианте, обрезание ненужных частей изображения);

3. Выделение характеристик (индексация). На этом этапе измеряются характеристический свойства объекта (измеряем длину рыбы и ее цвет);

4. Классификация (принятие решения).

Разработка системы распознавания образов происходит несколькими этапами:

1. Разработка тренировочной коллекции. Тренировочная коллекция - коллекция объектов для которых заведомо известны их образы. Например, коллекция аудио записей для каждого звука, или коллекция изображений каждой буквы латинского алфавита;

2. Выбрать модель представления объектов;

3. Выбрать значимые характеристики. Один из самых важных этапов разработки системы распознавания. Например, если в случае идентификации рыбы окунь/лосось в качестве характеристики выбрать только длину рыбы, то никакое классифицирующее правило не сможет точно определить тип рыбы, поскольку весьма вероятно встретить лосося и окуня одинаковой длины;

4. Разработать классифицирующее правило. Классифицирующее правило - правило, которое по значениям характеристических свойств объекта отнесет его к одному из образов.

5. Обучение алгоритма. На этом этапе алгоритм "собирает опыт" на основе распознавания тренировочной коллекции. Для того, чтобы правильно выставить коэффициенты (параметры) алгоритма его прогоняют на тренировочной коллекции контролируя результат работы алгоритма;

6. Проверить качество. Вернуться к шагу 2,3 и 4). Если частота ошибок алгоритма не устраивает решаемую задачу, то необходимо вернуться к п. 2 (3, 4). Интуитивно понятно, что увеличение количества характеристических свойств, увеличение тренировочной коллекции улучшают качество работы алгоритма.

7. Оптимизация алгоритма. После того, как качество работы алгоритма подходит под условие рассматриваемой задачи, иногда приходится произвести его оптимизацию. Изначальный алгоритм может быть слишком долгим или ресурсоемким. Ускорить алгоритм распознавания можно уменьшив количество характеристических свойств объекта, выбрав другие характеристические свойства, используя другое классифицирующее правило.

В целом, можно выделить три метода распознавания образов: Метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения. Например, для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями, деформациями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д. В случае распознавания звуковых образов, соответственно, происходит сравнение с некоторыми известными шаблонами (например, слово, произнесенное несколькими людьми).

Второй подход - производится более глубокий анализ характеристик образа. В случае оптического распознавания это может быть определение различных геометрических характеристик. Звуковой образец в этом случае подвергается частотному, амплитудному анализу и т. д.

Следующий метод - использование искусственных нейронных сетей (ИНС). Этот метод требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность.

Перед нами стоят задачи распознавания нескольких видов объектов - линии и цифры. Цифры - более сложные элементы для распознавания. Они могут быть под любым наклоном, могут находиться в любом месте на карте. Для них подошел бы первый из перечисленных методов, но иногда карты бывают очень большие и обработка такого изображения, сравнение цифр под разным наклоном из базы данных со всеми возможными цифрами на большой карте, займет слишком много времени. Поэтому мы создадим продукционную модель знаний.

Продукционные модели можно считать наиболее распространенными моделями представления знаний. Продукционная модель – это модель, основанная на правилах, позволяющая представить знание в виде предложений типа: "Если ( выполняется условие), то (выполняется действие)".

Существуют два типа продукционных систем – с «прямыми» и «обратными» выводами. Прямые выводы реализуют стратегию «от фактов к заключениям». При обратных выводах выдвигаются гипотезы вероятностных заключений, которые могут быть подтверждены или опровергнуты на основании фактов, поступающих в рабочую память. Существуют также системы с двунаправленными выводами. Основные достоинства систем, основанных на продукционных моделях, связаны с простотой представления знаний и организации логического вывода.

Мы будем использовать некоторые свойства цифр и линий, которые присущи только им, чтобы выделить от остальных объектов, а так же между собой. Каждая цифра имеет свою форму, площадь, центр масс и так далее, список особенностей практически не ограничен.

<<< < Предыдущая 1 2 34 / 104 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.07.2019448 Кб3Модели железных дорог.doc
#
17.05.2015404.48 Кб71Моделирование СМО.doc
#
18.03.20161.57 Mб10мое.doc
#
17.05.2015820.22 Кб31мои Стройконструкции.doc
#
17.05.201562.46 Кб14МОИ ТИТУЛЬНИКИ.doc
#
17.05.20151.16 Mб140МОЙ ДИПЛОМ.doc
#
17.05.2015231.94 Кб50Мой курсач по изысканиям.doc
#
18.03.2016556.54 Кб133Мой курсач.doc
#
17.05.20151.03 Mб15Мой ТМА.doc
#
17.05.20151.67 Mб6мой.docx
#
07.09.20191.62 Mб15Молекулярная физика.doc