- •Минск 2014 Оглавление
- •Обзор предметной области
- •Бинаризация
- •Сегментация
- •Распознавание.
- •2.Постановка задачи
- •3.Описание используемых алгоритмов
- •3.1Бинаризация.
- •3.2Сегментация
- •3.3Утоньшение изображения
- •3.4 Распознавание
- •4. Программная реализация
- •4.1Описание функций и методов
- •4.2Тестирование и руководство для пользователя
- •Заключение
- •Литература
- •Приложение 1. Схемы idef
Бинаризация
Бинаризацией называется процесс преобразования полутонового изображения в изображение, яркость пикселей которого может иметь только два значения – 0 или 1.Такое изображение называется бинарным.
Как видно из определения, изображение должно быть полутоновым, чтобы его можно было бинаризировать. Для перевода изображения из цветного в полутоновое существуют следующие методы:
I=0,5*(max(R,G,B)+min(R,G,B)) , где I – яркость исследуемого пикселя. Следует отметить, что при переводе в полутоновое одним из этих методов качество изображения ухудшается.
I=(R+G+B)/3, где I – яркость исследуемого пикселя;
Наиболее эффективным является перевод по формуле: Y=0.299 R+0.587 G+0.114B.
После этого можно бинаризировать изображение.
В зависимости от вида изображения применяются различные методы бинаризации:
Метод средней яркости (локальный метод):
Вычисляем среднюю яркость
Определяем граничное значение яркости по формуле:
ГЗ=255 – СЯ, где ГЗ- граничное значение, СЯ- средняя яркость.
Пиксель становится черным, если среди его соседей есть хотя бы один пиксель яркость которого удовлетворяет условию:
Яркость ≤ ГЗ, либо яркость анализируемого пикселя ≤ яркости связного с ним +Step, Step= 1…2.
При этом важно чтобы связующий пиксель был уже включен в группу пикселей, которые будут отмечены как черные.
Метод «Мод»:
Выполняется построение гистограммы яркости. По построенной гистограмме выбирается значение яркости соответствующее впадине или минимуму между двумя максимальными вершинами гистограммы. Недостатком данного метода является зависимость результата от гистограммы.
Метод 120:
Строится гистограмма
Находится максимальный уровень серого в диапазоне t=[0, 120]
Черный цвет устанавливается у пикселей, яркость которых меньшелибо равна порогового значения плюс 12…15, в остальных случаях цвет белый.
Метод 40%:
Строится гистограмма
Находится количество пикселей, соответствующий заданному проценту
Отсчитывается количество пикселей по градациям яркости, начиная с 0 и до момента, когда это количество будет превышать количество пикселей, заданных в постановке задачи бинаризации, и градация, на которой произошла постановка становится порогом бинаризации.
После этого идет процесс фильтрации. При переводе в бинарное изображение могут быть потери или наоборот шумы из-за неточности сканера.
Сегментация
Проблема сегментации зачастую возникает при рассмотрении задачи оптического распознавания текста. Сегментация — это процесс разделения цифрового изображения на несколько сегментов. Цель сегментации заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать. Сегментация изображений обычно используется для того, чтобы выделить объекты и границы (линии, кривые, и т. д.) на изображениях. Более точно, сегментация изображений — это процесс присвоения таких меток каждому пикселю изображения, что пиксели с одинаковыми метками имеют общие визуальные характеристики.
В настоящее время существует довольно много систем сегментации и обработки текстовых изображений. Наиболее известной из них является программный продукт “FineReader” компании ABBYY. Данный продукт является универсальным инструментом при работе с текстовыми изображениями. Он позволяет выделить текст на изображении и распознать его. Также всостав ABBYY FineReader входят словари для проверки орфографии они потребуются для детальной перепроверки полученных результатов работы. Еще одно достижение разработчиков ABBYY – включение в движок поддержки распознавания фотографий. Но по-прежнему основным недостатком подобных систем является высокая стоимость.
Результатом сегментации изображения является множество сегментов, которые вместе покрывают всё изображение, или множество контуров, выделенных из изображения. Все пиксели в сегменте похожи по некоторой характеристике или вычисленному свойству, например по цвету, яркости или текстуре. Соседние сегменты значительно отличаются по этой характеристике.Существуют следующие методы сегментации:
Выделение краёв:
Границы и края областей сильно связаны, так как часто существует сильный перепад яркости на границах областей. Поэтому методы выделения краёв используются как основа для другого метода сегментации. Недостаток – обнаруженные края часто бывают разорванными. Но чтобы выделить объект на изображении, нужны замкнутые границы области.
Методы с использованием гистограммы:
Методы с использованием гистограммы очень эффективны, когда сравниваются с другими методами сегментации изображений, потому что они требуют только один проход по пикселям. В этом методе гистограмма вычисляется по всем пикселям изображения и её минимумы и максимумы используются, чтобы найти кластеры на изображении. Цвет или яркость могут использоваться при сравнении. Недостаток этого метода — затруднительный поиск значительных минимумов и максимумов на изображении.