Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
18
Добавлен:
15.06.2014
Размер:
131.58 Кб
Скачать

3. Алгоритмы контрастирования

Как при повышенной, так и при пониженной контрастности восприятие изображения осложняется. Поэтому при повышенной контрастности используется новая оцифровка, т.е. изображение вводится повторно, а при пониженной контрастности её повышают, используя различные методы.

Метод точечных преобразований основан на “растягивании” уровня яркости по всему диапазону, используя функцию преобразования (рис. 18.3).

Функция преобразования может иметь более сложный вид. Такой метод не всегда даёт положительный эффект, т.к. использует информацию только об одной точке.

Методы локальных операторов. При использовании данного метода новое значение яркости вычисляется не только на основе старого значения, но и с использованием значений яркости рядом лежащих точек. Самый простейший метод из этой группы - это фильтр Гаусса. Он использует маску типа квадратной матрицы степени 3 (рис. 18.4, а) с весами пикселей (рис. 18.4, б), сумма которых равна 16. Новое значение яркости пикселя Р определяется по формуле

(18.1)

Такая маска удобна при программной и аппаратной реализации (рис. 18.5).

Для непосредственной реализации этого метода используется двойной объём памяти для хранения исходного поля и поля с результатом обработки. Это является неудобным. Поэтому новое значение яркости пикселей сдвигается в направлении, откуда начата обработка на половину окна в пикселях. После завершения обработки выполняется сдвиг обратно. При этом информация теряется только по границам окна.

Фильтр Гаусса используется для “размазывания” изображения с целью снижения дифракционных и прочих краевых шумов и с целью снижения зернистости изображения.

Многие алгоритмы распознавания символов работают на основе распознавания контуров, поэтому контура выделяют фильтром Собеля. Этот фильтр реализуется посредством использования масок 2-х типов (рис. 18.6). Яркость пикселя определяется по следующей формуле

X=(F+2G+H)-(A+2B+C)

Y=(C+2E+H)-(A+2D+F); (18.2)

.

Кроме рассмотренных выше фильтров используется ещё ивскрывающий фильтр (рис. 18.7). Он реализуется в виде двух локальных операторов. Первый из них вызывает эрозию - снятие одного слоя пиксела с объекта, а второй вызывает наращивание слоя пикселей:

ЭН-1 - вскрывающий оператор уровня 1;

ЭЭНН-2 - вскрывающий оператор уровня 2.

- эррозия (Э);

- наращивание (Н) (18.3)

Чем глубже уровень вскрытия, тем чище изображение, но если глубина вскрытия соизмерима с шириной символа, то символ может потеряться.

4. Алгоритм сканирования информации

Определение строк реализуется программой распознавания информации AI-READER совместно с аппаратурой ScanJet.

Исходными данными для процедуры отделения строк являются: исходный читаемый текст, размер букв и средний размер в пикселях интервалов межбуквенных и межстрочных. Алгоритм этой процедуры состоит из 4-х основных этапов:

1. Подвод к первой строке текста.

1.1. Сканирование документа, начиная с верхней границы горизонтальной апертурой (линией) параллельно верхней границе листа до встречи первого засвеченного пикселя.

1.2. Сканирование строки вертикальной апертурой, размер которой определяется как средний размер буквы плюс половина размера интервала между строками. Сканирование начинается с правой границы документа до первого засвеченного пикселя.

1.3. Сканирование буквы линейно вертикальной апертурой той же высоты, в результате которого формируется матрица образа буквы в пикселях [pij].

2. Проверка истинности выражения

, (18.4)

где [pij] - матрица изображения просканированного символа; - матрица изображения эталонного к-го символа; - функция, которая определяется как - функция совпадения; Р - порог принятия решения (80% от количества пикселей в эталоне).

Чем больше совпадений тем ближе символ к этому эталону, если порог Рпревышен, то это означает, что символ распознан. Если символ не находит своего эталона, то возможно два варианта:

а) в режиме обучения программа запрашивает, что это за символ и запоминает его как эталонный для данного кода;

б) в рабочем режиме программа выдаёт отказ распознавания и символ заменяется на символа .

3. Переход к следующему символу к п. 1.2.

4. Переход к следующей строке к п. 1.1.

Недостатком данного алгоритма является то, что формируется код для перехода на следующую страницу.

Для распознавания символов существуют специальные методы:

 метод сравнения;

 корреляционный метод. Он похож на рассмотренный выше метод, но вычисляется не функция сравнения, а коэффициент корреляции, который сравнивается с порогом Р;

 метод распознавания по вторичным признакам для стилизованных шрифтов;

 методы распознавания, основанные на нейросетях.

Соседние файлы в папке ref-16424