Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы_по_ИТ.doc
Скачиваний:
51
Добавлен:
24.04.2019
Размер:
407.55 Кб
Скачать

Вопрос 19. Общий принцип mda. Классификаторы, используемые при распознавании символов в abbyy Fine Reader.

Многоуровневый анализ документа - MDA multilevel document analysis

Выполняется многоуровневая декомпозиция документа - строки разбиваются на слова, слова на буквы и т.д. когда символы выделены и распознаны, выполняется последовательная сборка документа от нижних уровней к высшим. При наличии ошибок при распознавании верхнего уровня (абзац перепутан с иллюстрацией) успешное завершение процесса практически невозможно.

Защита от коллизий MDA в fine reader

  1. Объекты любого уровня распознаются в соответствии с принципами IPA, в первую очередь целенаправленно проверяются гипотезы о типах обнаруженных объектов

  2. Результаты анализа на любом из нижних уровней способны повлиять на действия с объектами верхних уровней

При выделении объектов в процессе перехода от уровня страницы до уровня слова fine reader использует процедуры интеллектуальной фильтрации фоновых структур и адаптивной бинаризации:

  1. Позволяет отделять строки текса от сколь угодно сложного фона

  2. Гибко выбирать оптимальные параметры бинаризации

При выделении символов из слова используются классификаторы (механизмы распознания букв):

  1. Растровый – классифицирует методом сопоставления матриц, эталоны символов строятся тупеем наложения друг на друга большого количества одних и тех же букв в разных вариантах начертания.

  2. Контурный – аналогичен растровому, за исключением того, что для сравнения используется не полный образ эталона, а его контур. Эффективен при распознавание декоративного шрифта.

  3. Признаковый – выполняет сравнение символа с признаками эталона, в качестве признаков могут быть – количество заполненных точек в некотором направлении, периметр контура и т.д. Точность работы зависит от выбора набора признаков. Признаки – выделяемые при анализе растрового изображения.

  4. Структурный – классифицирует методом выделения признаков, т.е. сравнивает набор структурных элементов символа с элементами эталона. Работает медленнее и точнее предыдущих. Признаки – дуги и их сопоставлении.

  5. Признаково-дифференциальный – ориентирован на анализ отличий между схожими объектами.

  6. Структурно-дифференциальный – ориентирован на анализ отличий структуры.

Распознание начинается с растрового и признакового классификатора, которые формируют совокупность гипотез о символе, рассортированных по весу. Для дальнейшей работы с гипотезами используют структурно-дифференциальный и структурный классификатор. При сборке слов из букв используют различные модели слов – словарное слово, не словарное слово, e-mail, URL, цифры с префиксом или суффиксом, регулярное выражение и т.д.

В результате формируется набор гипотез о расшифровке слова.

Окончательное решение принимается в ходе контекстной проверки, которая путем анализа окружения слова позволяет определить язык, предпочтение между буквами и цифрами и т.д.

Из распознанных слов получаются текстовые блоки, которые размещаются на странице в соответствии с положением оригинала. 100% точность распознавания является пока недостижимой, показатели, достигаемые в fine reader - 1-3 ошибки на страницу – являются вполне приемлемыми и позволяют значительно ускорить процесс ввода печатного текста.