Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OCR_FineReader_11.docx
Скачиваний:
12
Добавлен:
03.05.2019
Размер:
2.31 Mб
Скачать
    1. Технологические возможности системы оптического распознавания символов FineReader

Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии «целостного целенаправленного адаптивного распознавания».

Система обладает следующими технологическими возможностями:

  1. совместима с большим количеством настольных сканеров;

  2. распознает отсканированную страницу, включая многоколонный текст и текст со сложным оформлением;

  3. позволяет сканировать и записывать изображение как графическое, а потом распознать текст;

  4. имеет набор возможностей по записи файлов, позволяющий сканировать серию страниц, причем программа будет осуществлять автозапись и присвоение имен последовательно;

  5. может читать изображения, отсканированные другими программами;

  6. может обрабатывать документы, отпечатанные типографским способом, на принтерах, печатной машинке;

  7. сохраняет первоначальное форматирование;

  8. благодаря технологии адаптивного распознавания документов ADRT® (Adaptive Document Recognition Technology) ABBYY FineReader позволяет анализировать и обрабатывать документ целиком, а не постранично. В результате восстанавливается исходная структура документа, включая форматирование, гиперссылки, адреса электронной почты, а также колонтитулы, подписи к картинкам и диаграммам, номера страниц и сноски.

  9. ABBYY FineReader распознает документы, написанные на одном или нескольких из 189 языков, включая арабский, вьетнамский, корейский, китайский, японский, тайский и иврит. В программу встроена функция автоматического определения языка документа;

  10. имеет внутренний редактор и словарный контроль, в сомнительных случаях в окне встроенного редактора показывается распознанный текст с выделением слов, отсутствующих в словаре, в расположенном рядом окне расширения можно видеть увеличенное изображение отсканированного текста для редактирования.

    1. Главное окно и панели инструментов программы FineReader

При запуске программы FineReader появляется окно (рис. 14.2), с помощью опций которого выбирается необходимая задача, например, можно осуществить распознавание документа в формате PDF в документ Word.

Рис. 14.2. Окно начала работы в FneReader

При выборе опций, расположенных на вкладке ОСНОВНЫЕ в правой части окна НОВАЯ ЗАДАЧА можно:

  1. выбрать язык распознавания текста;

  2. изменить цветовой режим изображения, например, выбрать черно-белое изображение;

  3. выбрать команду сканирования изображения;

  4. открыть ранее созданное изображение с помощью команды ОТКРЫТЬ PDF/ИЗОБРАЖЕНИЕ, а затем в появившемся окне ОТКРЫТЬ ИЗОБРАЖЕНИЕ (рис. 14.3) указать нужное изображение;

  5. создать документ.

Рис. 14.3. Окно для открытия изображения

Работая с программой FineReader, пользователь всегда имеет дело с некоторым документом. Каждое отсканированное изображение записывается как отдельная страница.

В главном окне программы (рис. 14.4) отображается текущий открытый документ ABBYY FineReader.

Рис. 14.4. Главное окно программы Fine Reader

В окне СТРАНИЦЫ отображаются страницы, входящие в документ FineReader. Возможны два режима отображения страниц: пиктограммы (рис. 14.4) или таблица со столбцами сведений о страницах документа. Режим можно менять из контекстного меню данного окна, из меню ВИД, из диалога ОПЦИИ (меню СЕРВИС–ОПЦИИ…).

В окне ИЗОБРАЖЕНИЕ показывается изображение текущей страницы. Это окно позволяет редактировать области на изображении, изображения страниц, свойства текста.

В окне ТЕКСТ отображается распознанный текст. В нем можно проверять орфографию, форматировать и редактировать текст, полученный в результате распознавания.

В окне КРУПНЫЙ ПЛАН отображается увеличенное изображение редактируемой строки или обрабатываемого участка изображения. Если в окне ИЗОБРАЖЕНИЕ вы видите общий вид страницы, то в окне КРУПНЫЙ ПЛАН удобно просмотреть изображение более детально, скорректировать тип и положение областей или сравнить неуверенно распознанный символ с его увеличенным изображением. Масштаб изображения в окне КРУПНЫЙ ПЛАН регулируется при помощи панели , расположенной в нижней части этого окна.

Возможно перемещение изображения в окнах ИЗОБРАЖЕНИЕ и КРУПНЫЙ ПЛАН при помощи мыши, удерживая клавишу ПРОБЕЛ. Поменять взаимное расположение окон на экране можно с помощью меню ВИД.

Окна ИЗОБРАЖЕНИЕ, КРУПНЫЙ ПЛАН и ТЕКСТ связаны между собой: при двойном щелчке на изображении в окне ИЗОБРАЖЕНИЕ курсор в окнах КРУПНЫЙ ПЛАН и ТЕКСТ (при наличии распознанного текста) переместится на ту же позицию, что и в окне ИЗОБРАЖЕНИЕ.

В главном окне программы ABBYY FineReader имеется несколько панелей инструментов. Кнопки на панелях — удобное средство доступа к командам программы. Эти же команды можно выполнять из меню программы или с помощью горячих клавиш.

ГЛАВНАЯ ПАНЕЛЬ (рис. 14.5) содержит фиксированный набор кнопок, позволяющих выполнить все основные действия: открыть документ, отсканировать страницу, открыть изображение, распознать страницы, сохранить результаты и др.

Рис. 14.5. Главная панель инструментов

Состав панели быстрого доступа (рис. 14.6) можно настроить, добавив на нее кнопки для выполнения практически любой команды главного меню. По умолчанию эта панель не отображается в главном окне. Чтобы ее отобразить, используется меню ВИД–ПАНЕЛИ ИНСТРУМЕНТОВ–ПАНЕЛЬ БЫСТРОГО ДОСТУПА.

Рис. 14.6. Панель быстрого доступа

Каждое окно имеет свою панель инструментов для удобства работы. Панели инструментов окон СТРАНИЦЫ, ИЗОБРАЖЕНИЕ, ТЕКСТ находятся в верхней части этих окон. Панель инструментов окна СТРАНИЦЫ содержит фиксированный набор кнопок. Панели инструментов окон ИЗОБРАЖЕНИЕ и ТЕКСТ можно настроить по своему усмотрению. Панель ИЗОБРАЖЕНИЕ содержит кнопки, позволяющие производить анализ макета страницы (например, создать и отредактировать блоки).

Панель предупреждений (рис. 14.7) — панель, на которой отображаются предупреждения и сообщения об ошибках, возникающие в процессе работы программы.

Рис. 14.7. Панель предупреждения

Диалоговое окно ОПЦИИ содержит настройки, позволяющие регулировать настройки открытия, сканирования, распознавания, сохранения документов в различные форматы, вид окон программы, выбирать язык и тип печати входного документа, язык интерфейса программы и др. Данное окно открывается с помощью меню СЕРВИС–ОПЦИИ…, из панели инструментов, диалогов сохранения в различные форматы, диалогов открытия изображений и контекстного меню панели инструментов.

Диалоговое окно ОПЦИИ имеет 6 вкладок: ДОКУМЕНТ (рис. 14.8), СКАНИРОВАТЬ/ОТКРЫТЬ (рис. 14.9), РАСПОЗНАТЬ (рис. 14.10), СОХРАНИТЬ (рис. 14.11), ВИД (рис. 14.12), ДОПОЛНИТЕЛЬНЫЕ (рис. 14.13).

Рис. 14.8. Вкладка ДОКУМЕНТ диалогового окна ОПЦИИ

Рис. 14.9. Вкладка СКАНИРОВАТЬ/ОТКРЫТЬ диалогового окна ОПЦИИ

Рис. 14.10. Вкладка РАСПОЗНАТЬ диалогового окна ОПЦИИ

Рис. 14.11. Вкладка СОХРАНИТЬ диалогового окна ОПЦИИ

Рис. 14.12. Вкладка ВИД диалогового окна ОПЦИИ

Рис. 14.13. Вкладка ДОПОЛНИТЕЛЬНЫЕ диалогового окна ОПЦИИ

На вкладке ДОКУМЕНТ можно настраивать языки документа, тип печати, цветовой режим, свойства документа. Также на этой вкладке указан путь к открытому документу FineReader.

На вкладке СКАНИРОВАТЬ/ОТКРЫТЬ определяются общие опции автоматической обработки документа, а также опции предобработки изображений при сканировании и открытии документов, такие как:

  • производить или нет автоматический анализ страниц документа (автоматически определять области и их типы);

  • выполнять ли автоматическое конвертирование изображений страниц;

  • выполнять ли автоматическую предобработку изображений;

  • следует ли автоматически определять ориентацию страниц;

  • разбивать ли сдвоенные страницы.

Также здесь можно выбрать драйвер для сканера и интерфейс сканирования.

На вкладке РАСПОЗНАТЬ содержатся настройки распознавания:

  • следует ли применять быстрое или детальное распознавание;

  • следует ли обучить или использовать при распознавании пользовательский эталон;

  • пользовательские эталоны и языки;

  • какие шрифты использовать при сохранении распознанного текста;

  • следует ли распознавать штрих-коды.

Вкладка ВИД содержит:

  • настройки для вида страниц в окне СТРАНИЦЫ (ПИКТОГРАММЫ или ТАБЛИЦА);

  • опции для окна ТЕКСТ — выделять ли цветом (и каким) неуверенно распознанные символы и слова, отображать ли непечатаемые символы (например, перевод строки), какой шрифт использовать для отображения простого текста (plain text);

  • параметры задания цвета и толщины рамок, используемых для выделения различных типов областей в окне ИЗОБРАЖЕНИЕ.

На вкладке ДОПОЛНИТЕЛЬНЫЕ можно выбрать:

  • настройки верификации неуверенно распознанных символов;

  • корректировать ли пробелы до и после знаков пунктуации;

  • просмотр и редактирование пользовательских словарей;

  • язык интерфейса программы;

  • открывать ли при запуске приложения последний использованный документ FineReader;

  • показывать ли панель предупреждений;

  • участвовать ли в программе по улучшению качества Abbyy FineReader;

  • следует ли восстановить настройки по умолчанию.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]