- •Список поддерживаемых приложений:
- •Проверка распознанного текста
- •Чтобы проверить результаты распознавания:
- •Опции сохранения распознанного текста
- •Режим сохранения форматирования и раскладки распознанного текста (при сохранении в форматах rtf, doc или html)
- •Сохранять/не сохранять картинки
- •Используемые шрифты (при сохранении в форматах rtf, doc или html)
- •Сохранять все или только выделенные страницы
- •Режимы передачи страниц пакета (при сохранении нескольких страниц пакета)
- •Опции сохранения распознанного текста
- •Распознавание в фоновом режиме
- •Сохранение распознанного текста в формате pdf Опции сохранения оформления документа:
- •Чтобы установить опции при сохранении в формате pdf:
- •Режимы использования шрифтов при сохранении в формате pdf
- •Чтобы указать программе, какие использовать шрифты Type 1:
- •Сохранение распознанного текста в формате html
- •Чтобы сохранить картинки в html-файле:
- •Форматы html
- •Высокий уровень интеллекта Распознавание с обучением
- •Внимание!
- •Последовательность действий при распознавании с обучением:
- •Замечание.
- •Пользовательские языки и группы языков
- •Когда надо создавать новый язык:
- •Когда надо создавать группу языков:
- •Сетевой ввод документов
- •Как работать с пакетом в сети:
Последовательность действий при распознавании с обучением:
Установите режим Распознавание с обучением (на закладке Распознавание, меню Сервис>Опции в группе Распознавание с обучением установите переключатель в положение Распознавание с обучением). В строке состояния появится название эталона (по умолчанию default).
Нажмите кнопку 2-Распознать.
Обучите эталон, распознав одну-две страницы в режиме распознавание с обучением. Обучаемые символы заносятся в эталон, создаваемый системой по умолчанию. По окончании обучения система сохранит созданный эталон (default.ptn) в папке, где хранится пакет.
Отредактируйте эталон.
Отмените режим Распознавание с обучением (на закладке Распознавание в группе Обучение установите переключатель Распознавание с пользовательским эталоном).
Запустите распознавание основного текста, нажав на кнопку 2-Распознать.
Замечание.
Чтобы создать несколько эталонов на один пакет, воспользуйтесь диалогом Редактор эталонов (вызывается с закладки Распознавание по кнопке Эталоны или из меню Сервис>Редактор эталонов). Создайте новый эталон (нажмите в диалоге на кнопку Новый) и выберите его для работы (нажмите на кнопку Выбрать). Далее работа с созданным эталоном происходит так же, как и работа с default эталоном, см. выше пп 1-5.
Если в процессе обучения было создано несколько эталонов, то подключается последний созданный эталон. Название подключенного эталона пишется в строке состояния.
Чтобы подключить другой эталон для распознавания, в диалоге Редактор эталонов (меню Сервис>Редактор эталонов) в списке эталонов выберите эталон и нажмите кнопку Выбрать. На закладке Распознавание в группе Обучение установите переключатель в положение Распознавание с пользовательским эталоном.
Если на закладке Распознавание отмечена опция Использовать встроенные эталоны, то в режиме Распознавание с обучением программа предложит обучить только неуверенно распознанные символы.
Если Вы обучаете программу декоративным или нестандартным шрифтам (например, тибетскому) и при этом используете встроенные эталоны, программа может распознать часть символов неправильно, не предложив их обучить. В этом случае рекомендуется снять отметку с опции Использовать встроенные эталоны: обучение будет производиться каждому символу.
Пользовательские языки и группы языков
Вы можете использовать не только предопределенные языки и группы, но и создать новый язык или объединить существующие языки в новую группу и при распознавании подключить именно их.
Когда надо создавать новый язык:
Для подключения пользовательского словаря.
Например, необходимо распознать русский текст, содержащий аббревиатуры. Вы можете создать словарь аббревиатур и подключить его к пользовательскому языку. На основе русского языка с подключенным системным словарем и языка, созданного Вами с подключенным словарем аббревиатур, Вы можете создать группу для дальнейшего ее использования при распознавании Ваших текстов.
Для распознавания документов специального вида.
Например:
Страница содержит перечень артикулов, состоящий из цифр и нескольких букв. Вы можете создать новый язык, включив в него минимально необходимый набор символов, и использовать его для распознавания данного типа документов.
Документ использует только заглавные буквы английского языка. В этом случае для повышения качества распознавания следует исключить из распознавания символы, которые заведомо не могут встретиться в тексте, в данном случае - все строчные буквы.