Скачиваний:
15
Добавлен:
13.02.2014
Размер:
135.17 Кб
Скачать

Последовательность действий при распознавании с обучением:

  1. Установите режим Распознавание с обучением (на закладке Распознавание, меню Сервис>Опции в группе Распознавание с обучением установите переключатель в положение Распознавание с обучением). В строке состояния появится название эталона (по умолчанию default).

  2. Нажмите кнопку 2-Распознать.

  3. Обучите эталон, распознав одну-две страницы в режиме распознавание с обучением. Обучаемые символы заносятся в эталон, создаваемый системой по умолчанию. По окончании обучения система сохранит созданный эталон (default.ptn) в папке, где хранится пакет.

  4. Отредактируйте эталон.

  5. Отмените режим Распознавание с обучением (на закладке Распознавание в группе Обучение установите переключатель Распознавание с пользовательским эталоном).

  6. Запустите распознавание основного текста, нажав на кнопку 2-Распознать.

Замечание.

  1. Чтобы создать несколько эталонов на один пакет, воспользуйтесь диалогом Редактор эталонов (вызывается с закладки Распознавание по кнопке Эталоны или из меню Сервис>Редактор эталонов). Создайте новый эталон (нажмите в диалоге на кнопку Новый) и выберите его для работы (нажмите на кнопку Выбрать). Далее работа с созданным эталоном происходит так же, как и работа с default эталоном, см. выше пп 1-5.

  2. Если в процессе обучения было создано несколько эталонов, то подключается последний созданный эталон. Название подключенного эталона пишется в строке состояния.

  3. Чтобы подключить другой эталон для распознавания, в диалоге Редактор эталонов (меню Сервис>Редактор эталонов) в списке эталонов выберите эталон и нажмите кнопку Выбрать. На закладке Распознавание в группе Обучение установите переключатель в положение Распознавание с пользовательским эталоном.

  4. Если на закладке Распознавание отмечена опция Использовать встроенные эталоны, то в режиме Распознавание с обучением программа предложит обучить только неуверенно распознанные символы.

  5. Если Вы обучаете программу декоративным или нестандартным шрифтам (например, тибетскому) и при этом используете встроенные эталоны, программа может распознать часть символов неправильно, не предложив их обучить. В этом случае рекомендуется снять отметку с опции Использовать встроенные эталоны: обучение будет производиться каждому символу.

Пользовательские языки и группы языков

Вы можете использовать не только предопределенные языки и группы, но и создать новый язык или объединить существующие языки в новую группу и при распознавании подключить именно их.

Когда надо создавать новый язык:

  1. Для подключения пользовательского словаря.

Например, необходимо распознать русский текст, содержащий аббревиатуры. Вы можете создать словарь аббревиатур и подключить его к пользовательскому языку. На основе русского языка с подключенным системным словарем и языка, созданного Вами с подключенным словарем аббревиатур, Вы можете создать группу для дальнейшего ее использования при распознавании Ваших текстов.

  1. Для распознавания документов специального вида.

Например:

  • Страница содержит перечень артикулов, состоящий из цифр и нескольких букв. Вы можете создать новый язык, включив в него минимально необходимый набор символов, и использовать его для распознавания данного типа документов.

  • Документ использует только заглавные буквы английского языка. В этом случае для повышения качества распознавания следует исключить из распознавания символы, которые заведомо не могут встретиться в тексте, в данном случае - все строчные буквы.