Скачиваний:
15
Добавлен:
13.02.2014
Размер:
135.17 Кб
Скачать

Чтобы указать программе, какие использовать шрифты Type 1:

  • Нажмите кнопку Шрифты Type 1на закладкеPDFдиалогаФорматы(менюСервис>Форматы).

Сохранение распознанного текста в формате html

Режимы сохранения оформления устанавливаются на закладке Форматирование диалога Опции(менюСервис>Опции).

Замечание. При сохранении в формате HTML используются шрифты, установленные на закладке Форматирования диалогаОпции(менюСервис>Опции), или те, которые Вы выбрали в процессе редактирования текста в окнеТекст.

Чтобы сохранить картинки в html-файле:

  • На закладке Форматирование диалога Опции(менюСервис>Опции) отметьте опцииСохранять картинки.

Замечание.Картинки сохраняются в отдельные файлы с расширением *.jpg.

Форматы html

  1. Полный (совместим с Internet Explorer 4.0)- файл записывается в новом формате - HTML 4, что позволяет точно передать оформление документа, используя при этом таблицу стилей, встраиваемой в html-файл.

  2. Простой (совместим со всеми браузерами) - файл записывается в формате HTML 3; оформление сохраняется приблизительно (не сохраняются отступы первой строки, неточное сохранение размера шрифта). Этот формат HTML поддерживается всеми браузерами (Netscape Navigator и Internet Explorer 3.0 и выше).

  3. Авто (Простой и Полный форматы сохраняются в один файл) - в один файл сохраняются два формата (Простой иПолный), при этом при показе файла в браузере автоматически выбирается один из них в соответствии с типом и версией браузера.

Высокий уровень интеллекта Распознавание с обучением

Программа FineReader позволяет вводить тексты разного качества, напечатанные практически любыми шрифтами. Тексты хорошего и среднего качества, а также шрифты обычного начертания распознаются без предварительного обучения. 

Режим "Распознавание с обучением" используется для:

  1. распознавания текстов, использующих декоративные шрифты;

  2. распознавания текстов, в котором встречаются специальные символы (например, отдельные математические символы);

  3. распознавания большого объема (более 100 страниц) текста плохого качества.

В других случаях Распознавание с обучением использовать не рекомендуется, т.к. затраты на обучение будут больше, чем полученный выигрыш в качестве распознавания.

Обучение проводится при распознавании одной-двух страниц текста в специальном режиме. В результате создается эталон букв, встречающихся в тексте. Этот эталон в дальнейшем используется при распознавании основного объема текста. Некоторые пары или тройки символов в тексте могут склеиваться. Если при обучении Вам не удается переместить описывающий прямоугольник так, чтобы он заключал в себя один целый символ и не содержал при этом части соседних, то Вы можете обучить программу сочетанию символов, которые невозможно «расклеить». Такие неразделяемые сочетания двух или трех символов называются лигатурами. Это, например, такие сочетания как ед, от, ff, ffi, ffl и другие.

Внимание!

  1. Созданный эталон можно использовать только для распознавания текстов, использующих тот же шрифт и размер шрифта и отсканированных с тем же разрешением, как и документ, на котором данный эталон создавался.

  2. При удалении пакета эталон также удаляется.

  3. Вы можете сохранить созданный эталон для работы с другими пакетами. Для этого сохраните настройки пакета в формате шаблон пакета (*.fbt).

  4. При переходе к распознаванию текстов, напечатанных другим шрифтом, не забудьте отключить эталон (на закладке Распознавание, меню Сервис>Опции установите переключатель в положение Не использовать пользовательский эталон).