- •Список поддерживаемых приложений:
- •Проверка распознанного текста
- •Чтобы проверить результаты распознавания:
- •Опции сохранения распознанного текста
- •Режим сохранения форматирования и раскладки распознанного текста (при сохранении в форматах rtf, doc или html)
- •Сохранять/не сохранять картинки
- •Используемые шрифты (при сохранении в форматах rtf, doc или html)
- •Сохранять все или только выделенные страницы
- •Режимы передачи страниц пакета (при сохранении нескольких страниц пакета)
- •Опции сохранения распознанного текста
- •Распознавание в фоновом режиме
- •Сохранение распознанного текста в формате pdf Опции сохранения оформления документа:
- •Чтобы установить опции при сохранении в формате pdf:
- •Режимы использования шрифтов при сохранении в формате pdf
- •Чтобы указать программе, какие использовать шрифты Type 1:
- •Сохранение распознанного текста в формате html
- •Чтобы сохранить картинки в html-файле:
- •Форматы html
- •Высокий уровень интеллекта Распознавание с обучением
- •Внимание!
- •Последовательность действий при распознавании с обучением:
- •Замечание.
- •Пользовательские языки и группы языков
- •Когда надо создавать новый язык:
- •Когда надо создавать группу языков:
- •Сетевой ввод документов
- •Как работать с пакетом в сети:
БАЛАКОВСКИЙ ИНСТИТУТ ТЕХНИКИ, ТЕХНОЛОГИИ И УПРАВЛЕНИЯ
ФАКУЛЬТЕТ ИНЖЕНЕРНО-СТРОИТЕЛЬНЫЙ
КАФЕДРА УПРАВЛЕНИЕ И ИНФОРМАТИКА В ТЕХНИЧЕСКИХ СИСТЕМАХ
ПРАКТИЧЕСКАЯ РАБОТА №3
по дисциплине
Основы методики описания технических устройств
ABBYY FineReader 5.0 Pro
Выполнил ст. гр. УИТ-51
Колесникова Е.В.
Принял
Калинина А.В.__________
«____» _____________2004г.
2004
ABBYY FineReader 5.0 Pro - это система оптического распознавания текстов. Она преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т.е. в коды букв, «понятные» компьютеру).
Процесс ввода текстов в компьютер осуществляется в 4 этапа:
1. Сканирование.
2. Выделение блоков на изображении.
3. Распознавание.
Эти действия можно проводить с помощью кнопок на панели Scan&Read.
4. Cохранение результатов распознавания
Результаты распознавания можно сохранить в файл, передать во внешнее приложение, не сохраняя на диск, скопировать в буфер обмена или отправить по электронной почте. Сохранить можно все страницы или только выбранные.
Список поддерживаемых приложений:
Microsoft Word 6.0, 7.0, 97 (8.0) и 2000 (9.0); Microsoft Excel 6.0, 7.0, 97 (8.0) и 2000 (9.0); Corel WordPerfect 7.0, 8.0 и 9.0; Lotus Word Pro 9.5 и 97; StarWriter 4.х и 5.х, PROMT 98 и все приложения, поддерживающие стандарт ODMA.
Форматы, в которых FineReader сохраняет распознанный текст:
Microsoft Word Document(*.DOC)
Rich Text Format (*.RTF)
Adobe Acrobat Format (*.PDF)
HTML
Comma Separated Values File (*.CSV)
Простой текст (*.TXT). FineReader поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодировку Unicode.
Microsoft Excel Speadsheet (*.XLS)
DBF
Поддерживаемые графические форматы:
BMP: 2-битный - ч/б 4- и 8-битный - Palette 16-битный 24-битный - Palette и TrueColor 32-битный
PCX, DCX: 2-битный - ч/б 4- и 8-битный – серый
JPEG: серый и TrueColor
TIFF: ч/б - несжатый, CCITT3, CCITT3FAX, CCITT4, Packbits серые - несжатый, Packbits, JPEG TrueColor - несжатый, JPEG Palette - несжатый, Packbits многостраничный TIFF
PNG: ч/б, серый, цветной
FineReader сохраняет изображения в следующих форматах:
BMP: ч/б, серый, цветной; PCX: ч/б, серый; JPEG: серый, цветной; TIFF: ч/б - несжатые, CCITT3, CCITT4, packbits; серые - несжатые, packbits, JPEG; цветные - несжатый и JPEG
PNG: ч/б, серый, цветной
НИЗКИЙ УРОВЕНЬ ИНТЕЛЛЕКТА
Сканирование и распознавание одной кнопкой Scan&Read
Провести сканирование и распознавание можно одной кнопкой Scan&Read. Мастер Scan&Readвызывает специальный режим, при котором Вы можете отсканировать и распознать страницу или открыть и распознать графическое изображение. При этом каждый шаг сопровождается подсказками системы.
Распознаваемое изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз и строки должны быть параллельны нижнему краю экрана.
Вы можете указать программе, чтобы она автоматически подбирала ориентацию страницы.
Если ориентация не подбирается автоматически, повернуть изображение можно вручную для этого необходимо:
Выделить нужные изображения.
Нажать кнопку, чтобы повернуть изображения влево на 90 градусов.
Нажмите кнопку, чтобы повернуть изображения вправо на 90 градусов.
Из меню Изображение выбрать пункт Повернуть на 180 градусов, чтобы перевернуть изображение вверх ногами.
Для ручной сегментации страницы
Активизируйте открытое изображение.
Установите курсор мыши в угол предполагаемого блока.
Нажмите мышью и, не отпуская кнопки, потяните в противоположный по диагонали угол.
Текст заключается в рамку. По умолчанию это текстовый блок. Границы блоков не должны пересекаться, иначе содержимое их пересечения распознается повторно.
Чтобы изменить тип блока необходимо нажать правой кнопкой мыши на одном из выделенных блоков и из локального меню выбирается пункт Тип блока, а затем - нужный подпункт.
Язык распознавания и тип текста являются главными параметрами распознавания. При распознавании текста на том или ином языке выбирается нужный язык из списка на панели.
Тип текста определяется в системе автоматически. Однако если Вы распознаете тексты, напечатанные на пишущей машинке или матричном принтере в черновом режиме, то для того, чтобы повысить надежность и скорость распознавания, выберите соответствующее значение в списке на панели инструментов.