Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
итт все лекции.docx
Скачиваний:
81
Добавлен:
13.04.2015
Размер:
243.64 Кб
Скачать

Microsoft Office Document Imaging

В последних версиях офисного пакета Microsoft Office появились инструменты для сканирования и распознавания текста – MS Office Document Scanning (рис. 5) и Document Imaging. Для этих приложений характерна высокая степень интеграции с другими приложениями MS Office, поддерживаются средства индексирования документов. Document Imaging может открывать файлы MDI (собственный формат Microsoft для сжатия изображений) и TIFF, и передавать результаты распознавания в Microsoft Word.

Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.

Рис. 5. Скриншот MS Office Document Scanning (слева)

и  MS Office Document Imaging (справа)

Readiris

Readiris разработана компанией I.R.I.S. Так же как и другие программы распознавания текста, Readiris преобразует отсканированные изображения документов в редактируемый формат. Readiris уверенно распознает документы, содержащие сложную верстку, таблицы, иллюстрации.

Существуют Pro и Corporate версии этого продукта, а также добавочные модули распознавания ближневосточных и восточных языков. Версия Corporate отличается от Pro улучшенной работой с PDF, поддержкой сжатия выходных файлов, распознаванием одного пакета в несколько файлов, индексированием распознанных документов и другими возможностями. В Corporate версии есть удобное средство для автоматического распознавания файлов, попадающих в определенную папку (Watched folder).

Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки - арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Вместе с поддержкой распознавания популярных форматов картинок распознаются файлы  формата PDF и DjVu.

Рис. 6. Скриншот Readiris для Windows

OmniPage

 Программа OmniPage, служащая для  сканирования и распознавания текста, представлена на рынке компанией Nuance Communications.

Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. В этой программе есть поддержка параллельной работы с несколькими документами: можно открывать, распознавать, корректировать и сохранять несколько документов одновременно.

OmniPage выпускается в трех версиях: Standard, Professional, Enterprise. Версия Professional, в отличие от Standard, включает средство для управления документами, ParerPort, и программаPDF Create, позволяющее создавать PDF документы из любого приложения. В версии Enterprise добавлены интеграция с Microsoft SharePoint Server, дополнительные сетевые и многопользовательские функции. 

В программе реализована технология "3D Correction", которая позволяет корректировать и распознавать изображения, полученные с цифровых камер для более точного распознавания специфических терминов  Программа оснащена встроенными словарями – финансовым, юридическим, медицинским.

 OmniPage (рис. 6) позволяет сохранять результаты распознавания в PDF, HTML, Microsoft Word, Excel и PowerPoint, Corel WordPerfect и других форматах, имеет возможность распознавания информации из различных электронных форм и анкет.

OmniPage позволяет использовать средства коррекции изображений: удаление шума с рисунков, регулировка контрастности, яркости, других параметров.