Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
итт все лекции.docx
Скачиваний:
81
Добавлен:
13.04.2015
Размер:
243.64 Кб
Скачать

Abbyy Finereader

Данная программа  является продуктом российской компании ABBYY. Finereader обеспечивает качественное распознавание и сохранение оформления документов. Существуют три версии этого пакета распознавания: Home Edition, Professional Edition и Corporate Edition, которые отличаются своими возможностями, пользовательским интерфейсом, ценой и типом лицензии.

Рис. 7. Окно программы OmniPage

Версия Home Edition предназначена только для домашнего использования и пригодится тем, кому время от времени требуется получить распознанную копию страниц книги, учебника, статьи из журнала для последующего редактирования в распространенных офисных программах. Интерфейс программы упрощен, для работы можно выбрать один из типовых способов обработки изображения и нажатием одной кнопки быстро получить результат.

Professional и Corporate Edition имеют профессиональный интерфейс, дополнительно содержат поддержку распознавания PDF-файлов, встроенный редактор текста, проверку орфографии. Corporate версия ориентирована на использование в организациях, поддерживаются сетевые сканеры и многофункциональные устройства, добавлены возможности для совместной работы пользователей.

Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг.

В версии 9.0 также есть возможность распознавания изображений, полученных с цифровых фотоаппаратов. Обработка таких изображений имеет свои особенности, нужно скорректировать неравномерное освещение страницы, недостаточную резкоcть, изгиб строчек текста.

Рис. 8. Окно программы Finereader Professional Edition

Ocr cuneiform

OCR CuneiForm  – это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies. Первоначально OCR CuneiForm разрабатывался как коммерческий продукт, однако, в декабре 2007 года компания-разработчик стала распространять программу бесплатно, а в апреле 2008 года открыла исходные тексты программы. В планах дальнейшее развитие этой системы распознавания текста – проект OpenOcr.Org, поддерживаемый компанией Cognitive Technologies и сообществом OpenSource разработчиков.

Эта OCR-программа прилагается в комплекте с некоторыми моделями сканеров фирм Canon, Hewlett Packard, Oki, Olivetti. Технологии распознавания компании Cognitive используются в популярном издательском пакете Corel Draw.

OCR CuneiForm (рис. 9) обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста.

OCR CuneiForm  имеет следующие основные возможности:

             современный и интуитивно-понятный интерфейс, встроенные помощники для сканирования и распознавания текста;

             встроенный текстовый редактор и система контроля правописания для работы с распознанным текстом;

             распознавание текста с сохранением исходного вида документа;

             распознавание таблиц со сложной структурой, многоколоночного текста;

             сохранение черно-белых и цветных иллюстраций в распознанном документе;

             поддерживаются все TWAIN-совместимые сканеры;

             использование современных разработок, таких как нейронные сети, адаптивное распознавание символов, когнитивный анализ и другие;

             распознавание печатных шрифтов из книг, журналов, газеты, текстов из пишущих машинок, распечаток из матричных и лазерных принтеров и т.п.;

             режимы автоматического, полуавтоматического и ручного разбиения на блоки для поиска в документе текстовых фрагментов, рисунков и таблиц;

             дополнительные возможности, повышающие удобство работы с программой.