Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пакет лекций.doc
Скачиваний:
9
Добавлен:
14.08.2019
Размер:
5.04 Mб
Скачать

Лекція 7. Розпізнавання тексту та графіків за допомогою програми FineReader. Програми перекладу тексту Play Ruta та Promt План заняття

  1. Можливості програми і завантаження FineReader

  2. Сканування документу

  3. Процес сегментації

  4. Розпізнавання тексту

  5. Редагування та збереження документа

  6. Переклад тексту за допомогою програми Plaj-Ruta.

  7. Переклад тексту за допомогою програми Promt.

  1. Можливості програми і завантаження FineReader

Можливості програми:

• підтримує протокол TWAIN. Зі сканерами фірм Microtec і Hewlett Packard може працювати безпосередньо;

• забезпечує автоматичну настройку на нові шрифти;

• має вбудовану систему перевірки орфографії для швидкого виявлення невірно розпізнаних слів;

• розпізнає таблиці зі збереженням їхньої структури;

• підтримує більш як 40 мов, може розпізнавати тексти на мішаних мовах, наприклад російсько-українські, англо-українські тощо, причому користувач може самостійно визначити мову або групу мов для тексту, який розпізнається;

• може працювати у пакетному режимі, що значно скорочує тривалість оброблення багатосторінкових документів. Пакет — це сукупність сторінок, об'єднаних загальним заголовком і впорядкованих за номерами;

• забезпечує передачу розпізнаних документів до Microsoft Word та Microsoft Excel.

Запуск програми здійснюється звичайними для середовища Windows засобами: або клацанням мишею на значку програми, або за командою ПУСКПрограммы-ABBYY FineReader—FineReader. Після закінчення завантаження на екрані з'являється робоче вікно програми.

Програма FineReader може видавати повідомлення для користувача на кількох мовах. Вибір мови здійснюється за командою СервисОпции (Tools — Options). На вкладці «Общие» («General») у списку «Язык интерфейса» необхідно вибрати потрібну мову і підтвердити вибір клацанням мишею на кнопці «ОК».

Основні операції оброблення документа у програмі FineReader виконуються за допомогою панелі інструментів або за допомогою Майстра Scan&Read.

Майстер Scan&Read викликається клацанням мишею на кнопці «Scan&Read». Робота користувача при цьому полягає у послідовному виконанні рекомендацій Майстра.

Кращих результатів можна досягти в разі сканування поетапно, використовуючи панелі інструментів, оскільки при цьому забезпечується більший контроль проміжних підсумків і можна, оперативно втрутившись, поліпшити якість сканування.

Процес оброблення документа складається з п'яти етапів:

1. Сканування документа (кнопка 1).

2. Сегментація документа (вертикальна панель інструментів або меню Изображение).

3. Розпізнавання документа (кнопка 2).

4. Редагування і перевірка результату (кнопка 3).

5. Збереження документа (кнопка 4).

Із кожною кнопкою панелі інструментів пов'язано меню, один із пунктів якого є в даний момент активним.

2. Сканування документу.

На етапі сканування проводиться здобуття зображень за допомогою сканера і збереження їх у вигляді, зручному для подальшого оброблення. Якщо потрібна точна настройка параметрів сканування, а також коли різні сторінки сильно різняться за якістю, краще працювати зі сканером через драйвер TWAIN. Як правило, в цьому режимі можна вибрати роздільну здатність, задати тип документа (текст, чорно-білий рисунок, чорно-білий напівтоновий рисунок, кольоровий малюнок та ін.). Для підключення драйвера TWAIN необхідно встановити позначку «Показывать диалог TWAIN-драйвера сканера» на вкладці «Сканирование», яка викликається за командою Сервис — Опции.

Щоб почати сканування, треба ввімкнути сканер і клацнути мишею на кнопці «1. Сканировать» панелі інструментів «Scan&Read» вікна програми FineReader.

Потім завантажується вікно TWAIN-драйвера відповідного сканера. В ньому спочатку виконується попереднє сканування: сканується вся область документа.

Після завершення попереднього сканування потрібно виділити відповідну область для повного сканування, провести корекцію зображення, зокрема горизонтальне та вертикальне вирівнювання, і визначити параметри зображення, такі як: чіткість зображення, режим кольору, яскравість та контрастність, роздільну здатність тощо. Під час вибору роздільної здатності потрібно мати на увазі, що чим вона вища, тим точніше результат відповідає оригіналу, але при цьому різко зростають розміри документа і збільшується тривалість сканування. Як правило, для текстових документів доброї якості можна вибрати роздільну здатність 200—300 точок/дюйм. Для того щоб здобути високоякісні зображення, необхідно встановити максимально можливу оптичну роздільну здатність.

Встановлення оптимальних параметрів повного сканування дає змогу зменшити обсяг інформації, яка передається зі сканера до програми, і тривалість її оброблення. Після встановлення нових параметрів може бути автоматично проведене повторне сканування.

Після закінчення сканування вікно TWAIN-драйвера закривається.

У момент завершення передачі у вікні «Пакет» програми FineReader оброблена сторінка відображається у вигляді значка, а на основній частині робочої області з'являється вікно «Изображение», що містить зображення поточної сторінки.

Вікно програми FineReader із зображенням документа

За допомогою кнопок панелі інструментів зображення можна повернути на кут, кратний 90°. У нижній частині вікна можна побачити збільшений фрагмент зображення, який вибирається у вікні «Изображение» клацанням мишею. Масштаб зображення в кожному вікні можна вибрати в контекстному меню або в меню Вид.

На цьому процес сканування закінчується. Подальше оброблення сканованого зображення можна зробити відразу ж або пізніше, зберігши його у вигляді графічного файла за командою Файл—Сохранить копию изображения..., а потім відкривши за командою Файл—Открыть.... За цими командами відкриваються стандартні вікна збереження і відкривання файла.