Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лінгвістичні основи док-ва.docx
Скачиваний:
14
Добавлен:
26.04.2019
Размер:
200.76 Кб
Скачать

28. Основні етапи: сканування, сегментування тексту, безпосереднє розпізнавання.

Якість розпізнавання багато в чому залежить від якості вихідного зображення. Як правильно відсканувати доку мент, як відкрити й розпізнати вже наявні на комп'ютері зображення, як можна обробити зображення й усунути де які його дефекти (наприклад, різного роду непотрібні зна ки, таблиці, лінії, що виникли при скануванні) і т.д.?

Перш ніж розпочати розпізнавання, програма має зна ти, які ділянки зображення треба розпізнавати. Для цього проводиться аналіз макета сторінки, під час якого виділяються блоки з текстом, картинки, таблиці та штрих-коди.

Завдання розпізнавання полягає в тому, щоб перетвори ти відскановане зображення в текст, зберігши при цьому оформлення сторінки. Перед розпізнаванням тексту необхідно встановити основні параметри: язык распознавания, тип печати распознанного текста и тип страницы.

Після завершення розпізнавання результат з'являється у вікні Текст. Вікно Текст — це вбудований редактор програми Finereader; у ньому можна перевірити результа ти розпізнавання та відредагувати розпізнаний текст.

У списку Рівень виділення помилок можна вибрати такі значення:

Немає — помилки розпізнавання не виділяються.

Стандартний — кольорами виділяються нерозпізнані й непевно розпізнані символи.

Максимальний — крім нерозпізнаних і непевно роз пізнаних символів, кольорами виділяються слова, яких немає в словнику мови розпізнавання.

Зауваження. Кількість показуваних у вікні Текст поми лок буде змінено після повторного розпізнавання документа.

Зупинятися на непевно розпізнаних словах. Система при перевірці орфографії зупинятиметься на словах, у яких були непевно розпізнані які-небудь літери Зупинятися на несловникових словах. Ця опція дає змогу перевірити слова, яких немає в словнику і які могли бути розпізнані програмою неправильно.

Зупинятися на складних словах. При перевірці орфографії система зупиняється на словах, яких немає у словнику, але які можуть бути побудовані за наявними морфологічними моделями або складені з наявних у словнику слів.

Ігнорувати слова із цифрами й іншими неалфавітними символами. При перевірці орфографії слів, всередині яких чіпляються цифри або які-небудь інші символи, що не входять в алфавіт мови розпізнавання, не вважаються помилковими, якщо вони не містять непевно розпізнані символи.

Результати розпізнавання можна зберегти у файл, передати у зовнішній додаток, не зберігаючи на диску, скопіювати в буфер обміну або відправити електронною поштою в кожному з підтримуваних програмою Finereader форматів збереження. Зберегти можна всі сторінки або тільки вибрані.

29. Основні складники тексту.

Текст (від лат. textum- тканина, сплетіння, з'єднання)- максимальна одиниця мови.

Для тексту характерні такі ознаки:

структурна єдність (всі мовні елементи пов'язані між собою за структурою);

смислова єдність (всі мовні елементи пов'язані між собою за смислом);

комунікативна цілеспрямованість;

жанрова віднесеність.

У тексті завжди про щось повідомляється. Це його тема.

СКЛАД ТЕКСТУ

Текст складається з інших мовленнєвих одиниць, об'єднаних смисловим зв'язком: речень, висловлювань, абзаців, розділів.

АБЗАЦ

Текст ділиться на абзаци. Абзац включає в себе одне або декілька речнь, зв'язаних між собою за змістом.

Абзаци також зв'язані між собою за змістом. Кожний абзац починається з нового рядкА. ОСНОВНІ ЧАСТИНИ ТЕКСТУ

Будь-який текст умовно можна поділити три логічні частини:

зачин (початок розповіді);

основна частина (розгортання думки чи подій у тексті);

висновок (кінець розповіді).ПОДІЛ ТЕКСТІВ ЗА СТИЛІСТИЧНИМИМ ОЗНАКАМИ

За стилістичними ознаками тексти поділяються на розмовно-побутові, художні, наукові, офіційно- ділові та публіцистичні.

ПОДІЛ ТЕКСТІВ ЗА МОВЛЕННЯМ

За мовленням тексти поділяються на усні і писемні.

За типом мовлення (або формою реалізації інформації) тексти поділяються на

тексти-розповіді, тексти-описи і тексти-роздуми.ПОДІЛ ТЕКСТІВ ЗА ЗВ'ЯЗКОМ

За зв'язком розрізняються тексти з ланцюговим зв'язком і тексти з паралельним зв'язком.

У тексті з ланцюговим зв'язком кожне наступне речення за смислом і будовою об'єднується з попереднім, поступово розвиваючи думку.

У тексті з паралельним зв'язком події розвиваються паралельно (відбуваючись одночасно), або чергують одна одну