Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ / М 3 Офісні програмні системи / Додаток / Зан_доп Т10 Лк - Преобразование документов в электронную форму.doc
Скачиваний:
99
Добавлен:
19.02.2016
Размер:
764.42 Кб
Скачать

Тема лекції:

«Перетворення документів у електронну форму»

ПЛАН

Вступ

1. Кодування даних в комп'ютері

2. Техніка сканування документів

3. Призначення та можливості програми оптичного розпізнавання текстів FineReader

Висновки

ЛІТЕРАТУРА

  1. Інформатика: Комп’ютерна техніка. Комп’ютерні технології. Підручник. 2-ге вид. – К.: Каравела, 2008. с. 540-549.

  2. Информатика: Базовый курс. 2-е издание / Под ред. С.В.Симоновича. – СПб.: Питер, 2005. с. 488-498.

  3. Симонович С.В., Евсеев Г.А., Алексеев А.Г. Специальная информатика: Учебное пособие. – М.: АСТ-ПРЕСС: Инфорком-Пресс, 1998. с. 183-205.

Введение

Деятельность любой организации неразрывно связана с документами: справками, отчетами, рапортами, аналитическими записками и т.д. Сотни и тысячи бумажных документов сопровождают ежедневную работу сотрудников. Как же бороться с этим «бумажным валом»? Естественный ответ – с помощью компьютеров, обладающих огромными возможностями по хранению документов и их обработке. Действительно, одной из основных задач информатики является разработка и внедрение средств и методов использования вычислительной техники для перевода документооборота из бумажной формы в электронную. Это позволяет:

  • значительно сократить сроки подготовки документов за счет использования сетевых технологий;

  • оперативно вносить в них необходимые коррективы (поддерживать в актуальном состоянии);

  • быстро передавать нужным адресатам;

  • надежно защищать информацию от несанкционированного доступа;

  • экономить средства и т.д.

Однако полностью отказаться от бумажных документов в настоящее время – это просто абсурд. Можно ли себе представить отсутствие книг, журналов, газет? Проблема заключается в другом. Как преобразовать информацию, заключенную в бумажных документах в электронную форму – ту «пищу», которую может «переварить» компьютер? Вот здесь-то и приходит на помощь информатика, в которой указанная проблема решается созданием и внедрением специальных аппаратных и программных средств, осуществляющих преобразование бумажной графической и текстовой информации в электронный вид.

Процесс преобразования бумажных документов в электронные осуществляется последовательным выполнением следующих основных этапов:

  1. сканирование исходного бумажного документа с помощью специального устройства – сканера, осуществляющего оцифровку изображения, т.е. получение как бы «цифровой фотографии» бумажного листа;

  2. сегментация отсканированного документа на объекты распознавания: текстовые фрагменты, таблицы и изображения;

  3. распознавание полученного «цифрового портрета», т.е. преобразование электронного изображения в текстовые данные, с которыми можно дальше работать, используя текстовые, табличные или графические процессоры.

Целью данной лекции является раскрытие методики использования в работе сканеров и программных средств распознавания.

1. Кодирование данных в компьютере

Для создания, хранения, обработки и передачи информации с помощью ЭВМ одним из центральных вопросов является способ представления данных. Общеизвестно, что данные, предназначенные для обработки, могут быть физически представлены в аналоговой или цифровой форме.

Разница между аналоговой информацией и цифровой заключается, прежде всего, в том, что аналоговая информациянепрерывна, а цифровая — дискретна.

Как же непрерывные данные представить в цифровой форме? Для этого применяются специализированные микросхемы, осуществляющие аналого-цифровое преобразование (АЦП).

Принцип их действия иллюстрирует рис. 1.1. График функции y=х2 (рис. 1.1а) представляет собой непрерывную функцию. Тот же самый график (рис. 1.1б) после преобразования в цифровую форму выглядит иначе — намного грубее. Погрешность, возникающая при таком преобразовании, называется погрешностью цифрового преобразования.

Электронные устройства (микросхемы), осуществляющие преобразование аналоговых сигналов в дискретные (цифровые), называются аналого-цифровыми преобразователями (АЦП). Они устанавливаются на звуковых картах, видеокартах персонального компьютера, в сканерах и других периферийных устройствах.

Следующий вопрос, который необходимо решить: как информация хранится в компьютере или на внешних носителях? Любая информация всегда хранится в виде кодов. Код — это совокупность знаков (символов, букв) из некоторого конечного множества (алфавита) и система определенных правил, с помощью которых информация может быть представлена в виде набора из таких символов для хранения, обработки и передачи. Кодирование – представление какой-либо информации в виде кода.

В виде кодов хранятся тексты документов, изображения (статические – различные картинки и динамические – анимация, видео) и звуковая информация.

Для кодирования любых данных в компьютере используется минимальный алфавит, состоящий из нуля (0) и единицы (1), называемый двоичным кодом (или битом (от англ. bit – binary digit).

Обработкой данных в компьютере занимается специальная микросхема, называемая центральным процессором. Она устроена так, что может обрабатывать группу битов одновременно (параллельно). Как правило, эта группа включает восемь битов и называется байтом.

Байт — это единица представления информации, состоящая из 8 битов.

Чтобы кодировать текстовую информацию, каждому символу алфавита сопоставляется определенное целое число. Очевидно, чтобы различные компьютеры и пользователи понимали друг друга, необходимо стандартизировать кодировку различных символов. Стандарт должен определять таблицу, в которой записано, каким кодом должен записываться (кодироваться) каждый символ. Такая таблица называется таблицей кодов. Примером является стандарт ASCII (American Standard Code for Information Interchange — американский стандартный код для обмена информацией), введенный в 1963 г.

Организационные трудности, связанные с созданием единой системы кодирования символов на разных языках с помощью байтов (8 битов), привели к появлению универсальной системы кодирования UNICODE, в которой каждый символ кодируется 16 битами (двумя байтами).

Для кодирования графических данных также используются байты. С помощью одного байта можно закодировать 256 различных цветов. В принципе, этого достаточно для рисованных изображений типа тех, что мы видим в мультфильмах, но для качественных изображений этого явно недостаточно. Человеческий глаз может различать десятки миллионов цветовых оттенков. Поэтому если на кодирование цвета одной точки отвести не один байт, а два, т.е. не 8 битов, а 16, то можно уже закодировать 216=65536 различных цветов. Это уже лучше и похоже на то, что мы видим на фотографиях и на картинках в журналах, но все равно хуже, чем в живой природе. Если для кодирования цвета одной точки использовать три байта (24 бита), то количество возможных цветов достигнет 22416,5 миллионов. Этот режим называется полноцветным (True Color) и позволяет хранить, обрабатывать и передавать изображения, не уступающие по качеству наблюдаемым в живой природе.

Принцип декомпозиции произвольного цвета на основные составляющих состоит в том. что любой цвет можно представить в виде комбинации трех основных цветов:красного (Red, R), зеленого (Green, G) и синего (Blue, B). Если кодируется цвет точки с помощью трех байтов, то первый байт выделяется красной составляющей, второй — зеленой, а третий — синей. Чем больше значение байта цветовой составляющей, тем ярче этот цвет. Такая схема смешивания цветов называется RGB-схемой. Она обычно используется в устройствах, которые излучают свет, например, компьютерные мониторы, телевизоры.

Регулируя количество красного, зеленого и синего цвета в пикселе (пиксель – элемент изображения — единица измерения разрешения экрана, соответствующая отдельной светящейся точке, цветом и яркостью которой компьютер может управлять), можно сгенерировать большое разнообразие цветов (рис. 1.2 иллюстрирует работу RGB-схемы смешивания цветов.

Задавая любые значения (от 0 до 255) для каждого из трех байтов, с помощью которых кодируется цвет, можно закодировать любой из 16,5 миллионов цветов.

Другой схемой кодирования цветов, широко используемой в полиграфии для печатания цветных материалов, является схема, основанная на принципе декомпозиции дополнительных цветов. Дополнительным называется цвет, который дополняет основной цвет до белого. Отсюда следует, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных цветов. К дополнительным цветам относятся:

  • Голубой (Cyan, C) = БелыйКрасный = Зеленый + Синий = (0,255,255);

  • Пурпурный (Magenta, M) = БелыйЗеленый = Красный + Синий = (255,0,255);

  • Желтый (Yellow, Y) = БелыйСиний = Зеленый + Синий = (255,255,0);

  • Черный (blacK, K) = (0,0,0).

Такая схема кодирования цветов называется CMYK-схемой и для представления полноцветной графики в ней надо иметь 32 бита.

В некоторых графических редакторах используется цветовая модель HSB. Если модель RGB наиболее удобна для компьютера, модель CMYK – для типографий, то модель HSB наиболее удобна для человека. В ней используется три компонента: оттенок цвета (Hue); насыщенность цвета (Saturation); яркость цвета (Brightness).

Графические редакторы позволяют работать с цветными изображениями в разных цветовых моделях.

Существует три принципиальных и весь различающихся метода (формата) представления графических изображений:

  • растровое (bitmap – карта пикселей) – изображение разбивается на сетку (пиксели), причем световое значение (яркость, затемнение или цвет) каждого пикселя записывается индивидуально;

  • векторное – изображение описывается в виде серии линий или фигур, возможно с некоторыми закрашенными областями, заполняемыми сплошным или градиентным цветом;

  • фрактальное – изображение автоматически генерируется путем проведения математических расчетов. Создание фрактального изображения состоит не в рисовании или оформлении, а в программировании.

Растровые форматы обычно используются для представления изображений со сложными изменениями цветов, оттенков или форм, таких как фотографии, рисунки и захваченные (оцифрованные) видеокадры. Они позволяют хранить точную информацию о любом возможном изображении. Вместе с тем, растровые изображения обладают рядом недостатков:

  • большим размером файла (при высоком разрешении фотографии файл может достигать нескольких десятков мегабайт);

  • невозможностью увеличения растровых изображений для рассмотрения деталей.

В основе векторной графики лежат математические представления о свойствах геометрических фигур – линий. Объем памяти, занимаемый линией, определяется параметрами, описывающими линию. Линии имеют свойства: форма линии, ее толщина, цвет, характер линии и т.п. Замкнутые линии имею свойство заполнения.

Векторная графика позволяет устранить недостатки, присущие растровой графике: объем файлов уменьшается на несколько порядков и появляется возможность рассмотреть детали при увеличении изображения. Вместе с тем значительно усложняет процесс создания иллюстраций.

Фрактальная графика относится к классу вычисляемых (как и векторная), но при этом никакие объекты в памяти не хранятся. Все изображение строится по уравнению (системе уравнений), поэтому ничего, кроме формулы, хранить не надо. Изменив коэффициенты в уравнении, можно получить совсем иное изображение.

В кодировании звуковой информации можно выделить два основных направления:

  • метод FM (Frequency Modulation – частотная модуляция), основанный на том, что любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, которые можно закодировать целыми числами;

  • метод таблично-волнового синтеза (Wave-Table), заключающийся в том, что в памяти компьютера в заранее подготовленных таблицах хранятся образцы звуков (называемых сэмплами) для множества различных музыкальных инструментов, которые затем синтезируются.

Таким образом, идея представить любые данные в виде целых чисел и закодировать их байтами очень рациональна. Компьютеру удобно работать, когда тексты, звуки, рисунки и видеофильмы представлены в виде байтов со значениями от 0 до 255.