Опорный конспект Кодирование текстовой информации.

Для записи текстовой (знаковой) информации всегда используется какой-либо язык (естественный или формальный). Всё множество используемых в языке символов называется алфавитом. Полное число символов алфавита называют его мощностью. При записи текста в каждой очередной позиции может появиться любой из N символов алфавита, т.е. может произойти N событий. Следовательно, каждый символ алфавита содержит i бит информации, где i определяется из неравенства: 2ⁱ ≥ N. Тогда общее количество информации в тексте определяется формулой:

V = k * i , где V – количество информации в тексте; k – число знаков в тексте (включая знаки препинания и даже пробелы), i - количество бит, выделенных на кодирование одного знака.

Так как каждый бит – это 0 или 1, то любой текст может быть представлен последовательностью нулей и единиц. Именно так текстовая информация хранится в памяти компьютера. Присвоение символу алфавита конкретного двоичного кода - это вопрос соглашения, зафиксированного в кодовой таблице. В настоящее время широкое распространение получили кодовые таблицы ASCII и Unicode.

ASCII (American Standart Code for Informational Interchange - Американский стандартный код информационного обмена) используется достаточно давно. Для хранения кода одного символа выделено 8 бит, следовательно, кодовая таблица поддерживает до 2⁸ = 256 символов. Первая половина таблицы (128 символов) - управляющие символы, цифры и буквы латинского алфавита. Вторая половина отводится под символы национальных алфавитов. К сожалению, в настоящее время существует целых пять вариантов кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке неверно отображаются в другой. (Наверное, Вы встречали русскоязычные сайты, тексты которых выглядят как бессмысленный набор знаков? Приходилось менять кодировку?).

Unicode - получил распространение в последние годы. Для хранения кода одного символа выделено 16 бит, следовательно, кодовая таблица поддерживает до 2¹⁶= 65536 символов. Такого пространства достаточно, чтобы в одном стандарте объединить все "живые" официальные (государственные) письменности. Кстати, стандарт ASCII вошел в состав Unicode.

Кодирование графической информации.

Растровая графика.

Количество информации в изображении тоже можно измерить. Для этого изображение разбивают на отдельные маленькие фрагменты (пиксели), затем каждому пикселю присваивается код цвета (считаем, что весь пиксель целиком одноцветный, а изображение в целом – мозаика мелких цветных точек). Этот процесс называют пространственной дискретизацией изображения.

Качество такого изображения зависит от двух параметров. Качество выше при меньшем размере пикселя и большем количестве используемых цветов (или оттенков серого, для монохромного изображения). Полный набор цветов, которые можно использовать для создания изображения называется палитрой. Изображение, сформированное таким способом, называют растровым. Формула для определения количества информации в нём имеет вид:

V = k * i , где V – количество информации в изображении; k – количество пикселей, а i – глубина цвета (т.е. количество бит, выделенных на кодирование цвета), определяемая по формуле: 2ⁱ≥ N, где N – количество цветов в палитре. Цвет пикселя формируется как комбинация трех основных цветов ( обычно красного - Red, зеленого - Green и синего - Blue).

Выше отмечалось, что качество растровой графики зависит также от размера пикселя. Количество пикселей на экране дисплея (растр) указывают соотношением количества пикселей в строке по горизонтали к их количеству в столбце по вертикали (800*600, 1024*768 и т.д.). Максимально возможное количество пикселей на экране называют разрешающей способностью дисплея. Качество растровых изображений может быть очень высоким, но размер файла также весьма велик (изучите свойства нескольких Точечных рисунков *.BMP, созданных с помощью Paint). При уменьшении размера изображения и последующим сохранением рисунка (например, с целью экономии места на диске) качество безвозвратно ухудшается. Для уменьшения размера файлов часто используют другие форматы файлов такие как *.JPG,*.GIF и др.

Векторная графика.

Отметим также, что рассмотренный выше способ представления изображений не единственный. Можно представить изображение совокупностью простых геометрических фигур (прямых линий, окружностей, эллипсов, дуг, прямоугольников и т.д.) – графических примитивов и записать информацию о координатах и параметрах каждого их них. При этом координатная сетка должна совпадать с сеткой пикселей на экране. Такой способ представления изображений называют векторной графикой Такой способ представления изображения дает возможность получить файл малого размера. Качество изображения не изменяется с изменением размера рисунка, но даже профессиональные векторные графические редакторы не могут обеспечить качество графики, сравнимое с растровыми изображениями.

Видеоинформация.

Если рассматривать видеоинформацию как последовательность изображений, появляющихся на экране с определенной частотой (частотой кадров), то можно понять, что видео может быть закодировано подобно тому, как кодируются растровые изображения (с той разницей, что этих изображений много). Такой способ используется в формате (см. тему Файловая система) *.AVI (несжатое видео) - высокое качество и огромные размеры файлов. Существуют способы сжатия видеоинформации путем преобразования файла в другие форматы.

1 / 31 2 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.05.20152.4 Mб13opevs.pdf
#
11.05.20155.62 Mб280OPiERS_lektsii 2 сем.docx
#
11.05.2015139.78 Кб10Opisanie_LR_07_01.doc
#
11.05.2015992.77 Кб11OPIUP_1 (1).doc
#
11.05.20151.14 Mб11OPIUP_1.doc
#
14.04.201971.17 Кб10Opornyy_konspekt.doc
#
11.05.2015636.69 Кб15opr00NNA.pdf
#
11.05.20151.06 Mб6OP_LR_Beschastnaya_2005.pdf
#
11.05.201576.67 Кб5orsp_1.docx
#
03.09.201952.33 Кб4OS.docx
#
11.05.2015360.45 Кб42OSISP Part 3.DOC