- •Лекция 2. Понятие информации, ее свойства и виды
- •I . Понятие информации
- •Информационные процессы
- •Данные их кодирование
- •3.Кодирование текстовых данных
- •.В настоящее время осуществляется постепенный переход к универсальной системе кодирования unicode, использующей 16-разрядную систему кодирования и позволяющей
- •Основные структуры данных
- •Пример:
3.Кодирование текстовых данных
Если каждому символу алфавита сопоставить определенное целое число, то с помощью двоичного кода можно кодировать текстовую информацию. Восьми битов (Iбайта) достаточно для кодирования 256 различных символов.
Общепринятой - стандартный код информационного обмена США. В системе ASCIIзакреплены две таблицы кодирования: базовая ирасширенная. Базовая таблица определяет значения кодов от (0 до 127 и содержит коды символов английского алфавита (как строчных, так и прописных) знаков препинания, цифр,арифметических действий и некоторых вспомогательных символов.системой кодирования текстовых данных является кодировкаASCII
Вторая, расширенная часть определяет значения кодов от 128 до 255 и включает в себянациональные системы кодирования (например, для России - «это символы русского алфавита).
Отсутствие единого стандарта для расширенной части системы кодирования ASCIIпривело к множественности одновременно действующих кодировок.
Наиболее распространенными кодировками символов русского языка является Windows-1251 и КОИ -8 (код обмена информацией, восьмизначный).
Кодировка Windows-1251 используется на большинстве локальных компьютеров, работающих на платформеWindows. Кодировка КОИ-8 имеет широкое распространение в компьютерных сетях территории России и в некоторых службах российского сектора.
Интернет. В частности, в России она является стандартной в сообщениях электронной почты и телеконференций. Кроме перечисленных, в России существуют также еще три кодировки: ISO, ГОСТ и ГОС Т- альтернативная, которые на практике используются крайне редко.
.В настоящее время осуществляется постепенный переход к универсальной системе кодирования unicode, использующей 16-разрядную систему кодирования и позволяющей
.4. Кодирование графических данных
Если рассмотреть с помощью увеличительного стекла черно-белое графическое изображение, то можно увидеть, что оно состоит из мельчайших точек, образующих характерный узор, называемый растром.
Поскольку линейные координаты и яркость каждой точки можно выразить, с помощью целых чисел, то следовательно, для представления графических данных можно использовать двоичное кодирование. Общепринятым является представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета. Таким образом, для кодировання любой точки обычно достаточно трех байт (по одному для кодирования яркости и линейных координат по осям хиyсоответственно).
Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. Такую декомпозицию можно производить на основе двух методов.
Первый метод использует в качестве основных составляющих три цвета: зеленый, синий, красный.
На практике считается, что любой цвет можно получить путем механического смешения этих трех основных цветов. Такая система кодирования называется системой RGB.
Если на кодирование каждой из основных составляющих использовать по 1 байту, то на кодирование цвета одной точки надо затратить 3 байта. При этом система кодирования RGB обеспечивает однозначное определение 16,5 млн. различных цветов
Второй метод применяется в полиграфии и использует в качестве основных составляющих четыре цвета:
С - голубой.
М - пурпурный.
Y- желтый.
К - черный (обозначается буквой К. т.к. буква В уже занята синим цветом).
Для представления цветной графики в системе СМY К надо иметь по 4 байта на определение цвета каждой точки.
Оба режима кодирования RGB и СМY К называются полноцветными.