- •Содержание
- •§1. Введение.
- •§2. Кодирование текстовой информации.
- •§2.1. Основное понятие – «таблица кодировки»
- •§2.2. Российская особенность
- •§2.4. Сравнение стандартов.
- •§2.5. Одно слово в разных кодировках (пример)
- •§3. Кодирование графической информации. §3.1. Компьютерная графика. Представление графической информации в эвм.
- •§3.2. Растровый подход
- •Дополнительно (школьная информация):
- •§3.3. Векторный подход
- •Дополнительно (школьная информация):
- •§3.4. Изображение и компьютерный экран
- •Дополнительно (школьная информация):
- •§3.5. Изображение и тип файла
- •§4. Кодирование звуковой и видеоинформации. §4.1. Аналоговый и дискретный способы представления изображений и звука.
- •§4.2. Двоичное кодирование звуковой информации.
- •§4.3. Двоичное кодирование видеоинформации.
- •§5. Кодирование числовой информации. §5.1. Системы счисления. Перевод из одной системы счисления в другую.
- •Непозиционная система счисления
- •Позиционная система счисления
- •Перевод из одной системы счисления в другую Правило 1.
- •Правило 2.
- •Правило 3.
- •Примеры задач на основе «перевода из одной системы счисления в другую»
- •Задачи для тренировки
- •§5.2. Системы счисления. Арифметические действия в различных системах счисления.
- •Сложение
- •Вычитание
- •Умножение
- •Деление
- •§6. Источники.
§2.4. Сравнение стандартов.
Характеристика |
Таблицы ASCII |
Расширенные таблицы ASCII |
Unicode |
Сколько всего символов может закодировать? |
128 символов |
256 символов |
65536 символов |
Сколько бит (байт) отводится для одного символа? |
1 символ = 1 байт Можно: 1 символ = 7 бит |
1 символ = 1 байт |
1 символ = 2 байта |
Какие символы содержит? |
Первые 32 кода (от 0 до 31) – управляющие символы (например, символ с кодом 13 - это символ конца абзаца), Остальные: строчные и прописные латинские буквы, цифры, знаки препинания и математических операций. |
Первая половина (от 0 до 127): Смотри «таблицы ASCII»
Вторая половина (от 128 до 255): национальные алфавиты, а также символы псевдографики, математические и некоторые другие символы. |
Первые 256 символов соответствуют стандартной кодовой таблице.
На остальных местах можно разместить все необходимые символы всех языков. |
«Знает» ли русские буквы? |
нет |
Если содержит нужный национальный алфавит, то да. |
да |
Особенности, примечание |
Стандартная часть, которая совпадает для всех кодировок. |
Альтернативная часть (вторая половина) изменяется в зависимости от страны, от настроек компьютера. |
Стандарт UNICODE 4.0 представляет собой новую систему кодирования символов, выводимых на экран монитора или на принтер, позволяющую закодировать 1 114 112 символов (в стандарте из принято называть code points). Большинство символов, используемых в основных языках мира занимают 65 536 code points, образуя Basic Multilingual Plane (BMP) (Основной Многоязычный Уровень - мой перевод). Оставшиеся (более миллиона) code points вполне достаточно для кодирования всех известных символов, включая малораспространенные языки и исторические знаки. Стандарт UNICODE поддерживается тремя формами, 32-битной (UTF-32), 16-битной (UTF-16) и 8-битной (UTF-8). Восьмибитная форма UTF-8 была разработана для удобной совместимости с ASCII-ориентироваными системами кодирования. Стандарт UNICODE совместим с Международным стандартом International Standard ISO/IEC 10646. |
§2.5. Одно слово в разных кодировках (пример)
Пример.
Задание: Представьте в форме шестнадцатеричного кода слово "ЭВМ" во всех пяти кодировках. Воспользуйтесь таблицами (CP866, Mac, ISO и так далее), а затем переведите числа из десятичной в шестнадцатеричную систему счисления.
Последовательности десятичных кодов слова "ЭВМ" в различных кодировках составляем на основе кодировочных таблиц:
КОИ8-Р: 252 247 237
CP1251: 221 194 204
CP866: 157 130 140
Mac: 157 130 140
ISO: 205 178 188
Переводим последовательности кодов из десятичной системы в шестнадцатеричную:
КОИ8-Р: FC F7 ED
CP1251: DD C2 CC
CP866: 9D 82 8C
Mac: 9D 82 8C
ISO: CD B2 BC
Обратим внимание, что десятичные коды различны!