Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kodirovanie informacii.doc
Скачиваний:
19
Добавлен:
21.04.2019
Размер:
788.99 Кб
Скачать

§2.4. Сравнение стандартов.

Характеристика

Таблицы ASCII

Расширенные таблицы ASCII

Unicode

Сколько всего символов может закодировать?

128 символов

256 символов

65536 символов

Сколько бит (байт) отводится для одного символа?

1 символ = 1 байт

Можно: 1 символ = 7 бит

1 символ = 1 байт

1 символ = 2 байта

Какие символы содержит?

Первые 32 кода (от 0 до 31) – управляющие символы (например, символ с кодом 13 - это символ конца абзаца),

Остальные: строчные и прописные латинские буквы, цифры, знаки препинания и математических операций.

Первая половина (от 0 до 127):

Смотри «таблицы ASCII»

Вторая половина (от 128 до 255): национальные алфавиты, а также символы псевдографики, математические и некоторые другие символы.

Первые 256 символов соответствуют стандартной кодовой таблице.

На остальных местах можно разместить все необходимые символы всех языков.

«Знает» ли русские буквы?

нет

Если содержит нужный национальный алфавит, то да.

да

Особенности, примечание

Стандартная часть, которая совпадает для всех кодировок.

Альтернативная часть (вторая половина) изменяется в зависимости от страны, от настроек компьютера.

Стандарт UNICODE 4.0 представляет собой новую систему кодирования символов, выводимых на экран монитора или на принтер, позволяющую закодировать 1 114 112 символов (в стандарте из принято называть code points). Большинство символов, используемых в основных языках мира занимают 65 536 code points, образуя Basic Multilingual Plane (BMP) (Основной Многоязычный Уровень - мой перевод). Оставшиеся (более миллиона) code points вполне достаточно для кодирования всех известных символов, включая малораспространенные языки и исторические знаки. Стандарт UNICODE поддерживается тремя формами, 32-битной (UTF-32), 16-битной (UTF-16) и 8-битной (UTF-8). Восьмибитная форма UTF-8 была разработана для удобной совместимости с ASCII-ориентироваными системами кодирования. Стандарт UNICODE совместим с Международным стандартом International Standard ISO/IEC 10646.

§2.5. Одно слово в разных кодировках (пример)

Пример.

Задание: Представьте в форме шестнадцатеричного кода слово "ЭВМ" во всех пяти кодировках. Воспользуйтесь таблицами (CP866, Mac, ISO и так далее), а затем переведите числа из десятичной в шестнадцатеричную систему счисления.

Последовательности десятичных кодов слова "ЭВМ" в различных кодировках составляем на основе кодировочных таблиц:

КОИ8-Р: 252 247 237

CP1251: 221 194 204

CP866: 157 130 140

Mac: 157 130 140

ISO: 205 178 188

Переводим последовательности кодов из десятичной системы в шестнадцатеричную:

КОИ8-Р: FC F7 ED

CP1251: DD C2 CC

CP866: 9D 82 8C

Mac: 9D 82 8C

ISO: CD B2 BC

Обратим внимание, что десятичные коды различны!

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]