- •Практическая работа на тему «Кодирование символьной информации» Типы задач
- •Объем памяти, занимаемый текстом
- •Задания для самостоятельного выполнения
- •Задания для самостоятельного выполнения
- •Кодирование (декодирование) текстовой информации
- •Использование кодировочных таблиц
- •Без использования кодировочных таблиц
- •Задания для самостоятельного выполнения
- •Внутреннее представление текста в компьютере
- •Литература:
Задания для самостоятельного выполнения
1. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт?
2. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.
Кодирование (декодирование) текстовой информации
В задачах такого типа используются понятия:
Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.
Код (от французского слова code – кодекс, свод законов) – правило, по которому выполняется кодирование.
Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.
Примеры кодовых таблиц
КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьмибитное кодирование)
#154 неразрывный пробел
Рис.1 Кодировка КОИ8-Р
ASCII – American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127-стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).
#32 - пробел.
Рис. 2 Международная кодировка ASCII
Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
СР1251 – наиболее распространенной в настоящее время является кодировка Microsoft Windows ("CP" означает "Code Page", "кодовая страница").
1) #160 неразрывный пробел,
2) #173 мягкий перенос.
Рис. 3 Кодировка CP1251
СР866 - кодировка под MS DOS
#255 неразрывный пробел.
Рис. 4 Кодировка СР866
Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS.
#202 неразрывный пробел.
Рис. 5 Кодировка Mac
ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.
1) Коды 128-159 не используются;
2) #160 неразрывный пробел,
3) #173 мягкий перенос.
Рис. 6 Кодировка ISO 8859-5
Уровень сложности 1
Использование кодировочных таблиц
1. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках.
Решение
Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц
Кодовая таблица |
Коды |
Слово |
СР1251 |
228 232 241 234 |
диск |
КОI8-Р |
228 232 241 234 |
ДХЯЙ |
СР866 |
228 232 241 234 |
фшёъ |
Мас |
228 232 241 234 |
диск |
ISO |
228 232 241 234 |
фшёъ |
2. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:
а) 01010101 01110000 0100000 00100110 00100000 01000100 1101111 01110111 01101110;
б) 01001001 01000010 01001101;
в) 01000101 01101110 01110100 01100101 01110010
Решение:
1. Переведите коды из двоичной системы счисления в десятичную. а) 01010101 01110000 00100000 00100110 00100000 01000100 1101111 01110111 01101110 → 85 112 32 38 32 68 111 119 110
б) 01001001 01000010 01001101 → 73 66 77
в) 01000101 01101110 01110100 01100101 01110010 → 69 110 116 101 114
2. Запустите текстовый редактор
3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква. а) 85 112 32 26 32 68 111 119 110 → Up & Down;
б) 73 66 77 → IBM;
в) 69 110 116 101 114 → Enter
Ответ: Up & Down; IBM; Enter
3. Декодируйте следующие тексты, заданные десятичным кодом: а) 087 111 114 100; б) 068 079 083; в) 080 097 105 110 116 098 114 117 115 104.
Решение:
Запустите текстовый редактор. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) 087 111 114 100 → Word;
б) 068 079 083 → DOS;
в) 080 097 105 110 116 098 114 117 115 104 → Paintbrush.
Ответ: Word; DOS; Paintbrush.
Уровень сложности 2