Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зачёт по инфе.doc
Скачиваний:
4
Добавлен:
23.12.2018
Размер:
321.54 Кб
Скачать
  1. Представление текстовой информации в памяти эвм. Какие стандартные коды для обмена информацией вы знаете? Что такое универсальная система кодирования?

Для представления текстовых символов в ЭВМ также используется двоичное кодирование. Главное, чтобы при этом соблюдалась взаимная однозначность: каждому символу свой собственный двоичный код.Чтобы создавать текстовую информацию с использованием латинских букв, достаточно 128 символов. Для кодирования 128 символов необходимо 7 двоичных разрядов (27 = 128), тогда каждому символу будет однозначно соответствовать свой двоичный код. Но есть еще буквы национальных алфавитов и псевдографические символы (для построения таблиц). Поэтому для двоичного кодирования текстовых символов добавим еще один разряд. Таким образом, каждый текстовый символ (из 128 + нац.алфавит и псевдографические символы) кодируется 8-ми битовым двоичным числом. С помощью 8-ми битовых двоичных чисел можно закодировать 28 = 256 символов. Институт стандартизации США ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange – стандартный код для информационного обмена США). В системе ASCII закреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255. Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств(компьютеров, печатающих устройств). Это так называемые управляющие коды, которым не соответствуют никакие символы языков. Ими можно управлять выводом данных. С 32 по 127 размещены коды символов латинского алфавита, знаков препинания, цифр, арифметических действий и специальных символов.

Отечественной версией кода ASCII является код КОИ – 7 (код обмена информацией, семизначный). Однако поддержка производителей оборудования и программ вывела код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось «отступить» во вторую, расширенную часть системы кодирования (коды 128  255). Отсутствие единого стандарта в этой области (128  255) привело к множественности одновременно действующих кодировок. Только в России можно указать три действующих стандарта, кодировки: Windows – 1251 (кодировка введена фирмой Microsoft для символов русского языка); КОИ -8 (код обмена информацией, восьмизначный); ISO (International Standard Organization – международный институт стандартизации) – международный стандарт, в котором предусмотрена кодировка символов русского алфавита.

В связи с изобилием систем кодирования возникает задача перекодировки символов. Это неудобно. Как быть? Надо увеличить число разрядов для кодирования символов, например, в два раза. Это позволит увеличить число кодируемых символов до 216 = 65536 – этого вполне достаточно для размещения в одной таблице символов большинства языков планеты. Такая система, основанная на 16-ти разрядном кодировании, получила название универсальной – UNICODE. Но в системе UNICODE все текстовые документы автоматически становятся вдвое длиннее. Однако, начиная с 90-х, вычислительные средства располагают достаточными ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования UNICODE.