Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика-Методичка(Лабы).doc
Скачиваний:
8
Добавлен:
02.09.2019
Размер:
522.75 Кб
Скачать

3.1.3 Кодирование информации в эвм

Компьютеры могут обрабатывать информацию, представленную только в числовой форме. При вводе информации в память компьютера каждый символ-буква русского или латинского алфавита, цифра, знак пунктуации или знак действия – кодируется определенной последовательностью двоичных цифр. Это происходит в соответствии с таблицами кодирования. Существует несколько разных таблиц кодирования.

Для персональных компьютеров, совместимых с ЭВМ IBM PC и работающих под управлением операционной системы MS DOS, применяется русифицированная альтернативная таблица кодирования ASCII, а для среды Windows – русифицированная таблица ANSI.

Каждая таблица включает 16 строк и 16 столбцов с шестнадцатеричными номерами от 0 до F (двоичные от 0000 до 1111). Таблицы позволяют закодировать до 256 (16  16) символов. Код символа составляется из номера строки, к которому приписывается номер столбца, на пересечении которых записан символ. Например, латинская буква L имеет код 4C или 01001100, а русская буква Л – код 8B или 10001011, то есть каждый символ, вводимый в компьютер и хранящийся в памяти, представляется байтом (слогом).

Каждая таблица разделена на две части по 128 символов. Первая часть (основная) с номерами строк от 0 до 7 включает символы латинского алфавита, десятичных цифр, знаков пунктуации, арифметических действий и др., имеющихся на клавиатуре с латинским шрифтом. Эта часть в основном одинакова для разных таблиц кодирования. Вторая часть представляет собой таблицу расширения (дополнения) с номерами строк от 8 до F и предназначена главным образом для кодирования национальных алфавитов. Эти части имеют различия. Так, во второй части таблицы ASCII символы русского алфавита располагают в строках с номерами 8, 9, A, E, а в таблице ANSI – в строках от C до F. Русская буква A в этой таблице имеет другой код – CB или 11001011. поэтому в среде Windows имеются средства перекодировки текстов, закодированных в ASCII, в систему ANSI.

Десятичные цифры в этих таблицах кодирования находятся в третьей строке, при этом значение каждой цифры соответствует номеру столбца. Например, число A10 = 173 при вводе в ЭВМ будет закодировано тремя байтами

0011 0001 0011 0111 0011 0011.

Для хранения в памяти и выполнения действий этот код сначала «упаковывается» – отбрасываются первые тетрады из каждого байт и образуется число в двоично-десятичной форме – A2–10 = 0001 0111 0011, которое далее по формуле Горнера (5) преобразуется в двоичный код A2 = 10101101.

Замечание. Существуют и другие таблицы кодирования с более широкими информационными возможностями, например, использующими двухбайтовую кодировку на 65536 символов.

3.1.4 Формы и форматы представления числовых данных в эвм

Каждый разряд двоичного числа (бит) представляется в ЭВМ физическим элементом, обладающим двумя устойчивыми состояниями, одному из которых приписывается значение 0, а другому 1. Совокупность определенного количества этих элементов служит для представления многоразрядных двоичных чисел и составляет разрядную сетку или формат представления числовых данных.

В ЭВМ, как и в математике, используются как «естественная», так и «нормальная» формы записи чисел.

Каждая из форм имеет разные форматы для каждого типа ЭВМ, составленные из целого количества «байт». Длину формата данных измеряют в машинных словах или в количестве двоичных разрядов (бит). Например, в ЭВМ ЕС используются такие форматы:

полуслово – 2 байта (16 бит),

слово – 4 байта (32 бита),

двойное слово – 8 байт (64 бита).

В ПЭВМ:

слово – 2 байта (4 байта),

двойное слово – 4 байта (8 байт).