Пятибратов стр 45
Обработка и преобразование знаков в ЭВМ
Способы представления информации в ЭВМ, ее кодирование и преобразование имеют очень большое значение в информационных системах.
Они сильно зависят от стандартов, используемых в отдельных странах и фирмах,
от типа приобретенного и действующего оборудования и других условий.
С появлением вычислительных сетей, в которых информация циркулирует между странами и континентами, претерпевая многократные перекодировки,
возникла проблема адекватного ее воспроизведения.
Существует множество стандартов (и они продолжают множиться), используемых в сетях связи и представлении данных в ПК
(МТК-5, КОИ-7, ДКОИ-8, EBDIC, кодировки DOS, 866, Windows-1251,
Западно-европейская и др.).
Рассмотрим особенности такого кодирования.
Для кодирования символьной и текстовой информации последовательно используется несколько систем кодировок.
При вводе, информации с клавиатуры нажатие определенной клавиши вырабатывает так называемый scan-код, представляющий собой двоичное число, равное порядковому номеру клавиши.
Номер нажатой клавиши никак не связан с формой символа, нанесенного на клавише.
Опознание символа и присвоение ему внутреннего кода ЭВМ
производится специальной программой по специальным таблицам:
ДКОИ, КОИ-7, ASCII (Американский стандартный код передачи информации).
Партыка стр 42
В таблице приводится перечень наиболее известных кодов, некоторые из них использовались первоначально для связи, кодирования данных, а затем для представления информации в ЭВМ:
Код Бодо —
5-разрядный код,
бывший в прошлом европейским стандартом для телеграфной связи
М-2 (российское обозначение) или IA-2 (международное обозначение) — телеграфный код, предложенный Международным Комитетом по телефонии и телеграфии (МКК.ТТ) и заменивший код Бодо;
ASCII (American Standard Code for Information Interchange) —стандартный 7-битовый код
для передачи данных, поддерживает 128 символов,
включающих заглавные и строчные символы латиницы, цифры,
специальные значки и управляющие символы.
Этот код, к которому были добавлены некоторые национальные символы (10 бинарных комбинаций), был принят
Международной организацией по стандартизации (ISO) как стандарт ISO-7;
EBCDIC (Expanded Binary Coded Decimal Interchange Code)
—8-разрядный код, предложенный фирмой IBM для машин серий IBM/360-375
(внутреннее представление данных в памяти), а. затем распространившийся и на системы других производителей;
Asc1i-8 — 8-разрядный код,
принятый для внутреннего и внешнего представления данных в вычислительных системах
Включает стандартную часть (128 символов) и национальную(128 символов).
Соответственно в зависимости от национальной части, кодовые таблицы различаются
Помимо цифр, на мониторы ЭВМ необходимо выводить еще и множество символов.
Ясно, что для вывода каждого символа необходим некий машинный код,
однозначно соответствующий этому символу, или некое правило, по которому можно организовать корректный вывод каждого символа на дисплей.
Разумеется, разрабатывать такую систему ввода-вывода следует оптимальным образом с точки зрения потребления ресурсов компьютера.
Особенно важно в этом случае помнить о том, что производительность компьютеров в отдаленные времена зарождения вычислительной техники была ничтожной, с современных позиций,
а системные программисты и разработчики аппаратной части боролись за каждый бит, адрес, инструкцию, регистр, освобождая оперативную память и адресное пространство компьютерных "малышей".
Давайте подсчитаем, сколько необходимо символов для вывода информации на дисплей.
Исторически сложилось так, что первые разработчики компьютеров были носителями английского языка.
Что им было необходимо обеспечить для вывода на монитор?
Во-первых, 26 букв английского алфавита (строчных),
во-вторых, 26 прописных, 9 знаков препинания (. , : ! " ; ? ( ) ), пробел, 10 цифр, 5 знаков арифметических действий (+,-,*, /, ^) и
специальные символы (№ % _ # $, и так далее ^, &, >, <, |, \).
Получается чуть больше сотни символов.
Такой сравнительно небольшой базовый набор символов можно закодировать при помощи таблиц соответствия этого набора машинным кодам (фактически, двоичным числам).
Можно вполне ограничиться набором двоичных чисел от 0 до 27 (всего 128 позиций),
что и было сделано.
Таблица соответствия получила название ASCII (American Standard Code for Information Interchange). В рамках таблицы ASCII создание многоязычных документов являлось очень проблематичной, а в большинстве случаев и совершенно невыполнимой задачей.
Рассмотрим структуру таблицы ASCII.
Для удобства символы в ней пронумерованы в шестнадцатеричной системе счисления от 0 - 7F. Первые знакоместа в таблице занимают непечатаемые символы (0 до 7F),
затем следуют печатаемые символы (20 - 7F).
file:///C:\Готово\для тема 1.4\coding simbols.htm
Число |
Команда |
Значение |
0 |
NUL |
NULL |
1 |
SOH |
Start of Heading |
2 |
STX |
Start of Text |
3 |
ETX |
End of TeXt |
4 |
EOT |
End Of Transmission |
5 |
ENQ |
ENQurity |
6 |
ACK |
ACKnolidgement |
7 |
BEL |
BELl |
8 |
BS |
Back Space |
9 |
HT |
Horizontal Tab |
A |
LF |
Line Feed |
B |
VT |
Vertical Tab |
C |
FF |
From Feed |
D |
CR |
Carriage Return |
E |
SO |
Shift Out |
F |
Si |
Shift In |
10 |
DLE |
Data Link Escape |
11 |
DC1 |
Device Control 1 |
12 |
DC2 |
Device Control 2 |
13 |
DC3 |
Device Control 3 |
14 |
DC4 |
Device Control 4 |
15 |
NAK |
Negative ACKnolidgement |
16 |
SYN |
SYNcronous idle |
17 |
ETB |
End of Transmission Block |
18 |
CAN |
CANcel |
19 |
EM |
End of Medium |
1A |
SUB |
SUBstitude |
1B |
ESC |
ESCape |
1C |
FS |
File Separator |
1D |
GS |
Groupe Separator |
1E |
RS |
Record Separator |
1F |
DC1 |
Unit Separator |