Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
290
Добавлен:
30.03.2015
Размер:
9.07 Mб
Скачать

Тема 1.3. Общие сведения о представлении данных

В предыдущем занятии было определено, что ТСИ предназначены для автоматизации процессов обработки, преобразования и хранения данных. Для выполнения этих функций ТСИ должны обладать некоторым способом представления этих данных. Представление данных заключается в их преобразовании в вид, удобный для последующей обработки либо пользователем, либо ТСИ.

Форма представления данных определяется их конечным предназначением. В зависимости от этого данные имеют внутреннее и внешнее представление. Внутреннее представление данных (для ТСИ) определяется физическими принципами, по которым происходит обмен сигналами между узлами ТСИ, принципами организации памяти, логикой работы ТСИ. Внутреннее представление данных в большинстве современных ТСИ является дискретным, т.е. цифровым, причем любые данные для обработки ТСИ представляются последовательностями двух целых чисел – единицы и нуля. Такая форма представления данных получила название двоичной.

Во внешнем представлении (для пользователя) все данные хранятся в виде файлов.

Файл – область памяти на внешнем носителе, которой присвоено имя.

Простейшими способами внешнего представления данных являются:

  • последовательность символов (текст);

  • вещественные и целые числа (числовая информация);

  • изображение (графика, фотографии, рисунки, схемы);

  • звук (речь, мелодия);

  • видео (фильм, анимация).

Все эти данные для ввода в те или иные ТСИ должны быть некоторым универсальным образом представлены в виде набора целых чисел, т.е. преобразованы в формат внутреннего представления ТСИ. Правила таких представлений разрабатываются и оформляются в виде стандартов, которые будут рассматриваться далее.

Тема 1.4. Представление текстовых и числовых данных

Правило представления символьной информации (буквы алфавита и др. символы) заключается в том, что каждому символу ставится в соответствие уникальное число, т.е. каждый символ нумеруется. Простейшим примером такого соответствия может быть, например, возрастающая нумерация символов кириллицы по порядку их следования. В этом случае букве А будет соответствовать число 1, букве Б – 2 и т.д. до 33. Поскольку, например, компьютер на самом низком уровне оперирует символами двоичной системы счисления, то необходимо выполнить дальнейшие преобразования из десятичной системы счисления в двоичную.

Наиболее распространенный стандарт кодировки символов ASCII-код ("Американский Стандартный Код для Обмена Информацией" – англ. American Standart Code for Information Interchange) был введён в США еще в 1963 г. и после модификации в 1977 г. был принят в качестве всемирного стандарта. Каждому символу поставлено в соответствие двоичное число от 0 до 255 (8-битовый двоичный код), например: A – 01000001, B – 01000010, C – 01000011, D – 01000100 и т.д. Символы от 0 до 127 – латинские буквы, цифры и знаки препинания составляют постоянную (базовую) часть таблицы. Расширенная таблица с 128 по 255 символ отводится под национальный стандарт.

Остальные символы используются для представления национальных алфавитов. Конкретный состав этих символов определяется кодовой страницей. В русской версии ОС Windows используется кодовая страница 866.

Таким образом, каждый введенный в компьютер с клавиатуры или другим образом символ запоминается и хранится на носителе в виде набора из восьми нулей и единиц. Текстовый файл в этом случае представляет собой последовательность байт данных, за каждым из которых стоит символ текста. При выводе текста на экран или на принтер соответствующие программно-аппаратные средства вывода выполняют обратную перекодировку из цифровой формы в символьную по тем же правилам.

В настоящее время идет внедрение нового стандарта – Unicode. Этот стандарт определяет кодировку каждого символа не одним байтом, а двумя. Соответственно, число одновременно кодируемых символов возрастает с 256 до 65536. Данный стандарт позволяет закодировать одновременно все известные символы, в том числе японские и китайские иероглифы.

Важным понятием при представлении числовых данных является понятие системы счисления.

Система счисления – это способ наименования и представления чисел с помощью символов, имеющих определенные количественные значения. В зависимости от способа представления чисел системы счисления делятся на позиционные и непозиционные.

В позиционных системах количественное значение каждой цифры зависит от места (позиции) в числе. В непозиционных системах цифры не меняют своего количественного значения при изменении их расположения в числе. Примером позиционной системы является арабская десятичная система (0-9). Римская система, в которой для каждого числа используется специфическое сочетание символов (XXV = 25, CХ = 110 и т. д.), является примером непозиционной системы счисления.

Алфавитом системы счисления называется набор элементарных символов, из комбинации которых образуются любые численные значения. Количество таких символов и определяет название системы счисления: двоичная – два (0 и 1); восьмеричная – восемь (0, 1, 2, 3, 4, 5, 6, 7, 8); десятичная – десять (0-9); шестнадцатеричная – шестнадцать (0-9, A, B, C, D, E, F).

Общее правило перевода чисел из одной системы счисления в другую формулируется так: перевод числа Х из системы счисления с основанием P в систему счисления с основанием К выполняется путем нахождения остатков от деления числа Х на основание К, при этом процесс продолжается до тех пор, пока частное от деления не будет меньше основания К. Все вычисления выполняются в системе счисления с основанием Р. Например, для перевода числа 10 из десятичной системы счисления в двоичную необходимо найти остатки от деления числа 10 на 2. Аналогично выполняются преобразования в восьмеричную и шестнадцатеричную системы счисления.

Для обратного перевода числа из любой системы счисления в десятичную удобнее использовать другое правило, которое в общем виде формулируется так: перевод числа Х из системы счисления основанием К в систему счисления с основанием Р осуществляется путем представления числа Х по степеням основания К. Все вычисления выполняются в системе счисления с основанием Р, т. е. основание К и цифры исходного числа должны также быть выражены в системе счисления с основанием Р. Например, перевод двоичного числа 1010 в десятичную систему счисления выполняется представлением числа 10102 по степеням с основанием 2, начиная с нулевой степени при младшем (самом правом) разряде двоичного слова.

Соседние файлы в папке Для Скрипко