- •Понятие информатики и информации
- •Понятие информатики и информационной технологии
- •1.2. Структура современной информатики
- •1.3 История развития информатики
- •1.4 Сигналы и данные
- •1.5 Данные и методы
- •1.6 Свойства информации
- •1.7 Информационные процессы
- •1.8 Основные типы и структуры данных
- •1.8.1 Основные типы данных
- •1.8.2 Структуры данных
- •1.8.3 Обобщенные структуры или модели данных
- •Представление информации в компьютерах
- •2.1. Двоичное кодирование
- •2.2. Системы счисления, используемые в компьютерах
- •2.3. Кодирование числовой информации. Форматы представления чисел.
- •2.4. Кодирование текстовой информации
- •2.5. Кодирование графической информации
- •2.6. Кодирование звуковой информации
- •Развитие вычислительных систем и техники
- •4 Функциональная и структурная организация компьютера
- •4.1 Архитектура и логическая структура пк
- •4.2 Понятие и принцип работы вычислительной системы
- •4.3 Структура персонального компьютера
- •4.4 Аппаратные средства реализации информационных процессов
- •4.5 Программные средства реализации информационных процессов
- •5 Понятие о телекоммуникационных технологиях (информационно-вычислительные сети)
- •6 Организация хранения данных
- •Файловая структура хранения данных
- •Текстовые форматы:
- •Графические форматы:
- •Видео форматы:
- •Аудио форматы:
- •Мультимедиа форматы:
- •Модели данных
- •Иерархическая структура данных
- •6.2.2 Сетевая модель данных
- •6.2.3 Реляционная модель данных
- •6.2.4 Объектно-ориентированная модель данных
- •7 Информационный процесс в автоматизированных системах
- •7.1 Информационные системы
- •7.2 Жизненный цикл по
- •7.3 Модели жц по
- •Информационные технологии
- •8.1 Технология разработки аис
- •8.2 Методология rad
- •8.3 Принципы системного подхода к созданию аис
- •8.4 Стадии и этапы создания аис
- •9 Методологии разработки информационных моделей предметной области
- •9.1 Информационная модель предметной области
- •9.2 Информационная модель интерфейса аис
- •9.3 Информационная модель данных
- •Типы связей.
- •Основы защиты информации. Методы защиты информации
- •10.1 Классификация угроз безопасности
- •10.2 Методы и средства защиты информации
- •10.3 Вредоносные программы и средства защиты
- •Библиографический список
2.3. Кодирование числовой информации. Форматы представления чисел.
Числовая информация может быть представлена целыми или вещественными числами.
Целые числа хранятся и обрабатываются в формате вещественных чисел с фиксированной запятой. Это означает, что каждому разряду ячейки памяти соответствует всегда один и тот же разряд числа, а запятая находится справа от младшего разряда (т. е. вне разрядной сетки).
Для кодирования целых чисел (обычной точности) со знаком отводится 2 байта (16 битов). Один разряд (1 бит) отводится под знак числа (1 для положительных и 0 для отрицательных чисел). Остальные 15 битов – под цифры двоичного представления числа.
Вещественные числа хранятся и обрабатываются в формате вещественных чисел с плавающей запятой. Это означает, что положение запятой в записи числа может меняться. Этот формат основан на экспоненциальной форме записи, в которой любое число может быть представлено в двоичной системе счисления:
А2 = m2 . 2n,
где m2 – мантисса числа, n – порядок числа.
Например,
Для хранения вещественных чисел (обычной точности) отводится 4 байта (32 бита). При этом первый бит отводится под знак числа, следующие 23 бита – под цифры мантиссы, оставшиеся 8 битов – под порядок числа.
2.4. Кодирование текстовой информации
Традиционно для кодирования одного символа текстовой информации используется 1 байт (8 битов). Этого количества информации достаточно для кодировки 256 символов (28 = 256).
Каждому символу присваивается уникальный двоичный код от 00000000 (010) до 11111111 (25510) – это операция кодирования. Процесс вывода символа на экран или на печатающее устройство заключается в обратном преобразовании – декодировании.
Соответствие символов и кодов зафиксировано специальными кодовыми таблицами.
Первая часть всех кодовых таблиц (коды от 0 до 127) – постоянна и предназначена для кодировки заглавных и строчных латинских букв, цифр, знаков арифметических операций, знаков препинания и некоторых специальных символов.
В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Операционная система |
Кодировки кириллицы |
Размер кода обмена информацией |
ОС ЕС ЭВМ, ОС UNIX |
КОИ8 |
8 битный код |
MS DOS |
CP866 |
|
ОС Microsoft Windows |
CP1251 |
|
ОС Macintosh (Apple) |
Macintosh (Mac) |
|
Международный стандарт |
Unicode UTF-8 и UTF-16 |
8 и 16 битный код |
Международный стандарт ISO (для русского языка) |
ISO 8859-5 |
|
Международный стандарт |
ASCII |
|
Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений, а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки.
В настоящее время существуют 6 различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh, Unicode и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251 ("CP" означает "Code Page", "кодовая страница").
От начала 90-ых годов, времени господства операционной системы MS DOS, остается кодировка CP866.
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
Чаще всего используют кодировки Unicode UTF-8 и UTF-16:
Кодировка |
Описание |
UTF-8 |
Символы в UTF-8 могут быть длиной от 1 до 4 байт. С помощью этой кодировки можно отобразить любой символ. UTF-8 обратно совместим со стандартом ASCII. UTF-8— рекомендованная кодировка для электронной почты и веб-страниц. |
UTF-16 |
16-битный формат преобразования Unicode позволяет кодировать любые символы переменной длины. Эта кодировка используется в основных операционных системах и средах разработки, таких как Microsoft Windows 2000/XP/2003/Vista/CE, Java и .NET. |
Первые 256 символов кодировок Unicode соответствуют 256 символам ISO-8859-1.
Пример 1. Последовательности десятичных кодов слова «ЭВМ» в различных кодировках на основе кодировочных таблиц:
КОИ8-Р |
252 247 237 |
CP1251 |
221 194 204 |
CP866 |
157 130 140 |
Mac |
157 130 140 |
ISO |
205 178 188 |
Кодировка русских букв КОИ8-Р |
Кодировка русских букв CP1251 |
|
||
|
|
|
||
Кодировка русских букв CP866 |
Кодировка русских букв MAC |
|
||
|
|
|
||
Кодировка русских букв ISO 8859-5 |
Международная кодировка ASCII |
|||
|
|
Пример 2. Коды символов можно найти и с помощью MS Word. (Вставка - Символ...). Найти несколько числовых кодов и сравнить их значение со значением в таблице кодов CP1251.
Пример 3. Открыть Блокнот и таблицы кодов CP866 и CP1251. Любое короткое слово набирается в Блокноте с помощью кодов CP866 и CP1251 при нажатой клавише Alt в одной, затем в другой кодировке (в кодировке CP866 набирается код, в кодировке CP1251 набирается перед кодом ноль, например, код "Ж" - 198. При нажатой клавише Alt набираем 0198). Буквы всегда можно ввести и без кодов, но если в текстовом редакторе типа Блокнот нужно получить таблицу, то без кодов не обойтись. Элементы таблицы имеются в кодовой таблице CP866. Пример. Необходимо выбрать шрифт. Он указан ниже таблицы.
Русский текст, созданный в одной кодировке, может неправильно отображаться в другой. Для корректного отображения текстовой информации некоторые текстовые процессоры (например, MS Word) осуществляют конвертацию символов из одной кодировки в другую.