Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Навч. Посібник ЕКОНОМ. ІНФОРМАТИКА 1-2-1.doc
Скачиваний:
54
Добавлен:
25.11.2019
Размер:
33.87 Mб
Скачать

1.4. Кодування даних в інформатиці

Для автоматизації роботи з даними, що відносяться до різних типів, дуже важливо уніфікувати їхню форму представлення - для цього звичайно використовується прийом кодування, тобто подання даних одного типу через дані іншого типу. Існують різні системи кодування. Як приклади можна привести систему запису математичних виразів, телеграфну абетку, морську абетку прапорців, систему Брайля для сліпих і багато чого іншого.

Своя система існує й в обчислювальній техніці - вона називається двійковим кодуванням і заснована на представленні даних послідовністю всього двох знаків: 0 і 1. Ці знаки називаються двійковими цифрами, на англійській мові - binary digit або скорочено bit (однозначне двійкове число). Одним бітом можуть бути виражені два поняття: 0 або 1 (так чи ні, чорне або біле, істина або неправда й т.п.). Якщо кількість бітів збільшити до двох, то вже можна закодувати чотири різних поняття:

00 01 10 11

Трьома бітами можна закодувати вісім різних понять:

000 001 010 011 100 101 110 111

Збільшуючи на одиницю кількість розрядів у системі двійкового кодування, ми збільшуємо, у два рази кількість значень, яку можна виразити в даній системі, тобто загальна форма має вигляд:

,

де N - кількість незалежних закодованих понять (значень);

m - розрядність двійкового кодування, прийнята в даній системі.

1.4.1. Кодування цілих і дійсних чисел

Цілі числа кодуються двійковим кодом досить просто - досить взяти ціле число й ділити його навпіл доти, поки остання частка не буде дорівнювати одиниці. Сукупність залишків записана від кожного ділення, починаючи з останньої частки, і утворять двійковий аналог десяткового числа.

19:2 = 9 залишок від ділення 1

9:2 = 4 залишок від ділення 1

4:2 = 2 залишок від ділення 0

2:2 = 1 залишок від ділення 0

Таким чином, 1910 = 100112.

Для кодування цілих чисел від 0 до 255 досить мати 8 розрядів двійкового коду ( 1 байт). Шістнадцять біт дозволяє закодувати цілі числа від 0 до 65535, а 24 біта - уже більше 16,5 мільйонів різних значень.

Для кодування дійсних чисел використають 80-розрядне кодування, при цьому число попередньо перетвориться в нормалізовану форму:

3,1415926 = 0,31415926*10 1 (нормалізована форма)

300000 = 0,3*10 6

Перша частина числа називається мантисою, а друга - характеристикою. Більшу частину з 80 бітів відводять для зберігання мантиси (разом зі знаком) і деяка фіксована кількість розрядів відводять для зберігання характеристики (теж зі знаком).

Дробові числа кодуються двійковим кодом також досить просто - досить взяти дробову частину числа й множити її на 2. Далі ціле число залишити для запису двійкового числа а дробову частини необхідно знову множити на 2, і так доти поки ми не одержимо необхідну точність числа. Дріб у двійковій системі запишеться у вигляді цілих частин добутків, починаючи з вихідного числа:

0,312510 = 0,01012 = 0,101*10 -1.

1.4.2. Кодування текстових даних

Якщо кожному символу алфавіту зіставити певне ціле число (наприклад, порядковий номер), то за допомогою двійкового коду можна кодувати й текстову інформацію. Восьми двійкових розрядів досить для кодування 256 різних символів. Цього вистачить, щоб виразити різними комбінаціями восьми бітів всі символи англійської й російської мов, як рядкові, так і прописні, а також розділові знаки, символи основних арифметичних дій і деякі загальноприйняті спеціальні символи, наприклад символ «§».

Для кодування латинських символів, спеціальних символів, чисел, національних символів алфавіту інших мов, інститут стандартизації США (ANSI - American National Standard Institute) запровадив у дію систему кодування ASCII (American Standard Code for Information Interchange - стандартний код інформаційного обміну США).

У системі ASCII закріплені дві таблиці кодування - базова й розширена.

Базова таблиця закріплює значення кодів від 0 до 127, а розширена відноситься до символів з номерами від 128 до 255.

Перші 32 коди базової таблиці, починаючи з нульового коду, відведені виробникам апаратних засобів (виробникам комп'ютерів і друкувальних пристроїв). У цій області розміщаються так звані керуючі коди, яким не відпо­віда­ють ніякі символи мов і відповідно ці коди не виводяться на екран, ні на пристрій друку.

Коди, починаючи з 32 по 127 код, у таблиці відведені під коди латинських символів англійського алфавіту, розділові знаки, цифри, арифметичні дії й деякі допоміжні символи (таб.1.1).

Символи національних алфавітів розміщені в розширеній частині таблиці кодування, для них відводяться коди з 128 по 255 (таб.1.2).

Для вставки символу в текст треба натиснути комбінацію клавіш Alt + код на додатковій клавіатурі.