Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1(Введение)лек.doc
Скачиваний:
16
Добавлен:
05.12.2018
Размер:
470.02 Кб
Скачать

1.4. Кодировка символов, графики, звука

Для обработки текстовой информации каждому символу ставит­ся в со­ответствие определенное число. Соответствие между набором символов и числами называется кодировкой символов. При вводе в компьютер информа­ция кодируется, а при выводе декодируется. Существует много различных кодировок. В большинстве из них сим­волы кодируются восьмибитовыми (однобайтными) числа­ми. В одном байте можно записать 256 различных це­лых чисел. Это­го достаточно для ко­дирования всех букв русского и латин­ского ал­фавитов, арабских цифр, зна­ков препинания и некоторых других не­обходимых символов. Для наглядности кодируемые символы располагаются в табли­це. Таб­лица разбита на 16 строк и 16 столбцов. Каждая строка и каж­дый столбец имеют четырехразрядные двоичные номера от 0000 до 1111 (или шестнадца­теричные от 0 до F). Код символа составляется из номеров столбца и строки, на пересечении которых он находится. Этим двоичным числам соот­ветст­вуют десятичные числа от 0 до 255.

Первона­чально разные произ­водители средств вычислительной техники создавали для одного и того же алфавита символов свои кодовые таблицы. Это приводило к тому, что символы, набранные с помощью одной таблицы кодов, отображались неверно при использовании другой таблицы. Для ре­ше­ния проблемы многообразия кодовых таблиц в 1981 г. Институт стандарти­зации США принял стандарт кодовой таблицы, получив­шей название ASCII (American Standard Code of Information Interchange - американский стан­дартный код информационного об­мена). Эту таблицу использовали про­граммные продукты, работаю­щие под управлением операционной системы MS-DOS, разработан­ной компанией Microsoft по заказу крупной фирмы - производителя персональных компьютеров IBM (International Business Ma­chine). Широкое распространение персональных компьютеров фирмы IBM привело к тому, что стандарт ASCII приобрел статус международ­ного.

В таблице ASCII содержится 256 символов и их кодов. Таблица состоит из двух частей: основной и расширенной. Основная часть (символы с кодами от 0 до 127 включительно) является базовой, она в соответствии с принятым стандартом не может быть изменена. В нее вошли: управляющие символы (им соответствуют коды с 1 по 31), арабские цифры, буквы латинского ал­фавита, знаки препинания, специальные символы.

Расширенная часть (символы с кодами от 128 до 255) отдана нацио­нальным алфавитам, символам псевдографики и некоторым специальным символам. В соответствии с утвержденными стандартами эта часть таблицы изменяется в зависимости от национального алфавита той страны, где она используется, и способа кодирования. Именно поэтому, при наименовании программ, документов и других объектов желательно использовать латин­ские буквы, содержащиеся в основной, неизменяемой части таблицы, так как русскоязычные имена при несоответствии таблиц кодирования будут не­верно отображаться.

Ниже приведен фрагмент этой таб­лицы. Сим­волам кириллицы здесь со­ответствуют десятичные коды от 128 до 175 и от 224 до 239.

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

0

0

@

P

p

А

Р

а

р

1

!

1

A

Q

a

q

Б

С

б

с

2

«

2

B

R

b

r

В

Е

в

т

3

#

3

C

S

c

s

Г

У

г

у

4

$

4

D

T

d

t

Д

Ф

д

ф

5

%

5

E

U

e

u

Е

Х

е

х

6

&

6

F

V

f

v

Ж

Ц

ж

ц

7

7

G

W

g

w

З

Ч

з

ч

8

(

8

H

X

h

x

И

Ш

и

ш

9

)

9

I

Y

i

y

Й

Щ

й

щ

A

*

:

J

Z

j

z

К

Ъ

к

ъ

B

+

;

K

[

k

{

Л

Ы

л

ы

C

,

<

L

\

l

|

М

Ь

м

ь

D

-

=

M

]

m

}

Н

Э

н

э

E

.

>

N

^

n

~

О

Ю

о

ю

F

/

?

O

_

o

П

Я

п

я

С появлением графической среды Windows кодировки ASCII морально устарели, в частности, ненужными стали псевдографические символы. Фир­мой Microsoft была разработана новая кодовая таблица ANSI. Для представ­ления кириллицы в Windows на основе кодировки ANSI построена кодовая страница СР12565. Символам кириллицы здесь соответствуют шестнадцате­ричные коды от С0 до FF, или в десятичной системе счисления от 192 до 255. В настоящее время все большее распространение приобретает двух­байтная кодировка Unicode. Поскольку в 16 двоичных разрядах (2 бай­тах) можно за­писать 65 536 различных целых чисел, эта таблица кодов включает в себя все существующие алфавиты мира, а также множество математических, химиче­ских, музыкальных и декоративных символов. Кодировка Unicode использу­ется в программах MS Office.

Кодирование графики. Прежде всего отметим, что есть два основных способа представления изображении. Первый - графические объекты созда­ются как совокупности линий, векторов, точек - называется векторной гра­фикой. Второй - графические объекты формируются в виде множества точек (пикселей) разных цветов и разных яркостей, распределенных по строкам и столбцам, - называется растровой графикой,

Графическое изображение, напе­чатанное в га­зете или книге, состоит из мельчайших точек, образующих ха­рактерный узор, на­зывае­мый растром. По­скольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с по­мо­щью целых чисел, то можно ска­зать, что растровое кодирование позво­ляет использовать дво­ичный код для пред­став­ления графических данных. Обще­приня­тым на сегодняшний день считается представление черно-белых иллю­страций в виде комбинации точек с 256 града­циями серого цвета (для коди­рования яркости любой точки обычно достаточно вось­миразрядного двоич­ного числа).

Для кодирования цветных графических изображе­ний приме­няется прин­цип де­композиции произвольного цвета на основные состав­ляющие. В каче­стве таких со­ставляющих используют три основных цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). На практике считается (хотя тео­рети­чески это не со­всем так), что любой цвет, видимый человеческим гла­зом, мож­но по­лучить путем механиче­ского смешения этих трех основных цветов. Такая система кодирования называется системой RGB (по первым бу­квам на­званий основных цве­тов). Если для кодирова­ния яркости каждой из основных составляющих использо­вать по 256 значений (во­семь двоичных разрядов), как это принято для полутоновых черно-белых изображе­ний, то на кодирова­ние цвета одной точки надо затратить 24 разряда. При этом сис­тема кодиро­вания обеспечивает одно­значное определение 16,5 миллионов различ­ных цветов, что на самом деле близко к чувст­вительности челове­ческого глаза. Ре­жим представления цветной графики с исполь­зованием 24 дво­ич­ных раз­рядов назы­вается полноцветным (True Color).

Кодирование звука. Для записи звуков с помо­щью двоичных ко­дов ис­пользуется таблич­но-волновой метод (Wave-Table). Суть его сводится к тому, что создаются специальные таблицы, в которых хра­нятся образцы звуков для мно­жества различных музыкальных инструментов. В технике такие об­разцы называют сэмп­лами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интен­сивность звука, динамику его изме­нения, неко­торые па­раметры среды, в ко­торой происходит зву­чание и др. Поскольку в каче­стве об­разцов ис­пользу­ются «ре­аль­ные» звуки, то ка­чество звука, полученного в ре­зультате синтеза, получается очень высоким и приближается к качеству звучания ре­альных му­зы­кальных инст­рументов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]