Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Курс лекций информатика

.pdf
Скачиваний:
68
Добавлен:
22.02.2015
Размер:
3.14 Mб
Скачать

Исходя из этого, информацию можно рассматривать и как продукт взаимодействия данных и адекватных методов их преобразования в известные нам понятия. Необходимость применения адекватных методов для получения информации обусловлена тем, что одни и те же данные могут поставлять разную информацию в зависимости от используемых методов. Взаимодействие данных и методов носит диалектический характер. Данные в этом случае являются объективными, т.к. это результат регистрации объективно существующих сигналов, вызванных изменениями в материальном мире. Методы интерпретации данных являются субъективными. Таким образом, информация может возникать и в момент диалектического взаимодействия объективных данных и субъективных методов.

2.2.Системы счисления

Для регистрации сигналов человечество использовало различные символы, изображения и т.д. Для отображения количественных характеристик объектов, явлений и процессов и обработки этой информации использовались специальные знаки (цифры) и приемы их записи.

Совокупность приемов наименования и записи чисел с помощью цифр называют системой счисления.

Влюбой системе счисления для представления чисел выбираются некоторые символы (цифры), называемые базисными цифрами, а все остальные числа получаются в результате каких-либо операций над базисными цифрами данной системы счисления.

Системы счисления различаются выбором базисных цифр и правилами образования из них чисел. Системы счисления можно разделить на непозиционные и позиционные.

Внепозиционных системах значение цифры не зависит от места, занимаемого в изображении числа. Примером непозиционной системы

счисления является римская система, в которой в качестве цифр

22

используются латинские буквы и базисными являются числа 1,5,10, 50,

100, 500, 1000:

 

 

 

 

 

 

I

V

X

L

C

D

M

1

5

10

50

100

500

1000

Например, число 7 получается сложением «пяти» и двух «единиц», а 527 имеет вид DXXVII, где D – 500, XX – 20, VII – 7. Таким образом, с увеличением изображаемых чисел, нужно неограниченно увеличивать число используемых символов. Однако главный недостаток при такой форме записи заключается в сложности выполнения арифметических операций. Это "искусство" требовало специальной профессиональной подготовки, которую в древние времена время могли получить лишь немногие.

В позиционных системах счисления значение цифры зависит от ее позиции в изображении числа. Место каждой цифры в числе называется позицией. Количество используемых цифр называется основанием системы счисления.

Одной из первых известных систем является вавилонская шестидесятеричная. Цифры в ней были двух видов, одним из которых обозначались единицы, другим - десятки. Следы вавилонской системы сохранились до наших дней в способах измерения и записи величин углов и промежутков времени.

Привычной для нас является индо-арабская десятичная система счисления , в которой для записи любого числа используется 10 (базисных) цифр (от 0 до 9). Эта система основана на том, что десять единиц каждого разряда объединяются в одну единицу соседнего старшего разряда.

Мы привыкли считать десятичную систему самой удобной, но в мире существует и существовало множество самых разнообразных систем. Некоторые племена аборигенов Африки и Австралии до сих пор считают с помощью двоичной системы, аборигены Южной Америки пользуются троичной системой счисления, а майорийцы в Новой Зеландии используют

23

одиннадцатеричную. Широкое распространение в истории человечества получала двадцатеричная система.

Основание системы счисления, в которой записано число, обычно обозначается нижним индексом. Например, 5557 - число, записанное в семеричной системе счисления. Если число записано в десятичной системе, то основание, как правило, не указывается.

Запись произвольного числа X в системе с основанием P может быть представлено, как X=an*Pn+an-1*Pn-1+…+a1*P1+a0*P0+a-1*P-1++a-m*P-m+…, где ai - цифры в представлении данного числа. Так, например,

103510=1*103+0*102+3*101+5*100; 10102 = 1*23+0*22+1*21+0*20 = 10.

Наибольший интерес при работе на ЭВМ представляют системы счисления с основаниями 2, 8 и 16.

Все позиционные системы счисления принципиально ничем не отличаются от привычной нам десятичной и обладают существенными преимуществами перед непозиционными.

Во-первых, в ней любое число записывается с помощью небольшого числа символов (в общепринятой десятичной системе ими являются десять арабских цифр), при этом один и тот же символ в зависимости от своего положения имеет разное значение: в одном случае он означает число сотен, в другом - число единиц.

Во-вторых, для позиционной системы правила выполнения арифметических операций намного проще и осуществляются по одной и той же схеме и требуют знания таблиц сложения и умножения однозначных чисел.

В 1673 году Лейбниц предложил использовать в качестве универсального логического языка двоичную систему счисления, которая получила дополнительный толчок в развитии с появлением ЭВМ, так как она имела ряд преимуществ перед другими позиционными системами:

24

для ее реализации используются технические элементы с двумя возможными состояниями (есть ток - нет тока, намагничен – ненамагничен

ит.д.);

представление информации посредством только двух состояний надежно и помехоустойчиво;

возможно применение аппарата булевой алгебры для выполнения логических преобразований информации;

двоичная арифметика проще десятичной (двоичные таблицы сложения и умножения предельно просты).

В двоичной системе счисления для изображения числа используются только две цифры: 0 и 1, называемые двоичными цифрами (binary digits). Произвольное число X в двоичной системе счисления представляется как,

X= an*2n+an-1*2n-1+…+a1*21+a0*20+a-1*2-1++a-m*2-m+…, где каждый коэффициент ai может быть либо 0, либо 1.

Запись числа в двоичном виде намного длиннее записи в десятичной системе счисления.

Арифметические действия, выполняемые в двоичной системе, подчиняются тем же правилам, что и в десятичной системе, только в двоичной системе перенос единиц в старший разряд возникает чаще, чем в десятичной. Таблица сложения в двоичной системе имеет вид:

0 + 0 = 0

0 + 1 =

1

 

1 + 0 = 1

1 + 1 =

0 (перенос в старший разряд)

Таблица умножения для двоичных чисел еще проще:

0 * 0 = 0

0 * 1 = 0

1 * 0 = 0

1 * 1 = 1

Неудобство использования

двоичной

системы счисления

заключается в громоздкой записи чисел. Это неудобство не имеет существенного значения для ЭВМ. Однако при наладке аппаратных средств ЭВМ или создании новой программы иногда возникает необходимость "заглянуть внутрь" памяти машины, чтобы оценить ее

текущее

состояние.

Но

там

все

заполнено

длинными

последовательностями

нулей

и

единиц

двоичных

чисел. Эти

25

последовательности очень неудобны для восприятия человеком, привыкшим к более короткой записи десятичных чисел. Кроме того, естественные возможности человеческого мышления не позволяют оценить быстро и точно величину числа, представленного, например, комбинацией из 16 нулей и единиц.. Поэтому для удобства записи двоичных чисел необходима такая система счисления, которая, с одной стороны, сохраняла бы свойства двоичной, а с другой - в написании была бы близка к десятичной. Такими свойствами обладают системы счисления с основанием 2n, например, 23 - восьмеричная и 24 - шестнадцатеричная системы счисления.

Ввосьмеричной системе счисления базисными числами являются 0, 1, 2, 3, 4, 5, 6, 7. Основание системы - 8. Например, десятичное число 85 в восьмеричной системе будет изображаться в виде 125, т.к. по определению эта запись означает представление числа в виде:

1 *82+2*81+5*80=64+16+5=85

При записи отрицательных чисел перед последовательностью цифр ставят знак минус. Сложение, вычитание, умножение и деление чисел, представленных в восьмеричной системе, выполняются подобно тому, как это делают в общеизвестной десятичной системе счисления.

Часто в информатике используют шестнадцатеричную систему, так как запись чисел в ней значительно короче записи чисел в двоичной системе.

Вшестнадцатеричной системе счисления применяется десять арабских цифр (от 0 до 9) и шесть первых букв латинского алфавита (A, B, C, D, E, F). Например, десятичное число 191.5 в шестнадцатеричной системе будет записано в виде BF.8, действительно,

11*161+15*160+8*16-1=176+15+8/16=191.5.

2.3.Формы представления информации

Известно, что человек воспринимает информацию органами чувств. Часть информации поступает непосредственно в мозг, какая-то часть

26

информации регистрируется, записывается и хранится на носителях. Для хранения звуковой информации используются аудионосители, для видеоинформации – кино- и видеопленки, для символьно-текстовой информации – бумажные и аналогичные им носители. С появлением и развитием ЭВМ появилась возможность унификации форм представления информации и ее носителей путем преобразования информации в двоичные коды, с помощью которых информация любого вида (текстовая, графическая, аудио, видео) может фиксироваться, передаваться, обрабатываться и храниться на машинных носителях.

Процесс преобразования информации из одной формы представления в другую называется кодированием .

При электронной форме представления информации используется двоичное кодирование (binary encoding), основанное на использовании двоичной системы счисления. Объем информации, который может быть представлен в одном двоичном разряде, считается равным одному биту - bit (binary digit - двоичная цифра).

Одним битом могут быть представлены два понятия: 0 или 1 (да или

нет, включен или выключен, намагничено или не намагничено, истина или

ложь и т.п.). Это количество информации очень мало и не несет, как правило, никакой смысловой нагрузки. Если количество битов увеличить до двух, то можно закодировать уже четыре различных понятия:

00

01

10

11

 

 

 

 

Тремя битами можно выразить восемь различных значений:

000

001

010

011

100

101

110

111

Таким образом, при увеличении на единицу количества разрядов в системе двоичного кодирования количество кодируемых значений увеличивается в два раза.

Общая формула объема кодируемой информации имеет вид: N=2m, где N – количество независимых кодируемых значений;

m – разрядность двоичного кодирования.

27

Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию.

Для кодирования целых чисел от 0 до 255 достаточно 8 разрядов двоичного кода (8 бит).

0000 0000 = 0

0000 0001 = 1

·························

1111 1111 = 255

16 бит позволяют закодировать целые числа от 0 до 65535, а 24 бита

– более 16,5 миллионов различных значений.

Для кодирования действительных чисел требуется предварительная

нормализация, т.е. действительное число X приводится к виду:

X= m 10

P

, где

m – мантисса,

P – характеристика (или порядок)

 

числа, при этом, мантисса меньше 1 и первая значащая цифра - не ноль Например,

3,1415926=0,31415926·101 123456789=0,123456789·109

Текстовую информацию кодируют тоже с помощью двоичного кода,

при этом каждому символу алфавита ставится в соответствие определенное целое число (например, порядковый номер). Восьми двоичных разрядов достаточно чтобы выразить все символы английского и русского алфавита, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы (№, §, и др.).

Международным стандартом на персональных компьютерах является таблица кодировки ASCII (американский стандартный код обмена информации). В кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Стандартными в этой таблице являются только первые 128 символов, т.е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111).

28

Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.

Аналогичные системы кодирования текстовых данных были разработаны и в других странах. В России помимо трех действующих стандартов кодировки (КОИ8-Р, Windows-1251, кодировка ГОСТальтернативная) используются и два устаревших стандарта. Отсутствие единого стандарта привело к большому разнообразию одновременно действующих кодировок. Для того чтобы весь мир одинаково кодировал символьные данные, нужны одинаковые таблицы кодирования, что было долгое время невозможно из-за противоречий между символами национальных алфавитов и ограниченного набора кодов (256). В настоящее время наблюдается переход на универсальную систему кодирования – UNICODE, основанную на 16-разрядном кодировании символов и позволяющую обеспечить уникальные коды для 65536 различных символов. Этого достаточно для размещения в одной таблице символов большинства языков планеты.

Для кодирования графической информации применяется два способа: растровый и векторный.

Растровые изображения представляют собой однослойную сетку точек, называемых пикселами (pixel, от англ. picture element). Код пиксела содержит информацию о его цвете.

Для черно-белого изображения (без полутонов) пиксел может принимать только два значения: белый и черный (светитсяне светится), а для его кодирования достаточно одного бита: 1 - белый, 0 - черный.

Пиксел на цветном экране может иметь различную окраску, поэтому одного бита на пиксел недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксел, поскольку два бита могут принимать 4 различных состояния.

29

Все разнообразие цветов получается сочетанием базовых цветов - красного (Red), зеленого (Green), синего (Blue). Считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех основных цветов. Такая система кодирования называется системой RGB по первым буквам названий основных цветов. Если иметь возможность управлять интенсивностью (яркостью) свечения базовых цветов, то количество различных вариантов их сочетаний, порождающих разнообразные оттенки, увеличивается. Количество различных цветов - N и количество битов для их кодировки – m связаны между собой уже известной формулой: N=2m.

Если для кодировки отвести четыре бита, то можно закодировать 24=16 различных цветов, отвечающих комбинациям бит от 0000 до 1111. Если отвести 8 бит - то такой рисунок может содержать 28=256 различных цветов (от 00000000 до 11111111), 16 бит - 216=65 536 различных цветов. И, наконец, если отвести 24 бита, то потенциально рисунок может содержать 224=16 777 216 различных цветов и оттенков. Однако, в связи с ограниченными возможностями мониторов, даже при использовании 24 бит на пиксел такое разнообразие цветов трудно достижимо. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color). Кодирование цветной графики 16разрядными двоичными числами называется режимом High Color.

В отличие от растровой графики векторное изображение многослойно. Каждый элемент векторного изображения - линия, прямоугольник, окружность или фрагмент текста - располагается в своем собственном слое. Каждый элемент векторного изображения является объектом, который описывается с помощью специального языка (математических уравнения линий, дуг, окружностей и т.д.). Этот способ кодирования идеально подходит для рисунков, которые легко представить в виде комбинации простейших фигур, например, для технических чертежей. Преимущество векторной графики заключается в том, что

30

форму, цвет и пространственное положение составляющих ее объектов можно описывать с помощью математических формул.

Кодирование звука. Из курса физики известно, что звук - это колебания воздуха. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), то будет видно плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой – аналоговый - сигнал необходимо преобразовать в последовательность двоичных чисел.

Процесс (Рис. 1), заключающийся в измерении напряжения через равные промежутки времени и записи полученных значений в память компьютера называется дискретизацией (или оцифровкой), а устройство,

выполняющее его - аналого-цифровым преобразователем (АЦП).

Процесс дискретизации

Рис. 1

Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифроаналоговый преобразователь - ЦАП), а затем сгладить получившийся ступенчатый сигнал.

Чем выше частота дискретизации (т.е. количество отсчетов за секунду) и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук

Такой способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами.

Довольно компактным способом представления музыки является нотная запись. Фактически, ее можно считать руководством для музыканта, записанным на особом формальном языке. Однако, нотная система кодирования пригодна только для инструментальной музыки.

31