Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Bilety_po_informatike_shpargalki.docx
Скачиваний:
44
Добавлен:
22.02.2015
Размер:
1.5 Mб
Скачать

Раздел 4 (Лекция 6)

Представление символьной информации в ЭВМ

Символьная информация обрабатывается в памяти ЭВМ в форме цифрового кода.

Например, можно обозначить каждую букву числами, соответствующими ее порядковому номеру в алфавите: А - 01, Б - 02, В - 03, Г - 04, ... , Э - 30, Ю - 31, Я - 32. Точно так же можно договориться обозначать точку числом 33, запятую - 34

Так как в ЭВМ используются двоичные коды, то обозначения букв надо перевести в двоичную систему. Тогда буквы будут обозначаться следующим образом: А - 000001, Б - 000010, В - 000011, Г - 000100, ... , Э - 011110, Ю - 011111, Я - 100000.

При таком кодировании любое слово можно представить в виде последовательности кодовых групп, составленных из 0 и 1.

Например, код слова «БАБА» имеет вид: 000010 000001 000010 000001

Требования к построению схем преобразования

Между множествами символов и кодов должно иметь место взаимно-однозначное соответствие, т.е. разным символам должны быть назначены разные цифровые коды, и наоборот.

Из соображений наглядности и легкости запоминания целесообразно множества символов, упорядоченных по кому-либо признаку (например, лексико - графическому), кодировать также с помощью упорядоченной последовательности чисел.

Другим важным моментом при организации кодировки символьной информации является эффективное использование оперативной памяти (28=256 поэтому слова в 1 байт достаточно)

Распространенные схемы кодирования

BCD (Binary-Coded Decimal) – двоично-десятичный код используется для представления чисел, при котором каждая десятичная цифра записывается своим четырехбитовым двоичным эквивалентом

EBCDIC (Extended Binary-Coded Decimal Interchange Code) – расширенный двоично-десятичный код обмена информацией, который преобразует как числовые, так и буквенные строки.

Эти коды могут оказаться полезными, когда нужно преобразовать строку числовых знаков, например, строку из числовых знаков «565» в число 565, над которым затем будут производиться арифметические действия.

Код ASCII

ASCII (American Standard Code for Information Interchange) – американский стандартный код обмена информации. Этот код генерируется некоторыми внешними устройствами (принтером, АЦПУ) и используется для обмена данными между ними и оперативной памятью ЭВМ. Стандарт: диапазон 0-127 (00-7F) международный стандарт кодировки управляющих символов и букв латинского алфавита. Расширение стандарта: диапазон 128-255 (80-FF) для кодов псевдографики и букв национальных алфавитов.

КОИ-7 – отечественная версия кода ASCII (двоичный семибитовый код обмена информацией), которая совпадает с ним, за исключением букв русского алфавита

Кодирование графической информации

В середине 50-х годов для больших ЭВМ, которые применялись в научных и военных исследованиях, впервые в графическом виде было реализовано представление данных. В настоящее время широко используются компьютерные технологии обработки графической информации.

Широкое применение получила специальная область информатики, которая изучает методы и средства создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов, - компьютерная графика.

Без нее трудно представить уже не только компьютерный, но и вполне материальный мир, так как визуализация данных применяется во многих сферах человеческой деятельности. В качестве примера можно привести опытно-конструкторские разработки, медицину (компьютерная томография), научные исследования и др.

Особенно интенсивно технология обработки графической информации с помощью компьютера стала развиваться в 80-х годах

Качество кодирования

При кодировании изображения происходит его пространственная дискретизация. Все изображение разбивается на отдельные точки, каждому элементу ставится в соответствие код его цвета.

Качество кодирования будет зависеть от следующих параметров: размера точки и количества используемых цветов. Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования. Чем большее количество цветов используется (т. е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждая точка, а, значит, увеличивается качество кодирования.

Виды представления графических изображений (растровое, векторное, фрактальное, 3D графика)

Создание и хранение графических объектов возможно в нескольких видах - в виде векторного, фрактального или растрового изображения.

Отдельным видом считается 3D (трехмерная) графика, в котором сочетаются векторный и растровый способы формирования изображений. Она изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве. Для каждого вида используется свой способ кодирования графической информации.

Растровая графика

Самый простой способ представления изображения в цифровом виде состоит в том, чтобы каждый элемент изображения (точку) описать отдельно. Описание точки это описание ее цвета. Все изображения, представленные таким способом, называют растровыми. Фотографии, произведения живописи, картинки с плавными переходами цветов обычно представляются в компьютере как растровые изображения.

Точность передачи изображения зависит от количества точек и их размера. После разбиения рисунка на точки, начиная с левого угла, двигаясь по строкам слева направо, можно кодировать цвет каждой точки. Принято точку называть пикселем (происхождение связано с английской аббревиатурой "picture element" - элемент рисунка).

Объем растрового изображения определяется умножением количества пикселей на информационный объем одной точки, который зависит от количества ее возможных цветов.

Так как яркость каждой точки и ее линейные координаты можно выразить с помощью целых чисел, то можно сказать, что этот метод кодирования позволяет использовать двоичный код для того чтобы обрабатывать графические данные.

Векторная графика

Векторное изображение - это графический объект, состоящий из элементарных отрезков и дуг. Базовым элементом изображения является линия. Как и любой объект, она обладает свойствами: формой (прямая, кривая), толщиной., цветом, начертанием (пунктирная, сплошная). Замкнутые линии имеют свойство заполнения (или другими объектами, или выбранным цветом). Все прочие объекты векторной графики составляются из линий.

Так как линия описывается математически как единый объект, то и объем данных для отображения объекта средствами векторной графики значительно меньше, чем в растровой графике. Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.

   К программным средствам создания и обработки векторной графики относятся следующие: Corel Draw, Adobe Illustrator, а также векторизаторы (трассировщики) - специализированные пакеты преобразования растровых изображений в векторные.

Фрактальная графика

Фрактальная графика основывается на математических вычислениях, как и векторная. Но в отличии от векторной ее базовым элементом является сама математическая формула. Это приводит к тому, что в памяти компьютера не хранится никаких объектов и изображение строится только по уравнениям. При помощи этого способа можно строить простейшие регулярные структуры, а также сложные иллюстрации, которые имитируют ландшафты.

Системы кодирования цветных изображений: HSB, RGB и CMYK

Применяют несколько систем кодирования: HSB, RGB и CMYK. Первая система проста, интуитивно понятна и удобна для человека, вторая наиболее удобна для компьютера, а последняя система CMYK - для типографий.

Использование этих систем кодирования связано с тем, что световой поток может формироваться излучениями, представляющими собой комбинацию "чистых" спектральных цветов: красного, зеленого, синего или их производных.

Различают аддитивное цветовоспроизведение (характерно для излучающих объектов). В качестве примера такого объекта можно привести электронно-лучевую трубку монитора.

И субтрактивное (вычислительное) цветовоспроизведение (характерно для отражающих объектов). В качестве примера объекта этого типа можно привести полиграфический отпечаток.

Система RGB

Известно, что любой цвет можно представить в виде комбинации трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Другие цвета и их оттенки получаются за счет наличия или отсутствия этих составляющих.

Данная цветовая модель является аддитивной, то есть любой цвет можно получить сочетанием основных цветов в различных пропорциях. При наложении одного компонента основного цвета на другой яркость суммарного излучения увеличивается.

Если совместить все три компоненты, то получим ахроматический серый цвет, при увеличении яркости которого происходит приближение к белому цвету.

При 256 градациях каждого цвета (точка изображения кодируется 3 байтами – 24-х битный цвет) минимальные значения RGB (0,0,0) соответствуют черному цвету, а белому - максимальные с кодами (255, 255, 255).

Чем больше значение байта цветовой составляющей, тем этот цвет ярче. Например, темно-синий кодируется тремя байтами ( 0, 0, 128), а ярко-синий (0, 0, 255).

Система CMYK

Эта цветовая модель используется при выводе изображений на печать. Каждому из основных цветов ставится в соответствие дополнительный цвет (дополняющий основной до белого). Получают дополнительный цвет за счет суммирования пары остальных основных цветов. Дополнительным цветом для красного является голубой (Cyan,C) = зеленый + синий = белый - красный, для зеленого - пурпурный (Magenta, M) = красный + синий = белый - зеленый, для синего - желтый (Yellow, Y) = красный + зеленый = белый - синий.

Причем принцип декомпозиции произвольного цвета на составляющие можно применять как для основных, так и для дополнительных, то есть любой цвет можно представить или в виде суммы красной, зеленой, синей составляющей или же в виде суммы голубой, пурпурной, желтой составляющей.

В этой системе используют еще черный цвет (BlacК, так как буква В уже занята синим цветом, то обозначают буквой K). Это связано с тем, что наложение друг на друга дополнительных цветов не дает чистого черного цвета.

Система HSB

Эта система характеризуется тремя компонентами: оттенок цвета (Hue) (длина волны), насыщенность цвета (Saturation) (амплитуда волны) и яркость цвета (Brightness) (освещенность).

Можно получить большое количество произвольных цветов, регулируя эти компоненты. Эту систему применяют в графических редакторах, в которых изображения создаются, а не обрабатываются уже готовые.

Эта система хорошо согласуется с моделью восприятия цвета человеком, недостаток ее в том, что ее необходимо преобразовывать в систему RGB, если ее планируется использовать в качестве экранной иллюстрации, или CMYK, для печатной иллюстрации.

Обычно в таких редакторах значение цвета выбирается как вектор, выходящий из центра окружности. Направление вектора задается в угловых градусах и определяет цветовой оттенок. Насыщенность цвета определяется длиной вектора, а яркость цвета задается на отдельной оси, нулевая точка которой имеет черный цвет. Точка в центре соответствует белому (нейтральному) цвету, а точки по периметру - чистым цветам.

Режимы представления цветной графики (полноцветный, индексный)

Различают режимы представления цветной графики:

а) полноцветный (True Color);         

б) High Color;        

в) индексный.

При полноцветном режиме для кодирования яркости каждой из составляющих используют 256 кодов яркости (восемь двоичных разрядов), то есть на кодирование цвета одного пикселя (в системе RGB) надо затратить 8*3=24 разряда. Это позволяет однозначно определять 16,5 млн. цветов. Что довольно близко к чувствительности глаза человека.

При кодировании с помощью системы CMYK для представления цветной графики надо иметь 8*4=32 двоичных разряда.

Режим High Color - это кодирование при помощи 16-разрядных двоичных чисел. При этом режиме значительно уменьшается диапазон кодируемых цветов (65 636 цветов – 16-ти битный цвет).

 При индексном режиме кодирования цвета можно передать всего лишь 256 цветовых оттенков. Каждый цвет кодируется при помощи восьми бит данных.

Понятно, что 256 оттенков цвета не передают весь диапазон цветов, доступный человеческому глазу, поэтому подразумевается, что к графическим данным прилагается палитра (справочная таблица), без которой воспроизведение будет неадекватным: море может получиться красным, а листья - синими.

Сам код точки растра в данном случае означает не сам по себе цвет, а только его номер (индекс) в палитре. Отсюда и название режима - индексный.

Кодирование звуковой информации

Еще древнегреческий философ и ученый - Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха.

Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

На слух человек воспринимает упругие волны, имеющие частоту где-то в пределах от 16 Гц до 20 кГц (1 Гц - 1 колебание в секунду). В соответствии с этим упругие волны в любой среде, частоты которых лежат в указанных пределах, называют звуковыми волнами или просто звуком.

Аналого-цифровое преобразование звука

Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал.

Аналого-цифровой преобразователь (АЦП) – это устройство, которое переводит сигнал в цифровую форму.  В упрощенном виде принцип работы АЦП заключается в следующем: через определенные промежутки времени измеряется амплитуда сигнала и далее сохраняется в памяти последовательность чисел, несущих информацию об изменениях амплитуды.

Термином семпл (Sample ) называют как промежуток времени между двумя измерениями амплитуды аналогового звукового сигнала, так и последовательность цифровых данных, которые получили путем аналого-цифрового преобразования звука.

Сам процесс преобразования называют семплированием, на русском техническом языке это обычная дискретизация.

Важными параметрами семплирования являются два: частота и разрядность.   Частота - количество измерений амплитуды аналогового сигнала в секунду. Разрядность указывает с какой точностью сохраняются изменения амплитуды аналогового сигнала.

Именно от разрядности зависит достоверность восстановления формы волны.

Значения разрядности для звука

Обычно используют 8, 16-битное или 24-битное представление значений амплитуды.

8-битное кодирование, позволяет достичь точность изменения амплитуды аналогового сигнала до 1/256 от динамического диапазона цифрового устройства. Применяют в мультимедийных приложениях, где не требуется высокое качество звука.

Если использовать 16-битное кодирование для представления значений амплитуды звукового сигнала, то точность измерения возрастет в 256 раз. Используется при записи компакт-дисков.

В качественных преобразователях принято использовать 24-битное кодирование сигнала, что позволяет получать высококачественную оцифровку звука.

Форматы данных в ЭВМ

Данные, обрабатываемые ЭВМ, делятся на три группы:

1.логические коды,

2.числа с фиксированной запятой,

3.числа с плавающей запятой.

Представление логических кодов и структура разрядной сетки

Логическими кодами могут быть представлены символьные величины, числа без знака и битовые величины

Логические коды могут размещаться в отдельных байтах и в словах

Для их представления используются все разряды: для байта от 0-го до 7-го, для слова из 2 байт – от 0-го до 15-го, причем старший разряд всегда содержит 0.

Числа без знака имеют диапазон представления от 000 до 3778 – для байта, от 000000 до 1777778 – для слова

Представление чисел в формате с фиксированной запятой и особенности данного формата

Структура разрядной сетки:

Особенности данного формата:

1.Переполнение разрядной сетки

При выполнении операций над числами, представленными в формате с фиксированной запятой, они масштабируются таким образом, чтобы каждое число лежало в интервале (-1,+1)

При этом необходимо следить за тем, чтобы в результате операций результат не получился большим, чем 2k-1, где k – число разрядов, отведенных для представления чисел в памяти ЭВМ

Такая опасность есть при выполнении операций сложения и деления, когда возможен случай переполнения разрядной сетки: результат по модулю > 1.

2.Появление машинного нуля

Опасность представляют также операции вычитания и умножения. При вычитании может получиться так, что разность станет числом меньшим, чем представляется в машине, и результат исчезнет. При многократном умножении (из-за того, что умножаются числа, меньшие единицы) может произойти то же самое.

Поэтому при использовании формата представления чисел с фиксированной запятой приходится следить также за случаями, связанными с появлением машинного нуля.

3.Накопление абсолютной погрешности

Неизбежным при использовании такого формата является процесс накопления абсолютной погрешности вычислений из-за перемасштабирования, при котором цифры младших разрядов (а именно в них накапливается абсолютная погрешность) передвигаются в старшие разряды.

Все перечисленные выше недостатки привели к тому, что в универсальных ЭВМ представление чисел с фиксированной запятой практически перестало применяться.

Оно сохраняется в специализированных ЭВМ, где диапазон изменения чисел заранее проанализирован, а также в некоторых микропроцессорах и микро–ЭВМ.

4.Аппаратная реализация арифметических операций с числами в формате с фиксированной запятой намного проще, чем с числами в формате с плавающей запятой.

5.При этом существуют ЭВМ как с дробной арифметикой (n=0), так и с целочисленной (m=0).

Представление чисел в формате с плавающей запятой

Любое вещественное число x, представленное в системе счисления с основанием K, можно записать в виде:

где m – мантисса, p – характеристика (или порядок) числа.

Если |m|<1, то запись числа называется нормализованной слева.

Запись числа называют нормализованной справа, если после запятой в мантиссе стоит не нуль

Процедура нормализации справа

В ЭВМ с целью минимизации погрешности при вычислениях и эффективного использования памяти применяют процедуру нормализации справа.

В дальнейшем под нормализацией записи числа будем понимать нормализацию справа: после запятой в мантиссе стоит не нуль.

Структура разрядной сетки

Выполнение арифметических операций над числами, представленными в формате с плавающей запятой

При выполнении арифметических операций над числами, представленными в формате с плавающей запятой, надо отдельно выполнять их для порядков и мантисс.

При алгебраическом сложении чисел надо сначала уравнять порядки слагаемых и мантиссы сложить.

При умножении порядки надо складывать, а мантиссы перемножать.

При делении из порядка делимого вычитают порядок делителя, а над мантиссами совершают обычную операцию деления.

Сравнение форматов чисел с фиксированной и плавающей запятой

Понятно, что арифметические операции с числами в формате с плавающей запятой намного сложнее таких же операций для чисел в формате с фиксированной запятой.

Но зато плавающая запятая позволяет производить операции масштабирования автоматически в процессоре ЭВМ, что избавляет от накопления абсолютной погрешности при вычислениях (хотя не избавляет от накопления относительной погрешности).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]