Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика — курс лекций.pdf
Скачиваний:
540
Добавлен:
11.03.2015
Размер:
2.18 Mб
Скачать

 

продолжительностью звукозаписи (с);

 

частотой выборки (1/с);

размерами кадра (измеряются в пикселах);

глубиной кодирования цвета (измеряется в битах).

Если не учитывать размер звуковой выборки данных, то итоговая формула выглядит так.

( )

Поток данных при видеозаписи

Как видно из формулы, размер выборки данных, получаемой при кодировании видеоряда, зависит от продолжительности записи и от параметров её качества. Выделим эти составляющие порознь, аналогично тому, как мы поступали при рассмотрении звукозаписи.

(

)

(

)

Здесь множитель определяет продолжительность видеозаписи, а комплекс — её качество. Эту величину называют потоком данных. Она выражает количество данных, проходящих по информационному каналу в единицу времени, и измеряется количеством бит в секунду.

Основной величиной, влияющей на качество видеозаписи, является размер кадра. От него в наибольшей степени зависит поток данных.

Сжатие данных при кодировании

То, что при переходе к информационному обществу происходит прогрессивное нарастание информационных потоков, — явление закономерное. Общество относится к нему вполне благожелательно, пока видит в нём улучшение качества информационных услуг и расширение их ассортимента.

Однако на информационные потоки можно взглянуть и иначе. Нельзя забывать, что у информации есть материальный компонент — данные, а взгляд общества на увеличение потоков данных весьма неоднозначен. В частности, с транспортировкой данных связаны следующие негативные обстоятельства:

уничтожение лесов при производстве бумаги;

повреждение почвы при сооружении кабельных линий связи;

искажение ландшафтов при создании воздушных линий связи;

разрушение экосистем при прокладке подводных линий связи;

загрязнение атмосферы при построении космических систем связи.

Копасным для человека факторам, имеющим недостаточно изученные последствия, относятся электромагнитные излучения, сопровождающие работу мобильных средств связи, устройств беспроводного доступа к Интернету и высокочастотных установок.

Кроме экологических, существуют также негативные экономические последствия. Нарастание потоков данных требует дополнительных расходов сырья, энергии, кадровых ресурсов. Можно

92

утверждать, что по мере перехода к информационному обществу издержки человечества на обеспечение информационного обмена прогрессивно, возрастают. Сокращение этих издержек — одна из важнейших задач информатики.

Одно из возможных решений, предлагаемых информатикой, — сжатие данных. При этом под «сжатием» понимают такое перекодирование исходной последовательности данных, при котором объём данных уменьшается, а их информационное содержание сохраняется в заданных пределах.

Теоретические аспекты сжатия данных

Людям важно иметь представление о количестве той информации, которую они создают, хранят, передают и приобретают. При этом они часто руководствуются бытовым, житейским представлением, что чем больше информации, тем лучше, особенно если она поступает быстро.

На самом деле, чтобы объективно говорить о количестве какой-либо сущности, необходимо выделять и различать в ней перечислимые элементы. Для материальных сущностей этим занимается физика. На её уроках мы учимся корректно оперировать количественными параметрами, выражающими физические свойства тел и полей.

Синформацией дело обстоит сложнее. Информация — сущность не материальная. Выделить

вней составляющие элементы нельзя, и научного аппарата, который позволил бы объективно говорить о количестве информации, не существует. Разные люди по-разному оценивают количество одной и той же информации. Поэтому, когда надо дать объективную оценку, информацию подменяют данными. Данные, в отличие от информации, объективны, и оценить их объём проще.

Данные — это зарегистрированные сигналы, следовательно, они различимы. Кроме того, данные всегда связаны с материальным носителем, следовательно, они объективны. Различимость и объективность позволяют выделять в данных составляющие элементы и подсчитывать их количество. Можно пересчитать количество букв в книге и штрихов в рисунке, замерить количество микровспышек света на экране монитора и рассчитать частоту их появления.

Как измерить данные?

Способ измерения данных зависит от их природы, а она, в свою очередь, зависит от способа кодировании информации. Если, например, изображение закодировано точками, то объём данных определяется количеством точек, а если текст закодирован буквами, то его размер определяется числом букв.

Работая с вычислительной техникой, удобно пересчитывать числа. Их мы получаем в качестве элементов данных при цифровом кодировании. Цифровое кодирование имеет ещё и то достоинство, что для него не надо искать минимальный элемент данных. Он хорошо известен: это двоичный разряд, называемый битом. При цифровом кодировании бит является минимальной единицей представления информации и служит удобной единицей измерения данных.

Минимальная выборка данных

Одну и ту же информацию можно закодировать множеством способов. При этом разные способы могут давать разные количества данных. Выбирая метод кодирования, можно управлять объёмом полученных данных. Одну и ту же информацию можно представить большим количеством данных или меньшим. Однако возможности подобного управления не безграничны. Для любой произ-

93

вольной информации в избранной системе кодирования существует некоторая минимальная выборка данных, размер которой уже нельзя уменьшить без потери содержания.

Избыточность кодирования

В тех случаях, когда размер данных, полученных при кодировании информации, превышает размер соответствующей минимальной выборки, можно говорить о том, что данные обладают избыточностью. В этом случае данные можно перекодировать так, чтобы величина избыточности уменьшилась. Подобное перекодирование называют «сжатием» или «уплотнением» данных.

За тысячелетия развития информационного обмена люди создали и внедрили множество разнообразных систем кодирования. Так, например, любой национальный язык представляет собой сложную систему кодирования образов, чувств и понятий. Системы кодирования можно найти в произведениях устного народного творчества, в танцах, костюмах, обрядах. При их создании и отборе исторические сообщества придерживались традиций и руководствовались принципами нравственности и эстетики, но никак не требованиями эффективности кодирования. Надо ли после этого удивляться, что большинство традиционных методов кодирования информации создают избыточные данные?

До последнего времени избыточность данных в информационном обмене недостатком не считалась. Наоборот, определённая избыточность ценилась. Например, избыточность данных позволяет восстанавливать частично утраченную или пропущенную информацию. Поэтому избыточные данные усваиваются проще, ведь для этого требуется меньшая концентрация внимания. А ещё информация, заключённая в избыточных данных, доступнее, потому что для её воспроизведения проще подобрать необходимый информационный метод.

Отношение к избыточности данных существенно изменилось после перехода к информационному обществу. В результате быстрого нарастания информационных потоков стал заметен основной недостаток избыточных данных: повышенные расходы на их хранение и транспортировку. В тех областях, где с данными работают только люди (образование, культура), эти обстоятельства редко принимаются в расчёт, потому что комфорт и удобство для человека важнее. Но там, где в информационном обмене участвуют автоматические средства вычислительной техники, с избыточностью данных приходится считаться, потому что она снижает производительность систем связи, повышает расходы на хранение, передачу и потребление информации, вносит вклад в загрязнение окружающей среды.

Снижение избыточности данных

Избыточность данных уменьшают путём их перекодирования (дополнительного, специального кодирования). Эту операцию называют сжатием или уплотнением данных.

Сжатие данных — это операция преобразования исходной выборки данных в результирующую выборку, представляющую адекватную информацию, но имеющую меньший размер.

Теоретической основой сжатия данных всегда является их избыточность. Когда в процессе сжатия размер выборки данных уменьшается до размера соответствующей минимальной выборки, возможность дальнейшего сжатия исчерпывается.

Существует много методов сжатия данных. В их основе лежат следующие утверждения.

94