Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lekc-01.doc
Скачиваний:
3
Добавлен:
18.11.2018
Размер:
204.29 Кб
Скачать

Кодирование информации

Формирование представления информации называется ее кодированием.

Часто термин "кодирование" употребляется в более узком смысле, как переход от исходного представления к представлению, удобному для хранений, передачи или обработки. В этом случае обратный переход к исходному представлению называется декодированием.

При кодировании могут ставиться разные цели и соответственно применяться разные методы. Наиболее распространенные цели кодирования – это экономность, т. е. уменьшение избыточности сообщения; повышение скорости передачи или обработки; надежность, т. е. защита от случайных искажений; сохранность, т. е. защита от нежелательного доступа к информации; удобство физической реализации (например, двоичное кодирование информации в ЭВМ), удобство восприятия. Эти цели часто противоречат друг другу. Экономные сообщения могут оказаться ненадежными, так как они не содержат лишних символов, и искажение любого символа может изменить смысл сообщения.

Например, обычная запись чисел цифрами гораздо экономнее и удобнее для вычислений, чем запись словами. Однако искажение или удаление любой цифры изменяет величину числа. Поэтому в финансовых документах, где надежность крайне важна, цифровые представления чисел в некоторых местах заменяются или дублируются словесными представлениями. (Сумму иногда пишут прописью.) Теория кодирования подробно исследует проблемы разумного сочетания экономности и надежности при передаче информации. Экономное сообщение может повысить скорость обработки (более короткое сообщение будет быстрее передано или прочтено), но может и уменьшить ее. Например, очень экономно использовать вместо фамилий и имен учеников школы коды типа 9Б17 ("девятый класс Б, семнадцатый по порядку в журнале"). Но тогда надо либо помнить все соответствия между фамилиями и кодами, либо каждый раз обращаться к журналу. Защита информации от нежелательного доступа требует специальных способов обеспечения секретности (паролей, ключей и т.д.). Это увеличивает объем хранимой информации, но и замедляет работу с ней.

На разных этапах сложного информационного процесса достигаются разные цели, и поэтому информация неоднократно перекодируется, т. е. изменяет свое представление. Такая перекодировка происходит при передаче телеграмм, при программировании на ЭВМ (превращение алгоритма в программу на языке программирования – ввод – трансляция – работа программы), при заказе авиабилетов в автоматизированной системе и т. д.

Ценность информации. Сообщение

Будем различать понятия «информация» и «сообщение». Под сообщением подразумевают обычно информацию, выраженную в определенной форме и подлежащую передаче. Сообщение – это форма представления информации. Примерами сообщений являются текст телеграммы, речь оратора, показания измерительного прибора, команды управления, изображение на экране телевизора и т. п.

Обращает на себя внимание замечательное единство, связанное с бинарной природой переключающих элементов, бинарным представлением информации и бинарной оценкой его количества. Дело в том, что запоминание информации в вычислительных машинах производится на элементах бинарного типа (ферритовые кольца с прямоугольной петлей гистерезиса, триггеры, полупроводниковые вентили), а информация (буквы, числа) в компьютере представляется в двоичной системе счисления (0 и 1), поэтому и емкость памяти компьютера измеряется количеством бит. После того как аналоговую информацию (речь, музыку, кинофильмы) стало возможным представить в виде 0 и 1, образовался единый процесс обработки, запоминания и передачи информации любой природы, выполняемый с помощью физических элементов бинарного типа.

Есть, однако, особенность, которую стараются не замечать. Она связана с количеством запасенной или переданной информации, представленной в двоичных единицах, и количеством информации, заключенным в данном сообщении.

Измерение только количества информации не отвечает насущным потребностям современного общества – необходима мера ценности информации.

Одной из первых работ по проблеме ценности информации явилась статья, в которой предлагалось принять за меру ценности информации количество информации, необходимое для достижения поставленной цели, т. е. рассчитывать приращение вероятности достижения цели. Так, если до получения информации вероятность достижения цели равнялась P0, а после ее получения – P1, то ценность информации определяется как логарифм отношения P1/P0. Ценность информации при этом измеряется в битах.

Этот критерий логически связан с шенноновской теорией информации, где под количеством информации имеется в виду снятая неопределенность.

Пользоваться критерием оценки значимости информации следует избирательно. Дело в том, что информация относительна: полученные сведения могут не иметь отношения к решаемой задаче, но, тем не менее, быть информативными. Статья в специальном журнале для специалиста может иметь большую ценность, в то время как для читателя журнала «Крокодил» – никакой.

Или, например, следующий текст: «Траектория в конфигурационном пространстве находит широкое применение и требует всестороннего тестирования. Оборудование четвертого поколения, в частности, свидетельствует о необходимости более тщательного анализа независимого принципа функционирования. Всестороннее тестирование, аналогично, открывает весьма интересные перспективы комплексной программы испытаний. Предварительный отбор данных по определенным критериям, например, указывает на пределы применимости комплексной программы испытаний. Более строгая стандартизация основных модулей, как показывают приведенные выше соображения, сводит до минимума затраты при условии траектории в конфигурационном пространстве.

Отличительная особенность выбранных критериев, с другой стороны, находит широкое применение и требует проектирования на основе системного подхода. Более тонкая аппаратная реализация, однако, находит широкое применение и требует нагруженного несущего элемента. Отличительная особенность выбранных критериев, как показывают приведенные выше соображения, признает значимость других систем и необходимость предварительного отбора данных по определенным критериям. Аналогично, отличительная особенность выбранных критериев подразумевает более основательное использование теории предварительного отбора данных по определенным критериям. Как показывают приведенные выше соображения, инициация развития критической подсистемы чрезвычайно усложняется, если не принять во внимание условие функционирования в режиме дискретного времени.

Нетрудно видеть, что включение дополнительных внутренних связей чрезвычайно усложняется, если не принять во внимание условие более строгой стандартизации основных модулей. Например, отличительная особенность выбранных критериев находит широкое применение и требует более тонкой аппаратной реализации. Отличительная особенность выбранных критериев, с другой стороны, признает значимость других систем и необходимость функционирования в режиме дискретного времени. Нетрудно видеть, что функционирование в режиме дискретного времени сводит до минимума затраты при условии включения дополнительных внутренних связей. Оборудование четвертого поколения, с другой стороны, сводит до минимума затраты при условии комплексной программы испытаний.

С другой стороны, траектория в конфигурационном пространстве чрезвычайно усложняется, если не принять во внимание условие проектирования на основе системного подхода. Итак, отличительная особенность выбранных критериев обеспечивает эффективное использование проектирования на основе системного подхода. С другой стороны, независимый принцип функционирования чрезвычайно усложняется, если не принять во внимание условие предварительного отбора данных по определенным критериям. Проектирование на основе системного подхода, в частности, чрезвычайно усложняется, если не принять во внимание условие включения дополнительных внутренних связей. С другой стороны, нагруженный несущий элемент подразумевает более основательное использование теории интеграции и специализации.

Нетрудно видеть, что включение дополнительных внутренних связей открывает весьма интересные перспективы более тонкой аппаратной реализации. С другой стороны, всестороннее тестирование свидетельствует о необходимости более тщательного анализа комплексной программы испытаний. Гибкость в зависимости от условий, итак, признает значимость других систем и необходимость гиперповерхности в пространстве состояний. Гиперповерхность в пространстве состояний, как показывают приведенные выше соображения, обеспечивает эффективное использование более строгой стандартизации основных модулей. Более строгая стандартизация основных модулей, в частности, находит широкое применение и требует включения дополнительных внутренних связей.»

Данный текст, по теории, несет в себе 32 000 бит информации, но, на практике, его информативность – 0 бит, и никакой значимой информации здесь нет.

Вообще, оценка значимости информации производится человеком часто интуитивно, опираясь на собственный интеллект и опыт. Сложность проблемы оценки информации хорошо иллюстрируется известной шуткой из сборника «Физики продолжают шутить»: «Альберт Эйнштейн любил фильмы Чарли Чаплина и относился с большой симпатией к созданному им герою. Однажды он написал в письме к Чаплину: «Ваш фильм «Золотая лихорадка» понятен во всем мире, и Вы непременно станете великим человеком. Эйнштейн.» На это Чаплин ответил так: «Я Вами восхищаюсь еще больше. Вашу теорию относительности никто в мире не понимает, а Вы все-таки стали великим человеком. Чаплин».

В некоторых научных работах понятие ценности информации базируется на статистической теории информации и теории решений. Сущность метода состоит в том, что кроме вероятностных характеристик неопределенности объекта до и после получения информации вводятся функции штрафов или потерь и оценка информации производится в результате минимизации потерь. Максимальной ценностью обладает то количество информации, которое уменьшает потери до нуля при достижении поставленной цели.

Кроме того, предполагается, что получаемое количество информации; может не иметь никакой ценности или его ценность может быть отрицательной. При этом можно рассматривать случай, когда передается ложная информация (дезинформация) и неопределенность не сокращается, а возрастает.

Информация называется полезной, если она уменьшает неопределенность решающего алгоритма. И не имеет смысла говорить о полезной информации, содержащейся в сигнале, если не указаны задача, которая решается, начальное состояние решающего алгоритма и свойства декодирующего алгоритма.

Таким образом, различные подходы к решению проблемы ценности информации имеют принципиально общие черты: они предлагают измерять ценность информации через ее количество, связывают ценность информации с поставленной задачей.

Названными нами вариантами теория ценности информации отнюдь не исчерпывается. Нельзя в связи с этим не отметить попытки построить семантическую теорию информации. В общих чертах идея исходит еще от Н. Винера – для понимания и использования полученной информации получатель должен обладать определенным запасом знаний. Действительно, полное незнание предмета не позволяет извлечь существенной научной информации из принятого сообщения об этом предмете. По мере роста наших знаний о предмете растет и количество научной информации, извлекаемой из сообщения.

Если назвать имеющиеся у получателя знания о данном предмете «тезаурусом» (т.е. неким сводом слов, понятий, названий объектов, связанных смысловыми связями), то количество информации, содержащееся в некотором сообщении, можно оценить степенью изменения индивидуального тезауруса под воздействием данного сообщения. Иными словами, количество семантической информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. В связи с этим появилось понятие общечеловеческою тезауруса, относительно которою можно было бы измерять семантическую ценность научной информации. Это сделано в попытках найти такую меру ценности информации, которая не зависела бы от состояния индивидуальною приемника.

Пока можно сделать вывод, что задача определения ценности информации при достаточной степени формализации, которая требуется при компьютеризованной оценке, еще не решена, однако это не означает невозможности ее решения в будущем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]