Основные информационные характеристики источника сообщений. Коды Шеннона

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Витебский государственный университет им. П. М. Машерова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Itog.docx

Скачиваний:

Добавлен:

03.09.2019

Размер:

745.71 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 124 5 6 7 8 9 10 11 12 > Следующая >>>

Основные информационные характеристики источника сообщений. Коды Шеннона—Фано.

Инф. Харак-ки источника сообщений:

Энтропия источника. Величина Н(А) называется энтропией источника и характеризует среднее количество информации приходящейся на одно сообщение.
Избыточность - это мера сокращения сообщения без потери информации, за счет статистических взаимосвязей между элементами сообщения.
Производительность источника (Скорость создания сообщений)- это среднее количество информации создаваемое источником в единицу времени.
Количественная мера информации. (для определения количества информации используются две зависимости:

линейная выражающая зависимость количества информации в сообщении от его длины, т. е. например, книга несет больше информации, чем одна ее страница;
экспоненциальная выражающая зависимость количества информации в сообщении от возможных перестановок одних и тех же элементов этого сообщения, так, например, если источник сообщения имеет словарный запас в 1000 слов и формирует сообщение длинной 50 слов, то количество возможных сообщений будет равно 501000.)

Коды Шеннона-Фано.

Коды Шеннона-Фано префиксные, т. е никакое кодовое слово не является префиксом (Префиксный код— код со словом переменной длины, имеющий такое свойство: если в код входит слово a, то для любой непустой строки b слова ab в коде не существует) любого другого. Это свойство позволяет однозначно декодировать любую последовательность кодовых слов.

Алгоритм вычисления кодов Шеннон-Фано

Код Шеннона-Фано строится с помощью дерева. Построение этого дерева начинается от корня. Всё множество кодируемых элементов соответствует корню дерева (вершине первого уровня). Оно разбивается на два подмножества с примерно одинаковыми суммарными вероятностями. Эти подмножества соответствуют двум вершинам второго уровня, которые соединяются с корнем. Далее каждое из этих подмножеств разбивается на два подмножества с примерно одинаковыми суммарными вероятностями. Подобным образом поступаем до тех пор, пока не получим все концевые вершины(концевой вершиной наз подмножество содержащее единственный элемент). Ветви кодового дерева размечаем символами 1 и 0.

Разбиение множества элементов может быть произведено несколькими способами. Выбор разбиения на уровне n может ухудшить варианты разбиения на следующем уровне (n + 1) и привести к неоптимальности кода в целом. Другими словами, оптимальное поведение на каждом шаге пути ещё не гарантирует оптимальности всей совокупности действий. Особенность этого кода, что для одного и того же распределения вероятностей можно построить несколько кодов Шеннона-Фано, и все они могут дать различные результаты в плане оптимальности кода.

Сжатие информации кодами Хаффмана.

Алгоритм Хаффмана — адаптивный жадный алгоритм оптимального префиксного кодирования (Префиксный код — код со словом переменной длины, имеющий такое свойство: если в код входит слово a, то для любой непустой строки b слова ab в коде не существует) алфавита с минимальной избыточностью. Алгоритм Хаффмана всегда оптимальный. Этот метод кодирования состоит из двух основных этапов:

Построение оптимального кодового дерева.
Построение отображения код-символ на основе построенного дерева.

Классический алгоритм Хаффмана на входе получает таблицу частот встречаемости символов в сообщении. Далее на основании этой таблицы строится дерево кодирования Хаффмана.

Символы входного алфавита образуют список свободных узлов. Каждый лист имеет вес, который может быть равен либо вероятности, либо количеству вхождений символа в сжимаемое сообщение.
Выбираются два свободных узла дерева с наименьшими весами.
Создается их родитель с весом, равным их суммарному весу.
Родитель добавляется в список свободных узлов, а два его потомка удаляются из этого списка.
Одной дуге, выходящей из родителя, ставится в соответствие бит 1, другой — бит 0.
Шаги, начиная со второго, повторяются до тех пор, пока в списке свободных узлов не останется только один свободный узел. Он и будет считаться корнем дерева.

Чтобы определить код для каждого из символов, входящих в сообщение, мы должны пройти путь от листа дерева, соответствующего этому символу, до корня дерева, накапливая биты при перемещении по ветвям дерева. Полученная таким образом последовательность битов является кодом данного символа, записанным в обратном порядке

Классический алгоритм Хаффмана имеет ряд существенных недостатков.

для восстановления содержимого сжатого сообщения декодер должен знать таблицу частот, которой пользовался кодер.
избыточность кодирования обращается в ноль лишь в тех случаях, когда вероятности кодируемых символов являются обратными степенями числа 2.
для источника с энтропией, не превышающей 1 применение кода Хаффмана бессмысленно.

Адаптивное сжатие позволяет не передавать модель сообщения вместе с ним самим и ограничиться одним проходом по сообщению как при кодировании, так и при декодировании. В создании алгоритма адаптивного кодирования Хаффмана используются процедуры обновления модели очередным символом:

Первая — увеличение веса узлов дерева. Вначале увеличиваем вес листа, соответствующего считанному символу, на единицу. Затем увеличиваем вес родителя, чтобы привести его в соответствие с новыми значениями веса потомков. Этот процесс продолжается до тех пор, пока мы не доберемся до корня дерева.

Вторая операция — перестановка узлов дерева — требуется тогда, когда увеличение веса узла приводит к нарушению свойства упорядоченности.

Обновление дерева Хаффмана должно учитывать вес, т.е достижение допустимого максимума. Если мы достигли максимума, то необходимо «масштабировать» вес, обычно разделив вес листьев на целое число, например, 2, а потом пересчитав вес всех остальных узлов. При масштабировании происходит потеря точности статистики, тесты показывают, что оно приводит к лучшим показателям сжатия.

<<< < Предыдущая 1 2 34 / 124 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.04.2015100.35 Кб41IPPU_temy_kontrolnykh_rabot.doc
#
20.03.201632.67 Mб74ISAKOV_G_P_Tsvetovedenie.doc
#
23.11.2018193.82 Кб6Istoria_B_1_-_50.docx
#
13.09.2019414.72 Кб31Istoria_i_metodologia_geograficheskoy_nauki.doc
#
21.04.2019597.5 Кб6ITALIYa_Office_Word.doc
#
03.09.2019745.71 Кб14Itog.docx
#
26.11.2018154.62 Кб3IV.УХОД ЗА БОЛЬНЫМИ ПРИ НАРУШЕНИИ ФИЗИОЛОГИЧЕСК....doc
#
14.04.20153.42 Mб16ivanter2000_vved_v_kolich_biol.pdf
#
20.03.201631.25 Mб23IZBRANNYJ_RYaD_KhUDOZhESTVENNYKh_PROIZVEDENIJ.docx
#
23.09.2019159.57 Кб4I_B.docx
#
20.04.2019936.45 Кб11Java.doc

Основные информационные характеристики источника сообщений. Коды Шеннона—Фано.

Сжатие информации кодами Хаффмана.