Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Вятский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Осн_постр_инф_сетей_лаб.doc

Скачиваний:

Добавлен:

02.06.2015

Размер:

1.88 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 / 2322 23 > Следующая >>>

Методические указания по выполнению лабораторной работы № 9

Целью эффективного кодирования является устранение избыточности сообщений, поскольку избыточные сообщения требуют большего времени для передачи и большего объема памяти для хранения.

Очевидно, что для уменьшения избыточности кодовых комбинаций, кодирующих символы сообщений, необходимо выбирать максимально короткие кодовые комбинации. Однако для полного устранения избыточности этого недостаточно. При кодировании необходимо учитывать вероятности появления каждого символа в сообщениях и наиболее вероятным символам сопоставлять короткие кодовые комбинации, а наименее вероятным - более длинные.

В качестве иллюстрации - простой пример. Пусть сообщение может состоять из двух слов. Длина первого - один кодовый символ, второго - три кодовых символа. Вероятности появления слов в сообщении соответственно 0,1 и 0,9. Тогда статистически средняя длина слова в сообщении 1*0,1 + 3*0,9 = 2,8 символа. Если слова будут иметь другие вероятности, например, 0,9 и 0,1, то средняя длина слова составит 1*0,9 + 3*0,1 = 1,2 символа. Отсюда видно, что длина кодовой комбинации должна выбираться в зависимости от вероятности появления кодируемого этой комбинацией символа сообщения. Чем чаще он появляется, т.е. чем больше его вероятность, тем более короткую кодовую комбинацию ему следует сопоставить.

Формализуем задачу эффективного кодирования. Пусть входным алфавитом кодирующего отображения является множество сообщений . Пусть выходным алфавитом кодирующего отображения будет множество В , число элементов которого равно m .Кодирующее отображение сопоставляет каждому сообщению а_i кодовую комбинацию, составленную из n_i символов алфавита В . Требуется оценить минимальную среднюю длину кодовой комбинации. Сравнивая ее со средней длиной кодовой комбинации, вычисленной для какого-либо конкретного кода, можно оценить, насколько данный конкретный код находится близко к эффективному, т.е. безизбыточному коду.

Энтропия сообщения А по определению

. (9.1)

Средняя длина кодовой комбинации

, (9.2)

где n_i - длина кодовой комбинации, сопоставленной сообщению а_i. Максимальная энтропия, которую может иметь сообщение из n_СР символов алфавита В, число элементов которого равно m, равна

. (9.3)

Очевидно, что для обеспечения передачи информации, содержащейся в сообщении А, с помощью кодовых комбинаций алфавита В должно выполняться неравенство

(9.4)

или с учетом (9.3) или с учетом (9.1)

. (9.5)

При строгом неравенстве (9.4) закодированное сообщение обладает избыточностью, т.е. для кодирования используется больше символов, чем это минимально необходимо. Для числовой оценки избыточности в предыдущей главе использовался коэффициент избыточности

. (9.6)

Поскольку из (9.3) и (9.4) следует, что , то ясно, что

. (9.7)

Тогда формулу (9.6) для коэффициента избыточности для кода можно переписать в следующем виде

. (9.8)

Под эффективным кодом понимается код, _К которого равен 0, т.е. для абсолютно эффективных кодов . Тогда и неравенство (9.5) переходит в равенство, откуда.

Предположив очевидное, что А не содержит элементов с p(a_i) = 0, получим

(9.9)

для всех i. Но отношение (9.9) не всегда дает целочисленный результат. Следовательно, не для любого набора А с заданным распределением вероятностей p(a_i) можно построить абсолютно эффективный код с _К = 0. Тем не менее, всегда можно обеспечить выполнение неравенства , умножая которое наp(a_i) и суммируя по i , получим

. (9.10)

Неравенство (9.10) может служить критерием для оценки эффективности какого-либо конкретного кода.

Для построения эффективных кодов используются различные алгоритмы. Одним из них является код Шеннона - Фано. Код Шеннона - Фано строится следующим образом. Символы алфавита источника выписываются в порядке убывания их вероятностей. Затем вся совокупность разделяется на две группы так, чтобы суммы вероятностей в каждой из групп были по возможности одинаковыми. Далее всем символам одной группы в качестве первого кодового символа приписывается 1, а другой группы - 0. Далее каждая из полученных групп в свою очередь разбивается на две подгруппы с одинаковыми суммарными вероятностями и т.д. Процесс повторяется до тех пор, пока в каждой группе останется по одному символу.

Пример 9.1. Закодировать двоичным кодом Шеннона - Фано ансамбль {a_i} (i=1,2,...,8), если вероятности p_i символов a_i имеют следующие значения

a_i	a₁	a₂	a₃	a₄	a₅	a₆	a₇	a₈
p_i	0,25	0,25	0,125	0,125	0,0625	0,0625	0,0625	0,0625

Найти среднее число символов в кодовой комбинации и коэффициент избыточности кода.

Решение.

a_i	p_i	кодовая комбинация	n_i	p_in_i	H(a_i)
a₁	0,25	11	2	0,5	0,5
a₂	0,25	10	2	0,5	0,5
a₃	0,125	011	3	0,375	0,375
a₄	0,125	010	3	0,375	0,375
a₅	0,0625	0011	4	0,25	0,25
a₆	0,0625	0010	4	0,25	0,25
a₇	0,0625	0001	4	0,25	0,25
a₈	0,0625	0000	4	0,25	0,25

По формуле (9.2) ,по формуле (9.1) ,тогда по формуле (9.7) и по формуле (9.8) ,таким образом, построен абсолютно эффективный код.

Алгоритм кодирования Шеннона - Фано имеет простую графическую иллюстрацию в виде графа, называемого кодовым деревом. Граф для кода Шеннона - Фано строится следующим образом. Из нижней или корневой вершины графа исходят два ребра, одно из которых помечается символом 0, а другое – 1. Эти два ребра соответствуют разбиению множества символов алфавита источника на две примерно равновероятные группы, одной из которых сопоставляется кодовый символ 0, а другой – 1. Ребра, исходящие из вершин следующего уровня, соответствуют разбиению получившихся групп на равновероятные подгруппы и т.д. Построение графа заканчивается, когда множество символов алфавита источника будет разбито на одноэлементные подмножества. Каждая концевая вершина графа, т.е. вершина, из которой уже не исходят ребра, соответствует некоторой кодовой комбинации. Чтобы сформировать эту комбинацию, надо пройти путь от корневой вершины до соответствующей концевой, выписывая в порядке следования по этому пути кодовые символы с ребер пути.

Рассмотренная методика Шеннона - Фано не всегда приводит к однозначному построению кода, поскольку в зависимости от вероятностей отдельных символов можно несколькими способами осуществить разбиение на группы.

Пример 9.2. Закодировать двоичным кодом Шеннона - Фано ансамбль {a_i} (i=1,2,...,8), если вероятности символов a_i имеют следующие значения

a_i	a₁	a₂	a₃	a₄	a₅	a₆	a₇	a₈
p_i	0,22	0,20	0,16	0,16	0,10	0,10	0,04	0,02

Найти коэффициент избыточности кода.

Решение.1

a_i	p_i	кодовая комбинация	n_i	p_in_i	H(a_i)
a₁	0,22	11	2	0,44	0,4806
a₂	0,20	101	3	0,6	0,4643
a₃	0,16	100	3	0,48	0,4230
a₄	0,16	01	2	0,32	0,4230
a₅	0,10	001	3	0,30	0,3322
a₆	0,10	0001	4	0,40	0,3322
a₇	0,04	00001	5	0,20	0,1857
a₈	0,02	00000	5	0,10	0,1129

По формуле (9.2)

по формуле (9.1)

тогда по формуле (9.7)

и по формуле (9.8)

Решение.2

a_i	p_i	кодовая комбинация	n_i	p_in_i	H(a_i)
a₁	0,22	11	2	0,44	0,4806
a₂	0,20	10	2	0,40	0,4643
a₃	0,16	011	3	0,48	0,4230
a₄	0,16	010	3	0,48	0,4230
a₅	0,10	001	3	0,30	0,3322
a₆	0,10	0001	4	0,40	0,3322
a₇	0,04	00001	5	0,20	0,1857
a₈	0,02	00000	5	0,10	0,1129

По формуле (9.2)

по формуле (9.1)

тогда по формуле (9.7)

и по формуле (9.8)

т.е. второй вариант решения ближе к оптимальному, поскольку обеспечивает меньший коэффициент избыточности.

От данной неоднозначности построения эффективного кода свободен код Хаффмена. Для двоичного кода методика Хаффмена сводится к следующему. Символы алфавита источника выписываются в основной столбец таблицы в порядке убывания вероятностей. Далее два последних символа объединяются в один вспомогательный с вероятностью, равной сумме вероятностей объединяемых символов. Вероятности символов, не участвовавших в объединении, и полученная суммарная вероятность снова располагаются в порядке убывания в дополнительном столбце таблицы, после чего два последних символа вновь объединяются. Процесс повторяется до тех пор, пока не буде получен единственный вспомогательный символ с вероятностью, равной 1. Для составления кодовых комбинаций, соответствующих символам, необходимо проследить пути переходов по строкам и столбцам таблицы.

Для наглядного представления этого процесса удобнее всего построить граф, называемый кодовым деревом. Процедура построения кодового дерева выглядит следующим образом. Из вершины, соответствующей последнему единственному вспомогательному символу с вероятностью, равной 1, направляются две ветви, причем ветви с большей вероятностью присваивается кодовый символ 1, а с меньшей - 0. Такое последовательное ветвление из вершин, соответствующих вспомогательным символам, продолжается до получения вершин, соответствующих основным исходным символам.

Пример 9.3. Закодировать двоичным кодом Хаффмена ансамбль из примера 9.2. Решение представлено на рис. 9.1.

Рис. 9.1. Алгоритм Хаффмена

Кодовое дерево для этого примера изображено на рис. 9.2

Рис. 9.2. Кодовое дерево

Составленная в соответствии с кодовым деревом таблица кодовых комбинаций представлена ниже.

a_i	кодовая комбинация	n_i
a₁	01	2
a₂	00	2
a₃	111	3
a₄	110	3
a₅	100	3
a₆	1011	4
a₇	10101	5
a₈	10100	5

Таким образом, получены те же параметры в смысле избыточности, что и в примере 9.2, решение 2 для кода Шеннона - Фано, хотя кодовые комбинации по составу другие.

Из рассмотрения методов построения эффективных кодов следует, что эффект уменьшения избыточности достигается за счет различия в числе разрядов в кодовых комбинациях, т.е. эти эффективные коды являются неравномерными, а это приводит к дополнительным трудностям при декодировании. Как вариант, можно для различения кодовых комбинаций ставить специальный разделительный символ, но при этом снижается эффект, т.к. средняя длина кодовой комбинации увеличивается на один разряд.

Более целесообразно обеспечить однозначное декодирование без введения дополнительных разрядов. Для этого эффективный код необходимо строить так, чтобы ни одна комбинация кода не совпадала с началом другой более длинной кодовой комбинации. Коды, удовлетворяющие этому условию, называются префиксными.

Наличие или отсутствие свойства префиксности отражается и на кодовом дереве. Если свойство префиксности отсутствует, то некоторые промежуточные вершины кодового дерева могут соответствовать кодовым комбинациям.

Префиксные коды иногда называют мгновенно декодируемыми, поскольку конец кодовой комбинации опознается сразу, как только мы достигаем конечного символа кодовой комбинации при чтении кодовой последовательности. В этом состоит преимущество префиксных кодов перед другими однозначно декодируемыми неравномерными кодами, для которых конец каждой кодовой комбинации может быть найден лишь после анализа одной или нескольких последующих комбинаций, а иногда и всей последовательности. Это приводит к тому, что декодирование осуществляется с запаздыванием по отношению к приему последовательности.

Очевидно, что практическое применение могут иметь только префиксные коды. Коды Шеннона - Фано и Хаффмена являются префиксными.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 / 2322 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.09.20193.64 Mб18ОРиентир сроки ВН 2000г.rtf
#
07.11.2018973.31 Кб19Ориентирование и топография.doc
#
02.06.20151.11 Mб15ОРООтчет.doc
#
18.11.2019103.94 Кб8ОРсК_ПЗ_ 2.5_280705_21 курс.doc
#
02.06.2015150.02 Кб105Осн зак изм. №9.doc
#
02.06.20151.88 Mб21Осн_постр_инф_сетей_лаб.doc
#
26.03.201610.94 Mб755ОсНИтекст 16 консп лекц недораб МЕТОДОЛОГИЯ.doc
#
19.11.2019731.65 Кб11Основная часть.doc
#
20.11.2019687.62 Кб8Основная часть.doc
#
02.06.20151.4 Mб218основная часть.docx
#
23.08.2019811.01 Кб6Основные свойства элементов и их соединений.doc