2.2. Оптимальные неравномерные двоичные коды

Описывается метод построения оптимальных однозначно декодируемых двоичных кодов (с минимальной средней длиной кодовых слов) для дискретных ансамблей {А,р(а)}.

В простом частном случае вероятности сообщений ансамбля могут быть целыми отрицательными степенями числа 2: p(a_i) = 2^-^di, i = 1 ,...,К. Доказано , что оптимальный двоичный однозначно декодируемый код в этом случае имеет среднюю длину кодовых словd(A) = Н(А). В таком коде сообщению а_i сопоставляется слово длины d_i= - logр(а_i).

Следующий метод построения такого кода известен как метод Шеннона-Фано:

Подразделить множество сообщений на два равновероятных подмножества, произвольным образом переименовать подмножества. Для всех сообщений из 1-го подмножества положить первый символ 0, для второго подмножества — 1.
Каждое из подмножеств рассматривать как некоторое новое множество сообщений. Выполнить наj-м шаге,j = 2,3,..., действия, указанные в п. 1, для определенияj-го символа кодовых слов. Считать, что действия над данным подмножеством закончены, если оно содержит одно сообщение.

Кодирование методом Шеннона-Фано ансамбля из 9 сообщений с вероятностями 0,25; 0,125; 0,0625; 0,0625; 0,0625; 0,0625; 0,125; 0,125; 0,125 показано в табл. 2, в которой сделаны четыре последовательных шага кодирования в соответствии с указанном выше алгоритмом.

На рис. 3 представлено соответствующее кодовое дерево.

В общем случае, когда сообщения имеют произвольные вероятности, рассматривается метод построения оптимального префиксного кода, называемый методом Хаффмена. Здесь предполагается, что сообщения в ансамбле упорядочены, так чтоp(a₁) ≥ р(а₂) ≥ ... ≥ р(а_к). В обосновании метода лежат три леммы.

В оптимальном коде слово, соответствующее наименее вероятному сообщению, имеет наибольшую длину.

Таблица 2.2

Сообщения	Вероятности	1-й шаг	2-й шаг	3-й шаг	4-й шаг	Кодовые слова
a₁	0,25	I	I			00
a₂	0,125		II	I		010
a₃	0,0625			II	I	0110
a₄	0,0625			II	II	0111
a₅	0,0625	II	I II	I	I	1000
a₆	0,0625			I	II	1001
a₇	0,125			II		101
a₈	0,125		II	I		110
a₉	0,125		II	II		111

2. В оптимальном двоичном префиксном коде два наименее вероятных сообщения кодируются словами одинаковой длины, одно из которых оканчивается нулем, а другое единицей.

Далее рассматривается новый ансамбль , состоящий из К - 1 сообщений с вероятностями

Любой префиксный код для ансамбля можно превратить в префиксный код для ансамбля А приписыванием к кодовому слову, кодирующему сообщение символов 0, 1 для получения слов, кодирующих сообщения Следующая лемма обосновывает последовательную процедуру кодирования.

Рис. 2.2

3. Если оптимален однозначно декодируемый префиксный код для ансамбля , то оптимален полученный из него префиксный код для ансамбля А.

Таким образом, задача построения оптимального кода сводится к задаче построения оптимального кода для ансамбля, содержащего на одно сообщение меньше. В этом ансамбле снова можно выделить два наименее вероятных сообщения и, объединяя их, получить новый ансамбль, содержащий теперь уже на два сообщения меньше, чем исходный. В итоге мы приходим к ансамблю, содержащему всего два слова, кодируемых символами 0 и 1.

Рассмотрим на примере ансамбля из 9 сообщений с вероятностями 0,2; 0,15; 0,15; 0,12; 0,1; 0,1; 0,08; 0,06; 0,04 кодирование методом Хаффмена. В табл. 3 показаны семь последовательных шагов, на каждом из которых происходит образование нового ансамбля с помощью склеивания наименее вероятных сообщений предыдущего ансамбля.

Таблица 2.3

Сообщения	Вероятности	1	2	3	4	5	6	7	8	Кодовое слово
a₁	0,20										10
a₂	0,15										001
a₃	0,15										010
a₄	0,12										011
a₅	0,10										110
a₆	0,10										111
a₇	0,08										0001
a₈	0,06 0,04										00000
a₉	0,06 0,04										00001

Рис. 2.3

Алгоритм кодирования отражает в таблице и кодовое дерево. На рис. 2.3 дается его более наглядное представление.

_{Средняя
длина кодового слова} . Однозначно декодируемого кода с меньшей длиной не существует. При оптимальном кодировании минимальная длина кодового слова неравномерного кода равна энтропии источника сообщений, в данном случае равной

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3110 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.04.202274.44 Кб5Учебник 37.docx
#
30.04.20221.91 Mб30Учебник 370.docx
#
30.04.20221.93 Mб41Учебник 371.docx
#
30.04.20222.02 Mб28Учебник 372.docx
#
30.04.20222.03 Mб9Учебник 373.docx
#
30.04.20222.1 Mб15Учебник 374.docx
#
30.04.20222.12 Mб17Учебник 375.docx
#
30.04.20222.21 Mб76Учебник 376.docx
#
30.04.20222.21 Mб13Учебник 377.docx
#
30.04.20222.23 Mб13Учебник 378.doc
#
30.04.20222.25 Mб7Учебник 379.docx