Почти оптимальное кодирование

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирский Государственный Университет Телекоммуникаций и Информатики

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Курапова, Мачикина. Методы кодирования данных.doc

Скачиваний:

251

Добавлен:

11.04.2015

Размер:

898.56 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 207 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Почти оптимальное кодирование

Рассмотрим несколько классических побуквенных кодов, у которых средняя длина кодового слова близка к оптимальной. Пусть имеется дискретный вероятностный источник, порождающий символы алфавита А={a₁,…,a_n} с вероятностями p_i= P(a_i).

Код Шеннона

Код Шеннона позволяет построить почти оптимальный код с длинами кодовых слов . Тогда по теореме Шеннона из п. 5.1

Код Шеннона, удовлетворяющий этому соотношению, строится следующим образом:

Упорядочим символы исходного алфавита А={a₁,a₂,…,a_n} по убыванию их вероятностей: p₁≥p₂≥p₃≥…≥p_n.
Вычислим величины Q_i:, которые называются кумулятивные вероятности

Q₀=0, Q₁=p₁, Q₂=p₁+p₂, Q₃=p₁+p₂+p₃, … , Q_n=1.

Представим Q_i в двоичной системе счисления и возьмем в качестве кодового слова первые знаков после запятой .

Для вероятностей, представленных в виде десятичных дробей, удобно определить длину кодового слова L_i из соотношения

, .

Пример. Пусть дан алфавит A={a₁, a₂, a₃, a₄, a₅, a₆} с вероятностями p₁=0.36, p₂=0.18, p₃=0.18, p₄=0.12, p₅=0.09, p₆=0.07. Построенный код приведен в таблице 6.

Таблица 6 Код Шеннона

a_i

P_i

Q_i

L_i

кодовое слово

a₁

a₂

a₃

a₄

a₅

a₆

1/2²≤0.36<1/2

1/2³≤0.18<1/2²

1/2⁴≤0.12<1/2³

1/2⁴≤0.09<1/2³

1/2⁴≤0.07<1/2³

0.36

0.54

0.72

0.84

0.93

010

100

1011

1101

1110

Построенный код является префиксным. Вычислим среднюю длину кодового слова и сравним ее с энтропией. Значение энтропии вычислено при построении кода Хаффмана в п. 5.2 (H = 2.37), сравним его со значением средней длины кодового слова кода Шеннона

L_ср= 0.36^.2+(0.18+0.18)^.3+(0.12+0.09+0.07)^.4=2.92< 2.37+1,

что полностью соответствует утверждению теоремы Шеннона.

Алгоритм на псевдокоде

Построение кода Шеннона

Обозначим

n – количество символов исходного алфавита

P – массив вероятностей, упорядоченных по убыванию

Q– массив для величин Q_i

L – массив длин кодовых слов

C – матрица элементарных кодов

P [0]:=0, Q [0]:=0

DO (i=1,…,n)

Q [i]:= Q [i-1]+P [i]

L [i]:= - log₂P[i] (длину кодового слова определять

OD из соотношения, указанного выше)

DO (i=1,…,n)

DO (j=1,…,L[i])

Q [i-1]:=Q [i-1]_*2 (формирование кодового слова

C [i,j]:= Q [i-1] в двоичном виде)

IF (Q [i-1]>1) Q [i-1]:=Q [i-1] - 1 FI

Код Фано

Метод Фано построения префиксного почти оптимального кода, для которого , заключается в следующем. Упорядоченный по убыванию вероятностей список букв алфавита источника делится на две части так, чтобы суммы вероятностей букв, входящих в эти части, как можно меньше отличались друг от друга. Буквам первой части приписывается 0, а буквам из второй части – 1. Далее также поступают с каждой из полученных частей. Процесс продолжается до тех пор, пока весь список не разобьется на части, содержащие по одной букве.

Пример. Пусть дан алфавит A={a₁, a₂, a₃, a₄, a₅, a₆} с вероятностями p₁=0.36, p₂=0.18, p₃=0.18, p₄=0.12, p₅=0.09, p₆=0.07. Построенный код приведен в таблице 7 и на рисунке 6.

Таблица 7 Код Фано

a_i	P_i	кодовое слово				L_i
a₁	0.36	0	0			2
a₂	0.18	0	1			2
a₃	0.18	1	0			2
a₄	0.12	1	1	0		3
a₅	0.09	1	1	1	0	3
a₆	0.07	1	1	1	1	4

Рисунок 6 Кодовое дерево для кода Фано

Полученный код является префиксным и почти оптимальным со средней длиной кодового слова

L_ср=0.36^.2+0.18^.2+0.18^.2+0.12^.3+0.09^.4+0.07^.4=2.44

<<< < Предыдущая 1 2 3 4 5 67 / 207 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.11.2019177.66 Кб3Культура киевской руси.doc
#
11.04.2015803.67 Кб48Культура эпохи просвещения.docx
#
11.04.2015196.1 Кб9Культура.doc
#
21.11.2019163.33 Кб8Культурология.doc
#
11.04.201573.8 Кб11Культурология.docx
#
11.04.2015898.56 Кб251Курапова, Мачикина. Методы кодирования данных.doc
#
09.07.2019209.92 Кб2Куросовая по графике для почты.doc
#
06.12.2018756.22 Кб16Курс лекций Микропроцессоры.doc
#
11.04.20151.33 Mб26Курс раб ОУ.doc
#
11.09.2019172.03 Кб0курсач по макро.doc
#
15.03.2016525.46 Кб70курсач по сс и ск - норм версия.docx