Добавил:

korayakov Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

Основы сжатия информации

Файл:

Лекции / ЛЕКЦИЯ 17 WAVELET ПРЕОБРАЗОВАНИЕ ВИДЕОИНФОРМАЦИ1.doc

Скачиваний:

Добавлен:

16.04.2013

Размер:

186.37 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

Арифметическое сжатие

В материалах лекции 7 дана краткая характеристика алгоритма арифметического кодирования и, как недостаток, указывалось на сложность и объем вычислений, связанных с не целыми числами. В настоящее время данный алгоритм находит все более широкое применение, поскольку закончился срок патентных ограничений и его эффективность выше эффективности алгоритма Хаффмана на 10% в среднем.

Арифметическое сжатие – достаточно эффективный метод, в основе которого лежит идея представления кодируемого текста (последовательности) в виде дроби таким образом, чтобы текст был представлен как можно компактнее. Для примера рассмотрим построение такой дроби на интервале [0, 1], причем 0 – включая в интервал, а 1 – исключая. Разобьем интервал на подинтервалы с длинами, соответствующими вероятностям появления символов в тексте. Рассмотрим, как сжимается текст в соответствии с процедурами данного алгоритма, выбрав случайный отрывок текста: “ВОН ВОРОНА”. Распишем вероятности появления каждого символа в тексте в порядке убывания и соответствующие символам поддиапазоны в виде таблицы.

Символ	Частота	Вероятность	Диапазон
О	3	0,3	(0,0; 0,3)
B	2	0.2	(0,3; 0,5)
H	2	0,2	(0,5; 0,7)
Р	1	0,1	(0,7; 0,8)
А	1	0,1	(0,8; 0,9)
“ “	1	0,1	(0,9; 1,0)

Для простоты обсуждения считаем, что эта таблица известна в кодере и декодере. Квантование заключается в уменьшении рабочего интервала. Для первого символа в качестве рабочего интервала берется (0, 1). Разобьем его на диапазоны в соответствии с частотами символов в таблице. В качестве следующего рабочего интервала берется диапазон, соответствующий текущему кодируемому символу. Его длина пропорциональна вероятности появления символа в потоке данных. Считываем следующий символ. В качестве исходного берем рабочий интервал, полученный на предыдущем шаге, и опять разбиваем его в соответствии с таблицей диапазонов. Длина рабочего интервала уменьшается пропорционально вероятности текущего символа, а точка начала сдвигается вправо пропорционально началу диапазона этого символа. Новый построенный диапазон берется в качестве рабочего и т. д. Графически процесс кодирования представлен на рис. 6.

h₀

l₁

h₁

l₂

h₂

Рис. 6 Графическое представление процедур арифметического кодирования

l₀

спользуя исходную таблицу диапазонов, кодируем текст.

Исходный рабочий интервал (0, 1)

Символ “В ” (0,3; 0,5) получаем (0,3000; 0,5000).

Символ “О” (0,0; 0,3) получаем (0,3000; 0,3600).

Символ “Н” (0,5; 0,7) получаем (0,3300; 0,3420)

Символ “ “ (0,9; 1,0) получаем (0,3408; 0,3420).

Таким образом, окончательная длина интервала равна произведению вероятностей всех встретившихся символов, а его начало зависит от порядка следования символов в потоке. Если обозначить диапазон символа с как [a[c]; b[c]), а интервал для i –го кодируемого символа потока как [l_i, h_i), то алгоритм сжатия может быть записан следующим образом

while L₀=0; h₀=1; i=0;

(not DataFile.EOF( ) {

c=DataFile.ReadSymbol( ); i++;

l_i=l_i-1 + a[c].(h_i-1 - l_i-1);

h_i = l_i_-1 + b[c].(h_i_-1 –l_i_-1);};

Большой вертикальной чертой на рисунке обозначено произвольное число, лежащее в полученном при работе интервале [l_i , h_i). Для последовательности “ВОH”, состоящей из четырех символов, за такое число можно взять 0,341. Этого числа достаточно для восстановления исходной цепочки, если известна исходная таблица диапазонов и длина цепочки.

Рассмотрим работу алгоритма восстановления цепочки. Каждый следующий интервал вложен в предыдущий. Это означает, что если есть число 0,341, то первым символом в цепочке может быть только “B”, поскольку только его диапазон включает это число. В качестве интервала берется диапазон “В” – [0,3;0,5) и в нем находится диапазон [a[c]; b[c]), включающий 0,341. Перебором всех возможных символов по приведенной выше таблице находим, что только интервал [0,3; 0,36), соответствующий диапазону для “O”, включает число 0,341. Этот интервал выбирается в качестве следующего рабочего и т. д. Алгоритм декомпрессии можно записать так:

l₀ = 0; h₀ = l; value=Fiele. Code( );

for(i=1; i=Fiele.DataLength ( ); i++) {

for (для всех с_j) {

l_i = l_i-1 + a [c_j].(h_i-1 – l_i-1);

h_i = l_i
-1+ b[с_j].(h_i
-1 - l_i
-1 );

if (( l_i =value) & & (value h_i )) break;

};

DataFile.WriteSimbol (c_j);

};

Здесь value – прочитанное из потока число (дробь), а с – записываемые в выходной поток распаковываемые символы. При алфавита из 256 символов c_jвнутренний цикл выполняется достаточно долго, однако его можно ускорить. Поскольку b[c_j_+1] = a[c_j](cм. приведенную выше таблицу диапазонов) то l_i для c_j₊₁ равно h_Iдля c_j, а последовательность h _iдля с_j строго возрастает с ростом j. То есть количество операций во внутреннем цикле можно сократить вдвое, поскольку достаточно проверять только одну границу интервала. Если в последовательности мало символов, то, отсортировав их в порядке уменьшения вероятностей, можно сократить число итерацийцикла и таким образом ускоряем работу декомпрессора. Первыми будут проверяться символы с наибольшей вероятностью, (в нашем примере с вероятностью 1/2 выход из цикла произойдет уже на втором символе из шести).

Если число символов велико, существуют другие методы ускорения поиска символов.

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

Соседние файлы в папке Лекции

#
16.04.2013199.17 Кб34Лекция 11 Принципы построения цифрового ТВ
#
16.04.2013203.78 Кб45ЛЕКЦИЯ 11.doc Уменьшение избыточности видеосигнала.doc
#
16.04.2013264.19 Кб41Лекция 15 Стандарт MPEG -2
#
16.04.2013221.7 Кб57ЛЕКЦИЯ 15.doc
#
16.04.2013223.74 Кб41Лекция 16 Стандарт MPEG -4
#
16.04.2013186.37 Кб67ЛЕКЦИЯ 17 WAVELET ПРЕОБРАЗОВАНИЕ ВИДЕОИНФОРМАЦИ1.doc
#
16.04.2013106.5 Кб124ЛЕКЦИЯ 2.doc Взаимная информация.doc
#
16.04.2013204.8 Кб54ЛЕКЦИЯ 3.doc Дискретный источник..doc
#
16.04.2013181.25 Кб57ЛЕКЦИЯ 4.doc
#
16.04.2013207.36 Кб71ЛЕКЦИЯ 5.doc
#
16.04.2013177.15 Кб52ЛЕКЦИЯ 6Х.doc