14.1 Кодирование длин повторений

Кодирование длин участков (или повторений) может быть достаточно эффективным при сжатии двоичных данных, например, черно-белых факсимильных изображений, черно-белых изображений, содержащих множество прямых линий и однородных участков, схем и т.п. Кодирование длин повторений является одним из элементов известного алгоритма сжатия изображений JPEG.

Идея сжатия данных на основе кодирования длин повторений состоит в том, что вместо кодирования собственно данных подвергаются кодированию числа, соответствующие длинам участков, на которых данные сохраняют неизменное значение.

Предположим, что нужно закодировать черно-белое (двухцветное) изображение размером 8 х 8 элементов, приведенное на рис. 14.1

Рис. 14.1

Просканируем это изображение по строкам (двум цветам на изображении будут соответствовать 0 и 1), в результате получим двоичный вектор данных

X= (0111000011110000000100000001000000010000000111100011110111101111)

длиной 64 бита (исходный код составляет 1 бит на элемент изображения).

Выделим в векторе X участки, на которых данные сохраняют неизменное значение, и определим их длины. Результирующая последовательность длин участков - положительных целых чисел, соответствующих исходному вектору данных X, - будет иметь вид r = (1, 3, 4, 4, 7, 1, 7, 1, 7, 1, 7, 4, 3, 4, 1, 4, 1, 4).

Теперь эту последовательность, в которой заметна определенная повторяемость (единиц и четверок гораздо больше, чем других символов), можно закодировать каким-либо статистическим кодом, например, кодом Шеннона-Фано без памяти, имеющим таблицу кодирования (табл. 15.1)

Таблица 14.1

Кодер
Длина участка	Кодовое слово
4	0
1	10
7	110
3	111

Для того, чтобы указать, что кодируемая последовательность начинается с нуля, добавим в начале кодового слова префиксный символ 0. В результате получим кодовое слово B (r) = ( 0100011010110101101011001110100100 ) длиной в 34 бита, то есть результирующая скорость кода R составит 34/64, или немногим более 0,5 бита на элемент изображения. При сжатии изображений большего размера и содержащих множество повторяющихся элементов эффективность сжатия может оказаться существенно более высокой.

Существует еще один метод использования кодирования длин повторений, когда в цифровых данных встречаются участки с большим количеством нулевых значений. Всякий раз, когда в потоке данных встречается “ноль”, он кодируется двумя числами. Первое - 0, являющееся флагом начала кодирования длины потока нулей, и второе – количество нулей в очередной группе. Если среднее число нулей в группе больше двух, будет иметь место сжатие. С другой стороны, большое число отдельных нулей может привести даже к увеличению размера кодируемого файла:

Еще одним простым и широко используемым для сжатия изображений и звуковых сигналов методом кодирования без потерь является метод дифференциального кодирования.

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 2728 / 3428 29 30 31 32 33 34 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.02.2016684.03 Кб78конспект лекций по Антикризисному управлению.doc
#
10.02.20161.11 Mб21Конспект лекций по деньгам и кредиту.doc
#
21.11.20192.37 Mб23Конспект лекций по дискретной математике (полны...doc
#
18.08.2019440.32 Кб10Конспект лекций по курсу БЖД Зажиренко ЕИ.doc
#
10.02.2016753.14 Кб29Конспект лекций по праву.pdf
#
10.02.20167.57 Mб375Конспект лекций ТИК.doc
#
10.02.2016272.78 Кб19конспект лекций ч.1.pdf
#
10.02.2016265.22 Кб13КОНСПЕКТ на 18 часов.doc
#
10.02.2016872.96 Кб15КОНСПЕКТ по И-И деят-ти Захарченко О. В..doc
#
10.02.2016836.61 Кб22конспект по философии.doc
#
10.02.2016549.38 Кб156Конспект по экономической диагностике.doc