Арифметическое кодирование

Принципиальное отличие арифметического кодирования от рассмотренных ранее методов в его непрерывности, т.е. в ненужности блокирования.

Код здесь строится не для отдельных значений д.с.в. или их групп фиксированного размера, а для всего предшествующего сообщения в целом.

Эффективность арифметического кодирования растет с ростом длины сжимаемого сообщения (для кодирования Хаффмена или Шеннона-Фэно этого не происходит).

Хотя арифметическое кодирование дает обычно лучшее сжатие, чем кодирование Хаффмена, оно пока используется на практике сравнительно редко, т.к. оно появилось гораздо позже (разработанно в 70-х годах XX века) и требует больших вычислительных ресурсов.

При сжатии заданных данных, например, из файла все рассмотренные методы требуют двух проходов. Первый для сбора частот символов, используемых как приближенные значения вероятностей символов, и второй для собственно сжатия.

Используя метод арифметического кодирования можно достичь почти оптимального представления для заданного набора символов и их вероятностей.

Алгоритм кодирования заключается:

в построении отрезка, однозначно определяющего данную последовательность значений д.с.в.;
затем для построенного отрезка находится число, принадлежащее его внутренней части и равное целому числу, деленному на минимально возможную положительную целую степень двойки;
это число и будет кодом для рассматриваемой последовательности.

Пример 1: Имеется алфавит состоящий из трех символов – А, В, С и их вероятностей -р_А=1/5, р_В=1/5, р_С=3/5. Нам необходимо зашифровать сообщение «ВАС»

0 шаг: Упорядочиваем алфавит в порядке убывания вероятностей символов, т.к. символу с большей вероятностью нужен более короткий код. (ЭТОТ ШАГ для удобства)

С	А	В
3/5	1/5	1/5

1 шаг: Располагаем на интервале [0,1] граничные точки отрезков пропорциональные вероятностям соответствующих символов алфавита.

2 шаг: Первый символ в кодируемом сообщении это символ «В», поэтому располагаем на интервале [4/5,1] граничные точки отрезков пропорциональные вероятностям соответствующих символов алфавита.

Пересчитываем значения граничных точек символов алфавита на новом интервале [4/5,1].

Правая граница символа «С» 4/5+(3/5*1/5)=23/25

а теперь словами озвучим эту формулу – к началу нового интервала (4/5) прибавляем длину пропорционального отрезка «С» (это длина С на предыдущем шаге умноженная на его масштаб).

Левая граница символа «А» 4/5+(3/5*1/5)=23/25,

а теперь словами озвучим эту формулу – к началу нового интервала (4/5) прибавляем длину пропорционального отрезка «А» (это место точки А на предыдущем шаге умноженное на его размер = вероятность).

Левой граница символа «В»= правой границе символа «А» = 23/25+(1/5*1/5)=24/25.

т.е. к началу нового интервала (23/25) прибавляем длину пропорционального отрезка «В» (это длина В на предыдущем шаге умноженная на его масштаб, вер-ть),

либо это = 4/5+(4/5*1/5)=24/25

к началу (4/5) прибавляем длину пропорционального отрезка до «В» (это место точки В на предыдущем шаге умноженное на его размер = вероятность).

1 / 51 2 3 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.03.2015987.14 Кб712MakroekonomikaPanferova_-_testy.doc
#
25.03.2015993.28 Кб1162Makroekonomika_-_testy.doc
#
26.09.20191.31 Mб192_domashki.doc
#
25.03.2015583.07 Кб462_FILE ORGANISATION.pdf
#
25.03.2015829.06 Кб422ФЕД.pdf
#
30.07.2019486.91 Кб13 practika.doc
#
09.03.2016181.76 Кб503 Законы стехиометрии.doc
#
12.11.2018223.23 Кб113.Тема 3s(2008)Рынок и его механизм.doc
#
18.08.20191.45 Mб73.Энергетика Земли.docx
#
25.03.20151.25 Mб9304.pdf
#
17.04.20192.78 Mб1031-121.doc