Алфавитное кодирование

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирский Государственный Университет Телекоммуникаций и Информатики

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Структуры и алгоритмы обработки данных.doc

Скачиваний:

411

Добавлен:

11.04.2015

Размер:

1.96 Mб

Скачать

☆

<<< < Предыдущая 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 4243 / 4743 44 45 46 47 > Следующая >>>

Алфавитное кодирование

Кодирование F может сопоставлять код всему сообщению из множества S как единому целому или строить код сообщения из кодов его частей. Элементарной частью сообщения является одна буква алфавита А={a₁,a₂,…,a_n}.

Пример 1 А={a₁,a₂,a₃} , B={0,1} a₁ 1001, a₂0, a₃010

сообщение a₂a₁a₂a₃  010010010

Пример 2 Азбука Морзе. Входной алфавит – английский. Наиболее часто встречающиеся буквы кодируются более короткими словами:

А  01, В  1000, С  1010, D  100, E  0, …

Побуквенное кодирование задается таблицей кодовых слов:σ = < α₁ β₁, … , α_n  β_n>, α_iA, β_iB^*.Множество кодовых слов V={β_i} называется множеством элементарных кодов. Побуквенное кодирование пригодно для любого множества сообщений S: F: A^* B^*, α_i₁…α_ik=α A^*, F(α)=β_i₁…β_ik.

Количество букв в слове α=α₁…α_k называется длиной слова |α| = k. Пустое слово обозначим Λ. Если α=α₁α₂, то α₁– начало (префикс) слова α, α₂– окончание (постфикс) слова α.

Побуквенный код называется разделимым (или однозначно декодируемым), если любое сообщение из символов алфавита источника, закодированное этим кодом, может быть однозначно декодировано, т.е. если β_i₁ …β_ik = β_j₁ …β_jt, то k=t и при любых s=1,…,k i_s=j_s, т.е. любое кодовое слово единственным образом разлагается на элементарные коды. Например, код из первого примера не является разделимым, поскольку кодовое слово 010010 может быть декодируемо двумя способами a₃a₃или a₂a₁a₂.

Побуквенный код называется префиксным, если в его множестве кодовых слов ни одно слово не является началом другого, т.е. элементарный код одной буквы не является префиксом элементарного кода другой буквы. Например, код из первого примера не является префиксным, поскольку элементарный код буквы a₂ является префиксом элементарного кода буквы a₃.

Утверждение. Префиксный код является разделимым.

Доказательство (от противного). Пусть префиксный код не является разделимым. Тогда существует такая кодовая последовательность β, что она представлена различными способами из элементарных кодов: β=β_i₁, …,β_ik = β_j₁, …,β_jt(побитовое представление одинаковое) и существует L такое, что при любом S<L следует (β_is= β_js) и (β_it≠ β_jt), т.е. начало каждого из этих представлений имеет одинаковую последовательность элементарных кодов. Уберем эту часть. Тогда β_iL…β_ik = β_jL, …,β_jt, т.е. последовательности элементарных кодов разные и существует β^/, что β_iL=β_jLβ^/ или β_jL=β_iLβ^/, т.е. β_i_L– начало β_jL, или наоборот. Получили противоречие с префиксностью кода.

Заметим, что разделимый код может быть не префиксным.

Пример. Разделимый, но не префиксный код: A={a,b}, B={0,1}, φ = {a0, b01}

Приведем основные теоремы побуквенного кодирования.

Теорема (Крафт). Для того, чтобы существовал побуквенный двоичный префиксный код с длинами кодовых слов L₁,…,L_n необходимо и достаточно, чтобы

Доказательство.Докажем необходимость. Пусть существует префиксный код с длинами L₁,…,L_n. Рассмотрим полное двоичное дерево. Каждая вершина закодирована последовательностью нулей и единиц (как показано на рисунке).

Рисунок 64 Полное двоичное дерево с помеченными вершинами

В этом дереве выделим вершины, соответствующие кодовым словам. Тогда любые два поддерева, соответствующие кодовым вершинам дерева, не пересекаются, т.к. код префиксный. У i-того поддерева на r-том уровне – 2^r^-^Liвершин. Всего вершин в поддереве 2^r. Тогда,,.

Докажем достаточность утверждения. Пусть существует набор длин кодовых слов такой, что . Рассмотрим полное двоичное дерево с помеченными вершинами. Пусть длины кодовых слов упорядочены по возрастаниюL₁≤ L₂≤ … ≤ L_n. Выберем в двоичном дереве вершину V₁ на L₁ уровне. Уберем поддерево с корнем в вершине V₁. В оставшемся дереве возьмем вершину V₂ на уровне L₂ и удалим поддерево с корнем в этой вершине и т.д. Последовательности,соответствующие вершинам V₁, V₂,…, V_n образуют префиксный код.

Пример. Построить префиксный код с длинами L₁=1, L₂=2, L₃=2 для алфавита A={a₁,a₂,a₃}. Проверим неравенство Крафта для набора длин . Неравенство выполняется и, следовательно, префиксный код с таким набором длин кодовых слов существует. Рассмотрим полное двоичное дерево с 2³помеченными вершинами и выберем вершины дерева, как описано выше. Тогда элементарные коды могут быть такими a₁ 0, a₂10, a₃11.

Рисунок 65 Построение префиксного кода с заданными длинами

Процесс декодирования выглядит следующим образом. Просматриваем полученное сообщение, двигаясь по дереву. Если попадем в кодовую вершину, то выдаем соответствующую букву и возвращаемся в корень дерева и т.д.

Теорема (МакМиллан). Для того, чтобы существовал побуквенный двоичный разделимый код с длинами кодовых слов L₁,…,L_n, необходимо и достаточно, чтобы .

Доказательство. Покажем достаточность. По теореме Крафта существует префиксный код с длинами L₁,…,L_n, и он является разделимым.

Докажем необходимость утверждения. Рассмотрим тождество

Положим . Тогда тождество можно переписать следующим образом

где ,– число всевозможных представлений числаj в виде суммы . Сопоставим каждому представлению числаj в виде суммы последовательность нулей и единиц длины j по следующему правилу

где b_s элементарный код длины s. Тогда различным представлениям числа j будут соответствовать различные кодовые слова, поскольку код является разделимым. Таким образом, и .Используя предельный переход получим при.

Пример. Азбука Морзе – это схема алфавитного кодирования

A01, B1000, C1010, D100, E0, F0010, G110, H0000, I00, J0111, K101, L0100, M11, N10, O111, P0110, Q1101, R010, S000, T1, U001, V0001, W011, X1001, Y1011, Z1100.

Неравенство МакМиллана для азбуки Морзе не выполнено, поскольку

Следовательно, этот код не является разделимым. На самом деле в азбуке Морзе имеются дополнительные элементы – паузы между буквами (и словами), которые позволяют декодировать сообщение. Эти дополнительные элементы определены неформально, поэтому прием и передача сообщений (особенно с высокой скоростью) является некоторым искусством, а не простой технической процедурой.

<<< < Предыдущая 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 4243 / 4743 44 45 46 47 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.04.2015751.69 Кб121СС СК.docx
#
11.04.2015100.09 Кб31Страхование_контрольная работа_в1_зачет.docx
#
11.04.201527.2 Кб28Страхование_экзамен_в2_отл.docx
#
11.04.201518.25 Mб558Структурировано по ДЕ (тесты с ответами).docx
#
11.04.201517.92 Mб162Структурировано по ДЕ.docx
#
11.04.20151.96 Mб411Структуры и алгоритмы обработки данных.doc
#
15.04.20191.34 Mб34схемотехника+ответы2007.doc
#
11.04.20152.98 Mб49Схемы электрические, мет указ и варианты.pdf
#
11.04.20153.67 Mб52Схемы электрические, мет указ и варианты.pdf
#
11.04.201555.07 Кб83СЭВИТ.docx
#
11.04.20152.23 Mб14тв дуб.docx