Билет №9

1. Основные понятия теории кодирования. Оптимальный код Шеннона-Фано.

Код — правило (алгоритме сопоставления каждом) конкретному сообщению строго

определенной комбинации символов (или сигналов). Кодом также называется отдельная комбинация таких символов. Для различия этих терминов, код в последнем значении еще называется кодовым словом.

Кодирование. Процесс преобразования сообщения в комбинацию символов в соответствии с кодом называется кодированием. Процесс восстановления сообщения из комбинации символов называется декодированием.

Операции кодирования и декодирования называются обратимыми, если их последовательное применение обеспечивает возврат к исходной информации без каких-либо потерь.

Алфавиты. Множество символов, при помощи которых записываются исходные сообщения называется первичным алфавитом, количество его элементов обозначается mI.

Множество символов, из которых могут состоять кодовые слова, называется

вторичным алфавитом, количество элементов этого множества обозначается m2.

Префиксное свойство. Префиксным называется код. не имеющий комбинации, которая была бы префиксом (начальной частью произвольной длины) любой другой комбинации того же кода.

Примером обратимого кодирования является представление знаков в телеграфном коде и их восстановление после передачи. Примером кодирования необратимого может служить перевод с одного естественного языка на другой - обратный перевод, вообще говоря, не восстанавливает исходного текста.

Шеннон ввел понятие избыточности - мера бесполезно совершаемых альтернативных выборов при чтении текста. Оптимальные способы кодирования уменьшают длину сообщения при передаче по каналу связи. Под термином «оптим. код» будем подразумевать коды с практически нулевой избыточностью. Кроме того, являясь оптим-м с т.зр. скорости передачи информации, код может быть не оптимальным с т.зр. предъявляемых к нему требований помехоустойчивости.

Главная идея кодирования Шеннона-Фано(ШФ)-заменить часто встречающиеся символы более короткими кодами, а редко встречающиеся- более длинными. Алгоритм основывается на кодах переменной длины. Для того, чтобы декомпрессор смог раскодировать сжатую последовательность, коды ШФ должны обладать уникальностью (каждый код уникально определяет один закодированный символ и не является префиксом любого другого кода).Рассмотрим алгоритм вычисления кодов ШФ. Например, последовательность aabbbccccddddd.Для вычисления кодов необходимо создать таблицу уникальных символов сообщения c(i) и их вероятностей p(c(i)), и отсортировать ее в порядке возрастания вероятности символов. C(i) p(c(i)) d 5/17, c 4/17, spase 3/17, b 3/17, a 2/17.

Далее таблица символов делится на две группы т.о., чтобы каждая из групп имела приблизительно одинаковую частоту по сумме символов. Первой группе устанавливается начало кода в «0», второй – в «1». Для вычисления следующих бит символов, данная процедура повторяется рекурсивно для каждой группы, в которой больше одного символа. Получаем: символ код d 00, c 01, spase 10, b 110, a 111.

Длина кода s(i) в полученной таблице равна int(-lg p(c(i))), если символы удалось разделить на группы с одинаковой частотой, в противном случае, длина кода равна int(-lg p(c(i)))+1. То есть int(-lg p(c(i)))<=s(i)<= int(-lg p(c(i)))+1.

Используя полученную таблицу кодов, кодируем входной поток-заменяя каждый символ соответствующим кодом. Естественно для рассжатия полученной последовательности, данную таблицу необходимо сохранять вместе сжатым потоком, что является одним из недостатков данного метода. В сжатом виде таблица: 111111101101101101001010101100000000000 длиной 39 бит. Оригинал 139 бит. Коэффициент сжатия -28%.

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 5214 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.09.2019459.26 Кб5БИЛЕТ19.doc
#
08.09.2019104.24 Кб7БИЛЕТ24.docx
#
08.09.2019258.05 Кб2БИЛЕТ28.doc
#
08.09.2019466.43 Кб5БИЛЕТ29.doc
#
01.05.20191.69 Mб1билеты к госу 1-51.doc
#
08.09.20191.9 Mб5БИЛЕТЫ кроме 36.doc
#
21.12.201866.96 Кб6билеты Лейсан.docx
#
18.03.2015150.02 Кб9билеты на экзамен(1).doc
#
16.09.2019196.49 Кб51Билеты о истории.docx
#
21.09.2019117.26 Кб4Билеты по истории с 1 по 10.rtf
#
21.09.2019140.62 Кб1Билеты по истории с 11 по 24.rtf