Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Томский Государственный Университет Систем Управления и Радиоэлектроники

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Статистические модели для информационных систем, квантовых и оптоэлектронных приборов..pdf

Скачиваний:

Добавлен:

05.02.2023

Размер:

629.36 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 1614 15 16 > Следующая >>>

d di pi

i 1

(3.26)

где di - число кодовых символов i -ого сообщения; pi - вероятность i - того сообщения.

В общем случае неравномерный код используется для кодирования отрезков сообщений длины n . Тогда величина

R dn log m n

(3.27)

Где dn - средняя длина кодовой комбинации для n сообщений источника, является средней скоростью неравномерного кодирования m -ичным кодом при разбиении последовательности сообщений на блоки длиной n .

3.2.2. Оптимальные неравномерные двоичные коды

Оптимальным двоичным кодом называется код, при котором средняя длина кодового слова минимальна.

Справедливо следующее утверждение (теорема Шеннона)

d H ( A)

Где H ( A) - энтропия исходного алфавита. Доказано, что знак равенства достигается при pi 2 i ,i 1,2..

(3.28)

где i – целые положительные числа.

Данная теорема Шеннона определяет минимальную среднюю длину кодового слова, но не указывает метода построения оптимальных кодов.

Известны два метода оптимального кодирования: Шеннона - Фано и Хаффмана. Причем при условии (3.28)

d H ( A)

Метод Шеннона – Фано заключается в следующем:

1)Множество сообщений разбивается на два равномерных подмножества. Для всех сообщений из первого подмножества положить первый кодовый символ 0, для второго подмножества – 1.

2)Каждое из подмножеств рассматривается как некоторое новое множество сообщений, которое снова разбивается на два примерно равномерных подмножества. Данным подмножеством такие присваивается кодовые символы 0 и 1.

3)Такое разбиение каждого из подмножеств заканчивается в том случае, если в них остается по одной букве алфавита.

4)Каждая буква алфавита соответствует кодовому слову, образованное из кодовых символов последовательно записанных для каждого из подмножеств, в которые входила данная буква.

Приведем пример построения кода Шеннона – Фано для алфавита заданного таблицей 3.1

							таблица 3.1
Буква алфа-	a1	a2	a3	a4	a5	a6	a7	a8
вита
вероятность	0,1	0,05	0,3	0,15	0,06	0,12	0,12	0,1

Образуем два подмножества согласно п.1 и п.2

(a1a3 a8 ) 0 ;

(a2 a4 a5 a6 a7 ) 1; Затем согласно п.3

(a1a8 ) 0 ;	(a1 ) 0 ;
(a3 ) 1;	(a8 ) 1;

(a6 a7 ) 0 ;

(a6 ) 0 ;

	(a7 ) 1;
(a2 a4 a5 ) 1;	(a4 ) 0 ;
	(a2 a5 ) 1; (a2 ) 0 .

(a5 ) 1.

Тогда согласно п.4 получим кодовые слова для каждой буквы алфавита (таблица 3.2)

Таблица 3.2

Буква	a1	a2	a3	a4	a5	a6	a7	a8
алфавита
Кодовое	000	1110	01	110	1111	100	101	001
слово

Для данного процесса энтропия

H pi log2 pi ,

i 1

А средняя длина кодового слова

d di pi 0,1 3 0,05 4 0,3 2 0,15 3 0,06 4 0,12 3 0,12 3 0,1 3 2,81

i 1

Сравнение значение величины H и d для рассматриваемого примера показывает, что данный код близок оптимальному. Отметим, что полученный код удовлетворяет условию префиксности.

Более наглядно данный код можно представить кодовым деревом (рис.

3.1)

Другой метод получения оптимального префиксного кода носит называние «метода Хаффмана». Здесь предполагается, что буквы алфавита упорядочены так, что

p(a1 ) p(a2 ) ...p(an ) .

В основании метода лежит три леммы.

1.В оптимальном коде слово, соответствующее наименее вероятному сообщению (букве), имеет наибольшую длину.

2.В оптимальном двоичном префиксном коде два наименее вероятных сообщения кодируются словами одинаковой длины, один из которых заканчивается нулем, а другой единицей.

3.Если оптимален однозначно декодированный префиксный код для алфавита 1, то оптимален полученный из него префиксный код для алфавита 1. под алфавитом 1 понимается алфавит, полученный из 1 путем объединения двух наименее вероятных букв в одну с вероятностью появления новой буквы равной сумме вероятностей этих наименее вероятных букв.

Иными слова, задача построения оптимального кода методом Хаффмена сводится к задаче построения оптимального кода для алфавита, содержащего на одно сообщение меньше. В этом алфавите снова можно две наименее вероятные буквы и, объединяя их, можно получить новый алфавит, содержащий теперь уже не два сообщения меньше, чем исходный. В итоге мы приходим к алфавиту, содержащему всего два слова, кодируемые символами 0 и 1.

Рассмотрим пример. Исходный алфавит представлен в таблице Таблица 3.2

Буква

a10

алфавита

p(ai )

0,15

0,05

0,07

0,1

0,09

0,12

0,04

0,15

0,1

0,13

Объединением буквы a7

и a2

в одну букву в1 с вероятностью появле-

ния 0,09. получаем новый алфавит:

Таблица 3.3

Буква ал-

a10

в1

фавита

0,15

0,07

0,1

0,09

0,12

0,15

0,1

0,13

0,09

В этом алфавите снова объединяем две наименее вероятные буквы a3 и в одну букву в2 с вероятностью 0,16 и получаем алфавит:

a1 , a4 , a6 , a8 , a9 , a10 , в1 , в2 с указанными вероятностями появления букв.

Данная процедура продолжается до тех пор, пока не останется две буквы. Эта процедура может быть представлена следующей логической последовательностью:

a1 (0,15) , a2 (0,05) , a3 (0,07) , a4 (0,1)					a5 (0,09) ,		a6 (0,12) ,	a7 (0,04) ,
a8 (0,15) ,	a9 (0,1) ,	a10 (0,13) a1 (0,15) ,			a3 (0,07) ,		a4 (0,1)	a5 (0,09)	,
a6 (0,12) ,	a8 (0,15) ,	a9 (0,1) , a10 (0,13),в1 (0,09) a1 (0,15) ,						a4 (0,1)	,
a6 (0,12) ,	a8 (0,15) ,		a9 (0,1) ,	a10 (0,13),в1 (0,09),в2 (0,16)				a1 (0,15) ,
a6 (0,12) ,	a8 (0,15) ,		a9 (0,1) ,	a10 (0,13),в1		(0,09),в2 (0,16),в3 (0,19)
a1 (0,15) ,	a8 (0,15) ,		a10 (0,13),в1 (0,09),в2			(0,16),в3 (0,19),в4 (0,22)
a1 (0,15) ,

в1 (0,09),в2 (0,16),в3 (0,19),в4 (0,22),в5 (0,28) в3 (0,19),в4 (0,22),в5 (0,28),в6 (0,31)

в5 (0,28),в6 (0,31),в7 (0,41) в7 (0,41),в8 (0,59).

Построим кодовое дерево (рис.3.2)

В таблице 3.4 приведена соответствующая кодовому дереву коды букв исходного алфавита

Таблица 3.4

Буква	a1	a2	a3	a4	a5	a6	a7	a8	a9	a10
алфавита
Кодовое	110	0011	1110	000	1111	010	0010	100	011	101
слово

Средняя длина кодового слова

d 3 0.15 4 0.05 4 0.07 3 0.1 4 0.09 3 0.12 4 0.04 3 0.15 3 0.13 0.13 3.25

Энтропия источника сообщений

10
H pi (ai )log2	pi (ai ) .
i 1

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 1614 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
05.02.2023374.45 Кб4Статистические методы в управлении качеством.-2.pdf
#
05.02.2023239.46 Кб3Статистические методы в управлении качеством.-3.pdf
#
05.02.2023135.55 Кб4Статистические методы в управлении качеством..pdf
#
05.02.20236.9 Mб16Статистические методы обработки сигналов в радиотехнических системах..pdf
#
05.02.2023707.29 Кб10Статистические методы обработки..pdf
#
05.02.2023629.36 Кб4Статистические модели для информационных систем, квантовых и оптоэлектронных приборов..pdf
#
05.02.2023239.02 Кб4Статистические модели для систем передачи и обработки информации.-1.pdf
#
05.02.2023312.5 Кб4Статистические модели для систем передачи и обработки информации..pdf
#
05.02.2023299.57 Кб2Статистические модели квантовых, оптоэлектронных и акустооптических приборов.-1.pdf
#
05.02.2023478.17 Кб3Статистические модели квантовых, оптоэлектронных и акустооптических приборов..pdf
#
05.02.2023498.74 Кб1Стилистика деловой речи.-1.pdf