Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория информации - курс лекций.doc
Скачиваний:
432
Добавлен:
13.03.2015
Размер:
4.65 Mб
Скачать

3. Алфавитное кодирование с неравной длительностью элементарных сигналов. Код Морзе

В качестве примера использования данного варианта кодирования рассмотрим телеграфный код Морзе («азбука Морзе»). В нем каждой букве или цифре сопоставляется некоторая последовательность кратковременных импульсов – точек и тире, разделяемых паузами. Длительности импульсов и пауз различны: если продолжительность импульса, соответствующего точке, обозначить , то продолжительность импульса тире составляет. При этом длительность паузы между точкой и тире равна, а пауза между буквами в слове равна(длинная пауза). Пауза между словами (пробел) длится.

Итак, в коде Морзе имеется три вида элементарных сигналов разной длительности: короткий импульс, длинный импульс, длинная пауза. Таким образом, код Морзе является троичным.

Под знаками кода Морзе следует понимать следующее:

«» означает «короткий импульс + короткая пауза»;

«» означает «длинный импульс + короткая пауза»;

«0» означает длинную паузу – признак конца буквы;

«00» означает двойную длинную паузу – признак пробела.

Свой код Морзе разработал в 1838 году, то есть задолго до работ Шеннона, до исследования относительной частоты (вероятности) появления различных букв в текстах. Однако Морзе правильно выбрал принцип кодирования – буквы, которые встречаются чаще, должны иметь более короткие коды, чтобы сократить общее время передачи сообщения. Относительные частоты букв английского алфавита он оценил простым подсчетом литер в ячейках типографской наборной машины. Поэтому самая распространенная английская буква «E» получила код «точка».

При составлении кодов Морзе для букв русского алфавита учет относительной частоты букв не производился, что, естественно, повысило его избыточность.

В табл. 16ниже представлен код Морзе для русского алфавита. Признак конца буквы («0») в кодах не отображается, но он учтен в величинедлины кода буквы №i.

Табл. 16. Код Морзе для русского алфавита

Буква

Код

Буква

Код

Пробел

00

174

2

Я

   

18

5

О

  

90

4

Ы

   

16

5

Е

72

2

З

  

16

4

А

 

62

3

Ь, Ъ

   

14

5

И

 

62

3

Б

   

14

5

Т

53

2

Г

  

13

4

Н

 

53

3

Ч

   

12

5

С

  

45

4

Й

   

10

5

Р

  

40

4

Х

   

9

5

В

  

38

4

Ж

   

7

5

Л

   

35

5

Ю

   

6

5

К

  

28

4

Ш

   

6

5

М

 

26

2

Ц

   

5

5

Д

  

25

4

Щ

   

4

5

П

  

23

4

Э

    

4

6

У

  

21

4

Ф

   

3

5

Среднее значение длины кода Морзе имеет значение

.

Полагая появлние знаков вторичного алфавита (элементарных сигналов кода Морзе) равновероятным, получаем, что средняя информация на знак троичного алфавита Морзе равна

.

Для русского алфавита в первом приближении (с учетом вероятностей появления русских букв в текстах) средняя информация на знак (на букву) русского алфавита равна .

Как известно, избыточность кода вычисляется по формуле

.

В нашем случае ,– троичный алфавит Морзе,,.

Таким образом,

,

то есть избыточность кода Морзе для русского языка составляет приблизительно 22 .

Избыточность кода Морзе для английского языка около 19 .

Код Морзе имел в недалеком прошлом весьма широкое распространение в ситуациях, когда источником и приемником сигналов являлся человек, а не техническое устройство; при этом на первый план выдвигалась не экономичность кода, а удобство его восприятия человеком.