Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
GrushoCrypto.pdf
Скачиваний:
18
Добавлен:
02.04.2015
Размер:
4.03 Mб
Скачать

30

считать, что какая-либо последовательность не может стать сообщением. Просто вероятность встретить в качестве сообщения одни слова много больше, чем другие. Поэтому предполагают, что все последовательности длины n упорядочены в соответствии с их вероятностями появления в общении на данном языке. Тогда собственно осмысленные (в бытовом понимании этого слова) выражения относятся к более вероятным, чем последовательности, смысл которых нам неясен (трудно представить себе общение при помощи труднопроизносимых буквосочетаний).

Поскольку значения k, m n и Х велики, то оценку Х можно сделать асимптотически, предполагая n большим. Такие оценки Шеннон разработал в работе “Математическая теория связи” [Ш., с. 265], к которой

сейчас и обратимся.

 

Пусть

 

p(a1),...,p(a m )

(2)

вероятности появления букв на фиксированном месте i в открытом сообщении длины n (1 i n). Предположим, что буквы в сообщении появляются независимо друг от друга с одним и тем же распределением (2). Подобная модель открытых сообщений является грубой, но, как и выше, оценка для r, близкая к экспериментальной, покажет, что наш механизм анализа отражает сущность проблемы. Обозначим через νi , i = 1,...,m, час-

тоты букв a1,..., a m в последовательности х. Тогда вероятность выбора х в нашей схеме равна

P(x) = pν1 (a1) pνm (a m ).

m

Будем считать, что p(ai ) >0, H = - p(ai ) log 2 p(ai ). Теперь мы можем

i=1

сформулировать следующую теорему Шеннона.

Теорема 1 (К. Шеннон). Для любых ε >0 и δ >0 можно найти такое n 0 , что для любого n > n 0 последовательности из V n распадаются на

два непересекающихся класса В и B так, что

1)P( B )<ε

2)x B выполняется неравенство

log2 P1(x) - H < δ. n

Д о к а з а т е л ь с т в о. Возьмем произвольные малые ε >0 и δ >0 и рассмотрим события

B i = {x V, νi - np(a i ) > δn }, i = 1,…,m.

31

По закону больших чисел n0(i) , что n > n0(i)

 

P(

 

 

i ) <

 

 

 

ε

.

 

 

 

 

 

 

 

 

 

(3)

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i . Тогда из (3) для n > max { n0(i) }

Определим

B

 

= U

 

B

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

P(

B

)

P(

B

i ) < ε.

(4)

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

Множество В = I Bi

может быть представлено в следующем виде:

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

В = {x V, i (i=1,..., m) νi - np(ai ) δn }.

(5)

Обозначим

 

αi

 

= νi - np(ai ), i=1,..., m.

Из (5) следует, что

i -δn αi δn.

 

 

 

 

 

 

 

 

 

 

Выразим Р(х), x В, через введенные параметры.

 

Р(х) =( p(a1)) np(a1)+α1 (p(a m )) np(am )+αm .

 

Тогда

 

 

 

 

 

 

 

 

m

 

 

m

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

log 2

 

 

 

 

 

= -n

 

p(ai ) log 2 p(ai ) - αi log 2 P(ai ).

P(x)

 

 

 

 

 

 

 

 

 

 

i=1

 

 

i=1

 

Получаем, что x В

 

 

 

 

 

log2 P1 (x)

 

 

 

 

 

 

 

1

m

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- H

 

 

αi log 2 P(ai ) δ

log 2 p(ai ) .

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

i=1

m

Поскольку p(ai ) >0, то log 2 p(ai ) = const, не зависит от n. Теорема

i=1

доказана.

Пусть 0 < ε < 1, - произвольное малое число. Пусть все последовательности длины n расположены в порядке убывания вероятностей их появления. Как отмечалось выше, множество открытых сообщений моделируется начальным участком таких последовательностей. Обозначим через βn (ε) - число наиболее вероятных последовательностей таких, что сумма

их вероятностей 1-ε, а сумма вероятностей любого набора из (βn (ε) - 1)

этих последовательностей < 1-ε. Следующая теорема показывает, что при n→ ∞ множество последовательностей, составляющих в нашей модели открытый текст, не зависит от ε.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]