3.Транспортное кодирование

В некоторых системах передачи информации требуется, чтобы поток содержал только определенные символы ASCII кодировки. Однако выходной поток криптоалгоритма имеет очень высокую рандомизацию и в нем встречаются с равной вероятностью все 256 символов. Для преодоления этой проблемы используется транспортное кодирование.

Поскольку системы шифрования данных часто используются для кодирования текстовой информации: переписки, счетов, платежей электронной коммерции, и при этом криптосистема должна быть абсолютно прозрачной для пользователя, то над выходным потоком криптосистемы часто производится транспортное кодирование, то есть дополнительное кодирование (не шифрование!) информации исключительно для обеспечения совместимости с протоколами передачи данных и чтобы гарантировать безопасную его транспортировку через сеть.

Все дело в том, что на выходе криптосистемы байт может принимать все 256 возможных значений, независимо от того был ли входной поток текстовой информацией или нет. А при передаче почтовых сообщений многие системы ориентированы на то, что допустимые значения байтов текста лежат в более узком диапазоне: все цифры, знаки препинания, алфавит латиницы плюс, возможно, национального языка. Первые 32 символа набора ASCII служат для специальных целей. Для того, чтобы они и некоторые другие служебные символы никогда не появились в выходном потоке используется транспортное кодирование.

Наиболее простой метод состоит в записи каждого байта двумя шестнадцатиричными цифрами-символами (0123456789ABCDEF). Так байт 252 будет записан двумя символами 'FC'; байт с кодом 26, попадающий на специальный символ CTRL-Z, будет записан двумя допустимыми символами '1A'. Но эта схема очень избыточна: в одном байте передается только 4 бита информации.

На самом деле практически в любой системе коммуникации без проблем можно передавать около 68 символов (латинский алфавит строчный и прописной, цифры и знаки препинания). Из этого следует, что вполне реально создать систему с передачей 6 бит в одном байте (2⁶<68), то есть кодировать 3 байта произвольного содержания 4-мя байтами из исключительно разрешенных (так называемых печатных) символов. Подобная система была разработана и стандартизирована на уровне протоколов сети Интернет – это система Base64 (стандарт RFC1251).

Процесс кодирования преобразует 4 входных символа в виде 24-битной группы, обрабатывая их слева направо. Эти группы затем рассматриваются как 4 соединенные 6-битные группы, каждая из которых транслируется в одиночную цифру алфавита base64. При кодировании base64 входной поток байтов должен быть упорядочен старшими битами вперед.

Каждая 6-битная группа используется как индекс для массива 64-х печатных символов. Символ, на который указывает значение индекса, помещается в выходную строку. Эти символы выбраны так, чтобы быть универсально представимыми и исключают символы, имеющие специальное значение (".", CR, LF – последние два являются частью последовательности разрыва строки).

Таблица 1

Алфавит Base64

Значение Код Значение Код Значение Код Значение Код

(6 бит) ASCII (6 бит) ASCII (6 бит) ASCII (6 бит) ASCII

0 A 17 (11) R 34 (22) I 51 (33) z

1 B 18 (12) S 35 (23) j 52 (34) 0

2 C 19 (13) T 36 (24) k 53 (35) 1

3 D 20 (14) U 37 (25) l 54 (36) 2

4 E 21 (15) V 38 (26) m 55 (37) 3

5 F 22 (16) W 39 (27) n 56 (38) 4

6 G 23 (17) X 40 (28) o 57 (39) 5

7 H 24 (18) Y 41 (29) p 58 (3A) 6

8 I 25 (19) Z 42 (2A) q 59 (3B) 7

9 J 26 (1A) a 43 (2B) r 60 (3C) 8

10 (A) K 27 (1B) b 44 (2C) s 61 (3D) 9

11 (B) L 28 (1C) c 45 (2D) t 62 (3E) +

12 (C) M 29 (1D) d 46 (2E) u 63 (3F) /

13 (D) N 30 (1E) e 47 (2F) v заполнитель =

14 (E) O 31 (1F) f 48 (30) w

15 (F) P 32 (20) g 49 (31) x

16 (10) Q 33 (21) h 50 (32) y

Выходной поток (закодированные байты) должен иметь длину строк не более 76 символов. Все признаки перевода строки и другие символы, отсутствующие в таблице 1, должны быть проигнорированы декодером base64. Среди данных в Base64 символы, не перечисленные в табл. 1, переводы строки и т.п. должны говорить об ошибке передачи данных, и, соответственно, программа-декодер должна оповестить пользователя о ней.

Если в хвосте потока кодируемых данных осталось меньше, чем 24 бита, справа добавляются нулевые биты до образования целого числа 6-битных групп. А до конца 24-битной группы может оставаться только от 0 до 3-х недостающих 6-битных групп, вместо каждой из которых ставится символ-заполнитель "=". Поскольку весь входной поток представляет собой целое число 8-битных групп (т.е., просто байтных значений), то возможны лишь следующие случаи:

Входной поток оканчивается ровно 24-битной группой (длина файла кратна 3). В таком случае выходной поток будет оканчиваться четырьмя символами Base64 без каких либо дополнительных символов.
"Хвост" входного потока имеет длину 8 бит. Тогда в конце выходного кода будут два символа Base64, с добавлением двух символов "=".
"Хвост" входного потока имеет длину 16 бит. Тогда в конце выходного будут стоять три символа Base64 и один символ "=".

Так как символ "=" является хвостовым заполнителем, его появление в теле письма может означать только то, что конец данных достигнут. Но опираться на поиск символа "=" для обнаружения конца файла неверно, так как, если число переданных битов кратно 24, то в выходном файле не появится ни одного символа "=". Любые символы, не входящие в алфавит base64-должны игнорироваться.

Следует позаботиться о том, чтобы использовались корректные октеты в качестве разделителей строк при работе с base64. В частности, разрывы строк должны быть преобразованы в последовательности CRLF до выполнения кодирования base64.

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.04.20153.16 Mб10175к - Машины и механизмы.doc
#
16.09.201936.74 Кб786 раздел.docx
#
11.04.2015420.35 Кб946_Курс лекций МиСЗИ.doc
#
17.12.201867.47 Кб667-12.docx
#
27.08.2019130.56 Кб677. Охрана труда и без. жизнед..doc
#
11.04.2015132.61 Кб1907_Курс лекций МиСЗИ.doc
#
11.04.20152.93 Mб4128 Семестр Кожевников Лекции.doc
#
24.09.2019575.45 Кб748-14.docx
#
14.09.201957.89 Кб558-9 Лекции по ИС.docx
#
14.09.2019689.66 Кб53912 шашелолва н курсовик.doc
#
11.04.2015142.85 Кб779_Курс лекций МиСЗИ.doc