1. Двоичное кодирование текстов. Кодовые таблицы.

2. Различные кодировки кириллицы.

1. Двоичное кодирование текстов. Кодовые таблицы.

Как известно, вся информация, которая попадает в компьютер, преобразуется в последовательность электрических импульсов. Наличие импульса принято условно обозначать "1", а его отсутствие -"О". Такой способ кодирования информации называется двоичным или бинарным. Один двоичный символ получил название бит. (bit - от английскогоbinary digit - "двоичная цифра").

При вводе в компьютер текстовой информации каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Традиционно для кодирования одного символа используется количество информации, равное 1 байту (8 битам). Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код (или соответствующий ему двоичный код). Код символа хранится в памяти компьютера, где занимает, как уже говорилось, 1 байт. При таком способе можно закодировать 256 различных символов (256 = 2⁸). Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и заглавные буквы русского алфавита, цифры, знаки, графические символы и т. д.

Каждому символу такого алфавита ставится в соответствие уникальный десятичный код от 0 до 255, а каждому десятичному коду соответствует 8-разрядный двоичный код от 00000000 до 11111111. Таким образом, компьютер различает символы по их коду.

Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице.

В настоящее время существует несколько различных кодировок (кодовых таблиц) для русских букв. Поэтому если текст создан в одной кодировке, то он не будет правильно отображаться в другой.

Понятно, что каждая кодировка задается своей кодовой таблицей. Одному и тому же двоичному коду в различных кодировках соответствуют различные символы.

Для того чтобы стало возможным чтение и редактирования текста, набранного в другой кодировке, используются программы перекодирования русского текста. Некоторые текстовые редакторы(например,MSWordи др.) содержат встроенные программы-конверторы, позволяющие читать текст в различных кодировках.

Присвоение символу конкретного кода является вопросом соглашения, которое и фиксируется в конкретной кодовой таблице. В качестве международного стандарта принята кодовая таблица ASCII. В этой кодовой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов.

Стандартными в этой таблице кодов ASCII являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.

1. Двоичное кодирование звуковой информации.

2. Временная дискретизация.

3. Глубина звука.

4. Частота дискретизации.

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.2015721.13 Кб285лекции.docx
#
14.03.2016195.28 Кб229Лекционный курс ДОУ персонала.docx
#
03.09.2019213.01 Кб18Лекция - Компетентностный подход.docx
#
10.07.201954.27 Кб13лекция 1 ППС.doc
#
01.04.201583.46 Кб63ЛЕКЦИЯ 1.doc
#
01.04.201559.39 Кб98лекция 2.doc
#
01.04.2015110.44 Кб51ЛЕКЦИЯ 2.docx
#
01.04.2015519.68 Кб1669ЛЕКЦИЯ 3.doc
#
03.05.2015342.02 Кб218ЛЕКЦИЯ 4.doc
#
03.05.2015194.21 Кб64ЛЕКЦИЯ 5.docx
#
01.04.2015266.24 Кб54Лекция 6 подш_к.doc