Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ФИПС лекции.doc
Скачиваний:
225
Добавлен:
10.06.2015
Размер:
12.01 Mб
Скачать

Кодирование звуковых сигналов

Основные классы звуковых сигналов

вид звукового сигнала

диапазон

частот, кГц

частота

опросов, кГц

Бит/

опрос

Скорость

кбит/c

Телефонная речь

Широкополосная речь

Широкополосное аудио

0,3…3,4

0,06…7

0,01…20

8

16

48

8

14

16

64

224

768

Кодируется форма сигнала, спектр или параметры источника сигнала.

При кодировании формы сигнала (waveform coding) передается, разными способами, последовательность дискретных отсчетов сигнала.

При импульсно-кодовой модуляции ИКМ (pulse code modulation, PCM) цифровые значения отсчетов передаются без каких-либо преобразований.

При дельта-модуляции ДМ (DM, delta modulation) выдается один бит на отсчет, означающий увеличение или уменьшение сигнала на один шаг (речь передается со скоростью 32 кбит/c). Существуют адаптивные методы дельта-модуляции с переменным шагом.

При дифференциальной импульсно-кодовой модуляции ДИКМ (DPCM) в канал передается разность между текущей выборкой сигнала x(k) и ее предсказанным значением x*(k), вычисляемым «N-отводным предсказателем» (кодером с памятью) как линейная комбинация N предыдущих выборок сигнала:

В адаптивных кодерах с ДИКМ оптимальные значения параметров аi определяются по автокорреляционной функции передаваемого сигнала и передаются вместе с ошибкой предсказания.

Кодек с предсказанием (LPC, linear predictive codec):

Характеристики речи меняются через 50-100мс, для предсказателя с 10-12 отводами параметры меняют через 20 мс.

Кодирование параметров источника сигнала

Адаптивный кодер, предсказывающий последующие значения звукового сигнала, работает как синтезатор речи, моделирующий голосовой аппарат человека. Сигнал возбуждения синтезатора U(t), обеспечивающий точное воспроизведение речи, можно получить, пропустив речевой сигнал s(t) через фильтр с коэффициентом передачи, обратным коэффициенту передачи фильтра-синтезатора H(f). Идеальный сигнал возбуждения называют «остатком».

На практике используют различные способы экономного кодирования параметров сигнала возбуждения, передаваемых вместе с параметрами предсказателя. В кодерах типа RPE (Regular-Pulse Excited) передается значение периода импульсов возбуждения. Такие кодеры со скоростью передачи 13 кбит/с применяются в сотовой системе связи GSM.

В кодерах типа CELP (Codebook-Excited Linear Predictive) наиболее подходящий сигнал активации синтезатора звука подбирается в передающем устройстве из набора сигналов, содержащихся в «кодовой книге». Такие кодеры применяются в системе связи по стандарту IS-95.

Кодирование спектра сигнала

При кодировании спектра используются особенности слуха человека: нечувствительность к фазовым сдвигам спектральных компонент и к компонентам, слабым по сравнению с соседними по частоте сильными компонентами.

В канал передаются текущие значения амплитуд спектральных составляющих сигнала. Гармоники с амплитудами ниже порога слышимости, зависящего от уровня соседних гармоник, не кодируются.

Ширина частотных полос, частоты дискретизации и разрядности двоичных чисел, представляющих отсчеты огибающих в полосах, могут быть разными. Обычное число разрядов – 3…5 бит. При частоте дискретизации 50 Гц (характеристики речи сохраняются 20 мс), 16-ти полосах по 200 Гц и разрядности АЦП в 3 бита скорость передачи 50*16*3 = 2,4 кбит/c.

Минимальная скорость передачи, при которой речь правильно воспринимается, составляет 1 кбит/c.