Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция11.doc
Скачиваний:
18
Добавлен:
12.08.2019
Размер:
275.46 Кб
Скачать

Функциональная схема одного из простейших вокодеров

На вход поступает речевой сигнал, который получается на выходе электрофизического преобразователя – микрофона. Далее, прежде чем осуществить измерение спектральных характеристик уменьшают динамический диапазон речевого сигнала – ставят компрессор и измеряют частоту основного тона с помощью полосового фильтра (ПФ). 800 - 1700Гц – частоты в пределах которых находится основой тон речевого сигнала различных людей. Частотный дискриминатор (ЧД) – устройство, которое измеряет частоту основного тона. На выходе ЧД получаем сигнал основного тона, который пропорционален частоте основного тона.

После компрессора ставят измеритель энергетического спектра (спектроанализатор) – "гребёнка фильтров" (множество фильтров, полосы пропускания которых перекрываются определённую полосу частот, в пределах которой необходимо измерить энергетический спектр). Чем более точно необходимо измерить спектр, тем больше фильтров необходимо и тем уже должна быть полоса пропускания каждого фильтра.

Для того чтобы синтезировать речевой сигнал с точностью до сохранения содержания в полосе 3кГц достаточно десяти фильтров с шагом 300Гц.

Для того чтобы определить уровень сигнала пропорциональной мощности сигнала в полосе пропускания фильтра ставится амплитудный детектор (АД) (детектор огибающей).

Получаем одиннадцать сигналов: один формирует напряжение пропорциональное частоте основного тона (Uo ≡ fот) и десять формируют точки энергетического спектра.

На выходе получаем десять значений энергетического спектра и одно значение пропорциональное основному тону. Далее эти значения передаются методом временного уплотнения (по очереди).

Коммутатор К1 формирует пакет. На выходе К1 получаем одно значение пропорциональное частоте основного тона и десять значений пропорциональных значениям энергетического спектра, которые сформированы в пакет аналоговых значений. Далее эти значения в пакете преобразуют в цифровую форму (ставят АЦП). Далее может присутствовать устройство уменьшения статистической избыточности (УУСИ). На выходе имеем цифровое представление речевого сигнала ηр(t). Это значение передаётся в приёмную часть системы.

ПНП – предсказатель нулевого порядка (обратное преобразование по отношению к уменьшению статистической избыточности)

ЦАП – цифроаналоговый преобразователь

К2 – коммутатор приёмной части системы

К2 должен работать синхронно с К1, осуществляет распаковку пакета.

Первый канал:

Uот поступает на устройство обнаружения основного тона (УООТ) – пороговое устройство, которое классифицирует принятый сигнал, к какой категории он относится: звонкие согласные/гласные, глухие согласные. Если уровень напряжения Uот превышает некоторый порог, то это значит, что в спектре речевого сигнала содержится основной тон (либо гласная, либо звонкая согласная). В зависимости от того превышен или не превышен порог – идёт управление переключателем. Переключатель подключает к синтезатору речевого сигнала либо сигнал с выхода генератора основного тона (ГОТ), либо сигнал с выхода генератора шумоподобного сигнала (ГШПС). На ГОТ поступает Uот, которое управляет частотой ГОТ (подгоняет частоту ГОТ под частоту основного тона). Синтезатор речевого сигнала содержит столько же каналов, сколько имелось в спектроанализаторе. Каждый из каналов содержит активный фильтр.

Гребёнка ПФ синтезатора моделирует резонансный контур полости рта и гортани, т.е. интегрально общая частотная характеристика гребёнки фильтров должна соответствовать спектру передаваемого речевого сигнала. Для этого в каждом канале имеются управляемые усилители (УУ) – усилители с переменным коэффициентом передачи. Величина коэффициента передачи управляется уровнем спектра соответствующей полосы, т.е. сигналом, который передаётся по соответствующему каналу. С коммутатора К2 поступают сигналы управления на фильтры.

В результате суммарная частотная характеристика активного фильтра в каждый момент времени соответствует энергетическому спектру передаваемого сигнала.

Компрессор: динамический диапазон речевого сигнала достаточно велик. Если будем работать в пределах этого ДД, при фиксированной точности/шаге квантования, то понадобится много уровней квантования (чем больше уровней квантования, тем больше требуется разрядов в кодовом слове для передачи речевого сигнала). Чтобы уменьшить количество разрядов в кодовом слове, возникающее из-за большого диапазона речевого сигнала, выполняется предварительное нелинейное (устранимое) преобразование речевого сигнала, с помощью которого уменьшают динамический диапазон.

В приёмной части осуществляется обратное – восстанавливается ДД с помощью экспандера.

Рис.8

Сигнал с выходов всех УУ поступает на сумматор ( ∑). С выхода сумматора поступает на экспандер, который осуществляет обратное преобразование относительно компрессии. На выходе получаем оценку речевого сигнала.

Как работает кодер и декодер речевого источника?

В каждый момент времени на вход кодера речевого сигнала поступает речевой сигнал соответствующий какому-то определённому звуку. Каждому звуку соответствует его энергетический спектр, который анализируется с помощью спектроанализатора: в первом канале определяется частота основного тона, в десяти следующих – значения энергетического спектра в полосе частот 3000 Гц.

Этот информационный пакет с временным уплотнением (по очереди по времени опрашивается коммутатор) формируется в общий пакет из 11 значений, которые далее преобразуются в цифровую форму и далее могут ещё уменьшаться в объёме, используя уменьшение статистической избыточности.

В приёмной части системы осуществляется обратное преобразование (ПНП, интерполяция, ЦАП), далее выделяются 11 значений в разных каналах: первый канал – канал основного тона.

41.00

Если передавался звук гласный или звонкий согласный, то уровень напряжения в канале основного тона будет выше порога и переключатель (рис.7) переключится в верхнее положение. И на синтезатор частот, который моделирует работу гортани человека, поступит сигнал основного тона. Гребёнка фильтров моделирует резонатор полости рта и гортань. Для того чтобы такое моделирование было корректным, необходимо чтобы суммарная частотная характеристика этой гребёнки фильтров соответствовала спектру речевого сигнала, который передавался в данный момент времени. Этого соответствия добиваются за счёт изменения коэффициентов передачи в каждый момент времени усилителей каналов гребёнки фильтров. Коэффициенты передачи изменяются в соответствии с уровнями сигналов на выходе спектроанализатора. Таким образом, за счёт такого построения получается, что энергетический спектр суммарного сигнала на выходе соответствует энергетическому спектру передаваемого сигнала. Это то, что обеспечивает разборчивость речи (какая буква передавалась).

Если отсутствует основной тон, т.е. если на уровень напряжения пропорционального частоте основного тона меньше порога, т.е. нет составляющей основного тона в спектре передаваемого речевого сигнала, тогда переключатель переключается в нижнее положение и на синтезатор речи поступает шумоподобный сигнал, а всё остальное также получается. Фильтруется

шумоподобный сигнал с помощью гребёнки фильтров, суммарная интегрированная частотная характеристика которых соответствует частотной характеристике объёмного резонатора полости рта и гортани.

В итоге получили уменьшение полосы частот примерно в 10 раз. 10 фильтров по 25 Гц и ещё 25 Гц – 275 Гц. Т.е. суммарная полоса, которая нам требуется для передачи 10 сигналов – 275Гц. Если бы передавали "в лоб" понадобилось бы 3000 Гц.

Сейчас существуют более совершенные вокодеры (уменьшение полосы в 40-50раз по отношению к 3000 Гц.)

45.00

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]