Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4.b._Konspekt2.doc
Скачиваний:
115
Добавлен:
22.08.2013
Размер:
5.43 Mб
Скачать

3.2 Синтезаторы с непосредственным кодированием/восстановлением человеческой речи

Синтезаторы этого типа используют, как показано выше, компиля-тивный метод синтеза. Это означает, что в основу построения синтезатора положен принцип работы по образцам. В качестве образца берётся живая человеческая речь, которая предварительно кодируется, то есть преобразуется в цифровую форму и сохраняется в памяти компьютера. Принцип кодирования речевого сигнала иллюстрирует рис.9,а.

На верхнем рисунке приведён фрагмент речевого сигнала А(t). Этот сигнал с помощью устройства, называемого схемой выборки, квантуется с частотой синхроимпульсов (СИ), и на выходе схемы выборки образуются отдельные значения речевого сигнала А*(t). Амплитуда этих сигналов соответствует величине сигнала А(t) в момент выборки, то есть в момент поступления СИ на схему выборки. Затем отдельные выборки произнесённого в микрофон слова или фразы преобразуются в код и записываются в память. Массиву байтов, соответствующих слову (фразе), присваивается идентификатор (имя), по которому на этапе синтеза речи можно обратиться к области памяти, где хранится это слово, (фраза). Как видно из рис.9,а, десяти выборкам речевого сигнала соответствуют 10 байтов, записанных в память компьютера (см .нижний рисунок)

На рисунке 9,б приведена простейшая схема выборки, реализованная на базе операционного усилителя (ОУ) с емкостью в цепи отрицательной обратной связи (С). Когда электронный ключ (К) закрыт ёмкость хранит напряжение, равное величине напряжения А(t) в момент закрытия ключа К. На выходе операционного усилителя (ОУ) при этом образуется напряжение -А*(t) равное А(t) (при равенстве резисторовR). С приходом очередного импульса СИ ключ открывается и ёмкость разряжается до напряжения А(t), действующего на входе. С прекращением импульса СИ ключ К закрывается и ёмкость хранит напряжение, поступившее на вход в момент закрытия ключа (с обратным знаком). Работу схемы выборки описывает временная диаграмма, приведённая на рис.9, а (с точностью до знака).

Структура синтезатора приведена на рис.10. В приведённой структу-ре можно выделить 3 основных узла:

1. Входной узел синтезатора, состоящий из микрофона (М), фильтра нижних частот (ФНЧ), усилителя (У), схемы выборки и 8-битового АЦП;

2. Компьютер;

3. Выходной узел синтезатора, включающий в себя 8-битный ЦАП, фильтр нижних частот (ФНЧ), усилитель мощности и динамик (Д).

Работа входного узла синтезатора описана выше и не требует особых комментариев. Следует лишь отметить, что фильтр нижних частот, используемый в этом узле, и настроенный на частоту фильтрации сигнала с

микрофон (ниже 3 кГц), выполняет задачу подавления высокочастотных помех, приводящих к искажению речевого сигнала А(t). Усилитель (У) доводит амплитуду речевого сигнала до уровня, принятого в синтезаторе.

Схема выборки с частотой 6 кГц производит выборки речевого сигнала A*(t), а аналого-цифровой преобразователь (АЦП) преобразует выборки в цифровые коды (байты). Временная диаграмма работы узла приведена на рис. 9,а. При частоте выборки сигнала 6 кГц среднее количество выборок для слова длительностью 0,3 секунды составляет около 2000 байтов (включая короткие паузы в начале и в конце слова).

Компьютер имеет параллельный 8-битный порт ввода данных с АЦП и параллельный 8-битный порт вывода, откуда данные поступают на вход 8-битного цифро-аналогового преобразователя (ЦАП).

В процессе сбора данных компьютером его резидентная программа переносит информацию из 8-битного АЦП и последовательно записывает её в память. После произнесения слова процесс выборки заканчивается, а в памяти оказывается записанным цифровое представление слова. Как видно из рис.10, эта информация занимает адресное пространство от ячейки 1024 до примерно 3073. В данном случае информация представлена в двоичном коде при полном диапазоне изменений напряжения ± 5 вольт. Колонка «нормализованные данные» содержит величины напряжений, эквивалентных записанным входным сигналам. Эта нормализованная информация в вольтах не имеет существенного значения для компьютера и показана здесь только для того, чтобы проиллюстрировать эквивалентность аналого-цифрового процесса выборки (слово hello, см.[4]).

Выходной узел синтезатора представляет воспроизводящую часть синтезатора. Он содержит 8-битный цифро-аналоговый преобразователь, фильтр нижних частот (ФНЧ), который отфильтровывает нежелательные высокочастотные сигналы cвыхода ЦАП –A(t)вос, возникающие в восстановленном сигнале. Отфильтрованный сигнал поступает на усилитель мощности, а затем в виде сигналаA*(t)восна динамик Д.

Программа воспроизведения речи, хранимая в памяти, – это простая индексирующая программа, которая последовательными шагами просматривает записанную ранее информацию и выводит её побайтно на 8-битный ЦАП.

Речь, которую услышит пользователь из громкоговорителя, должна в точности повторить исходный речевой сигнал на входе синтезатора, за исключением небольших потерь в высокочастотной части спектра речевого сигнала, вызываемых фильтром нижних частот. Иначе говоря, полученная речь по своему звучанию соответствует голосу говорящего и имеет такие же модуляцию и тональность, как и входной речевой сигнал.

Соседние файлы в предмете Системы ввода и вывода данных