Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
11 Механизмы формирования речи человеком и стру...docx
Скачиваний:
6
Добавлен:
21.11.2019
Размер:
103.36 Кб
Скачать

Слайд 7. Схема синтезатора речевых сообщений

ГВОТ – генератор высоты основного тона;

А0 – амплитуда сигнала основного тона;

F0 – частота сигнала основного тона;

F1, F2, F3 – значения формантных частот ;

У1, У2 – усилители;

Ф1, Ф2 – фильтры;

Ф3 – резонансный фильтр;

Х - управляемый аттенюатор;

ГШ – генератор шума;

[+] – блок смешения трактов;

Д – динамик.

Таким образом, каждому элементу фонетического алфавита ставится в соответствие набор параметров настройки синтезатора; эти параметры могут быть неизменными для каждого элемента фонетического алфавита, но могут и меняться. В последнем случае одному элементу фонетического алфавита необходимо поставить в соответствие несколько наборов параметров. Подбор параметров каждого набора производится при настройке системы вывода речевых сообщений. Должны быть выбраны амплитуда А0 и частота F0 сигнала основного тона, значения формантных частот (F1, F2, F3), а также амплитуда Аш и диапазон частот шума Fш, посредством которого моделируются свистящие и шипящие звуки. Для придания естественности звучания выводимым сообщениям устанавливается параметр придыхания Ап, Схема синтезатора, использующая при настройке эти параметры, приведена на слайде (7); она содержит два тракта: первый служит для формирования гласных звуков и большинства согласных, а второй — для формирования шипящих. Первый тракт состоит из генератора высоты основного тона ГВОТ, усилителя У1 и двух фильтров Ф1 и Ф2, причем второй фильтр управляемый. В формировании большинства согласных звуков участвуют, помимо фильтров Ф1 и Ф2, управляемый аттенюатор (от франц. attenuer смягчить, ослабить) Х и генератор шума ГШ. Второй тракт состоит из управляемого усилителя У2 и резонансного фильтра ФЗ. Сигналы этих трактов смешиваются (+), а затем воспроизводятся в виде речевых сообщений с помощью динамика Д. Такая схема позволяет получить вполне различимую речь. Однако различимая речь отличается невысоким качеством, звучит неестественно, так как в ней отсутствуют присущие человеческой речи интонации, модуляции громкости, изменения ритма и т.п.

В настоящее время существует большое число разнообразных устройств, осуществляющих синтез речи по правилам или методами ЛПК-синтеза, т.е. кодирования с линейным предсказанием, основанным на том, что поведение речевого сигнала мало меняется при переходе от звука к звуку. Примером синтезатора по правилам может служить одно из устройств DECtalk (дэкток), воспроизводящее близкую к естественной речь. Это автономное устройство, основанное на правилах, обладает неограниченным словарем, составляемым по желанию пользователя, большой библиотекой правил и способно говорить семью различными голосами — женским, мужским, детским и несколькими голосами пожилых людей. Но большинство современных промышленных устройств вывода речи выпускается в виде отдельных плат, устанавливаемых в ПК. В основу этих устройств положены речевые микропроцессоры, выпускаемые многими зарубежными фирмами, например синтезатор TMS 5200. Как правило, такие синтезаторы имеют ограниченные словари, объемы которых зависят от использованного в них способа кодирования.

5

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]