Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4.b._Konspekt2.doc
Скачиваний:
115
Добавлен:
22.08.2013
Размер:
5.43 Mб
Скачать

1.2. Клиппирование речевого сигнала

Клиппирование является простейшим методом анализа речевого сигнала и заключается в предельном усилении сигнала с последующим ограничением по амплитуде (см. рис.2,а).

Преобразование сигнала f(t)198лв цифровую форму позволяет записать его в память ЭВМ и обработать с целью получения «цифрового портрета речевого сигнала».

Клиппированная речь обладает удовлетворительной разборчивостью, то есть несёт в себе ещё достаточно информации для различения слов и понимания фраз, несмотря на большое упрощение формы сигнала.

Разборчивость клиппированной речи значительно возрастает, если клиппированный сигнал смешивают с его клиппированной производной. Однако при этом более чем вдвое возрастает сложность описания речи.

Анализ клиппированного сигнала сводится к подсчёту числа переходов через нулевой уровень в единицу времени и учёту распределений интервалов времени между нуль-переходами

1.3. Выделение формантных параметров речи

Если произнести в микрофон некоторую фонему и, затем, усилить сигнал с микрофона, построить кривую I=f(ω),гдеI-интенсивность (для простоты – амплитуда сигнала),ωкруговая частота сигнала, то можно получить график функции, которая в теории анализа речевых сигналов называютформантной характеристикой(см. рис. 2,б). Эта характеристика представляет собой графическое изображение спектра речевого сигнала, полученного при произнесении фонем букв «а» и «о». Приведённые на рисунке характеристики представляют собой частотный портрет фонем и имеют вид кривых с тремя чётко выраженными горбами на частотахω1, ω2 иω3 (некоторые фонемы имеют до 6 таких горбов и, соответственно, частот). Эти частоты называютформантными частота-ми. В теории формантного анализа сигналов показано [3], что для хороше-го качества распознавания фонем и синтеза речевого сигнала достаточно задать параметры нескольких старших (первых трёх) формант основного тона и источника шумового сигнала.

Формантный анализ речи является развитием спектрального анализа применительно к специфике речеобразования. Данный вид анализа является весьма сложным, поскольку необходимо с высокой надёжностью различать (тональные) и глухие участки речи, вырабатывая признак тон/шум, определять параметры шума и параметры речевого тракта. Параметрами тракта является информация о резонансах: определяются формантные частоты (от 2 до 6) и их полосы.

1.4. КЛП-анализ речи

Этот метод основан на вычислении коэффициентов линейного пред-сказания (КЛП). Метод позволяет описать речевой сигнал наиболее точно и в то же время компактно. В ходе обработки текущие отсчёты речевого сигнала, взятые с интервалами квантования 50 – 120 мкс, сравниваются с линейными комбинациями ограниченного ряда (4 – 12) предыдущих отсчётов. Эти линейные комбинации называют предсказанными отсчётами. Коэффициенты в линейных комбинациях определяются статистическим путём на участках речи длительностью 10 – 20 мс с таким расчётом, чтобы расхождение между предсказанными и текущими значениями были минимальными. Массивы этих коэффициентов и являются результатом КЛП-анализа. Алгоритмы вычисления ЛПК довольно сложны, они реализуются в реальном времени только на очень быстрых ЭВМ.

Соседние файлы в предмете Системы ввода и вывода данных