1.2. Клиппирование речевого сигнала

Клиппирование является простейшим методом анализа речевого сигнала и заключается в предельном усилении сигнала с последующим ограничением по амплитуде (см. рис.2,а).

Преобразование сигнала f(t)198лв цифровую форму позволяет записать его в память ЭВМ и обработать с целью получения «цифрового портрета речевого сигнала».

Клиппированная речь обладает удовлетворительной разборчивостью, то есть несёт в себе ещё достаточно информации для различения слов и понимания фраз, несмотря на большое упрощение формы сигнала.

Разборчивость клиппированной речи значительно возрастает, если клиппированный сигнал смешивают с его клиппированной производной. Однако при этом более чем вдвое возрастает сложность описания речи.

Анализ клиппированного сигнала сводится к подсчёту числа переходов через нулевой уровень в единицу времени и учёту распределений интервалов времени между нуль-переходами

1.3. Выделение формантных параметров речи

Если произнести в микрофон некоторую фонему и, затем, усилить сигнал с микрофона, построить кривую I=f(ω),гдеI-интенсивность (для простоты – амплитуда сигнала),ωкруговая частота сигнала, то можно получить график функции, которая в теории анализа речевых сигналов называютформантной характеристикой(см. рис. 2,б). Эта характеристика представляет собой графическое изображение спектра речевого сигнала, полученного при произнесении фонем букв «а» и «о». Приведённые на рисунке характеристики представляют собой частотный портрет фонем и имеют вид кривых с тремя чётко выраженными горбами на частотахω1, ω2 иω3 (некоторые фонемы имеют до 6 таких горбов и, соответственно, частот). Эти частоты называютформантными частота-ми. В теории формантного анализа сигналов показано [3], что для хороше-го качества распознавания фонем и синтеза речевого сигнала достаточно задать параметры нескольких старших (первых трёх) формант основного тона и источника шумового сигнала.

Формантный анализ речи является развитием спектрального анализа применительно к специфике речеобразования. Данный вид анализа является весьма сложным, поскольку необходимо с высокой надёжностью различать (тональные) и глухие участки речи, вырабатывая признак тон/шум, определять параметры шума и параметры речевого тракта. Параметрами тракта является информация о резонансах: определяются формантные частоты (от 2 до 6) и их полосы.

1.4. КЛП-анализ речи

Этот метод основан на вычислении коэффициентов линейного пред-сказания (КЛП). Метод позволяет описать речевой сигнал наиболее точно и в то же время компактно. В ходе обработки текущие отсчёты речевого сигнала, взятые с интервалами квантования 50 – 120 мкс, сравниваются с линейными комбинациями ограниченного ряда (4 – 12) предыдущих отсчётов. Эти линейные комбинации называют предсказанными отсчётами. Коэффициенты в линейных комбинациях определяются статистическим путём на участках речи длительностью 10 – 20 мс с таким расчётом, чтобы расхождение между предсказанными и текущими значениями были минимальными. Массивы этих коэффициентов и являются результатом КЛП-анализа. Алгоритмы вычисления ЛПК довольно сложны, они реализуются в реальном времени только на очень быстрых ЭВМ.

<<< < Предыдущая 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 4344 / 5044 45 46 47 48 49 50 > Следующая >>>

Соседние файлы в предмете Системы ввода и вывода данных

#
22.08.201392.16 Кб231._Programma_discipliny.doc
#
22.08.201340.45 Кб172,a._Kal-plan_1.doc
#
22.08.201344.54 Кб252,b._Kal-plan_2.doc
#
22.08.201334.3 Кб333._Literatura.doc
#
22.08.20132.97 Mб1374,a._Konspekt_1.doc
#
22.08.20135.43 Mб1154.b._Konspekt2.doc
#
22.08.2013351.74 Кб285,a.Testy_1.doc
#
22.08.201373.22 Кб255,b.Testy_2.doc
#
22.08.20133.89 Mб446,a.Prezentaciya_1.ppt
#
22.08.20133.45 Mб186.b.Prezentaciya2.pptm
#
22.08.2013419.84 Кб267,a._Scenarij_1.doc