- •Практикум (лабораторный)
- •1.2. Частотный анализ в базисе Фурье
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •3. Расчет распределения энергий отрезков сигнала по частотному диапазону
- •4. Анализ распределения энергий звуков по частотному диапазону
- •5. Исследование спектрограммы фрагмента фразы
- •6. Сопоставительный анализ полученных результатов
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •3. Сопоставительный анализ полученных результатов
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •1. Вычисление вектора субполосного преобразованияна основе использования банков ких-фильтров
- •2. Обратное субполосное преобразование (синтез)на основе использования банков ких-фильтров
- •3. Оценка влияния элайзинга на результат субполосного преобразования
- •4. Субполосное преобразование отрезка речевого сигнала методом, основанным на использовании базиса собственных векторов матрицы субполосного анализа
- •Контрольные вопросы к защите
- •4.2. Выбор порядка модели авторегрессии
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •Контрольные вопросы к защите
- •Способ оценки результатов
- •Лабораторная работа №5. Исследование методов обнаружения и кодирования пауз в речевых сообщениях (технология vad) Требования к содержанию, оформлению и порядку выполнения
- •Теоретическая часть
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •1. Кодирование пауз
- •2. Восстановление пауз
- •3. Оценка эффективности работы алгоритма кодирования пауз
- •Контрольные вопросы к защите
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •Контрольные вопросы к защите
- •Способ оценки результатов
- •Расчетно-графическое задание. Прототип информационной технологии сжатия речевых данных
Контрольные вопросы к защите
Для каких целей используется технология VAD?
В чем состоит сложность задачи построения VAD?
В каких случаях для определения участков тишины можно использовать простой энергетический порог сигнала?
Для чего необходимо ограничивать длительность кодируемых пауз?
Какие алгоритмы технологии VADиспользуются в системах, где существует переменный фоновый шум?
Способ оценки результатов
Оценка производится по зачетной системе.
Зачет за выполнение лабораторной работы ставится за правильно выполненную работу и правильные ответы на контрольные вопросы. Не зачитывается работа в том случае, если не выполнено хотя бы одно из заданий работы, или при выполнении допущены грубые ошибки.
Лабораторная работа №6. Исследование методов обнаружения и кодирования пауз в речевых сообщениях (учет различий в распределении энергий шумов и звуковых данных в частотной области)
Требования к содержанию, оформлению и порядку выполнения
Отчет о выполнении лабораторной работы должен содержать все выполненные задачи и ответы на контрольные вопросы.
Теоретическая часть
Обнаружение пауз с использованием простого энергетического порога имеет ряд существенных недостатков. В системах с переменным уровнем шума вместо энергетической характеристики сигнала целесообразно использовать результаты анализа тонкой структуры частотных характеристик звуков и паузы.
В данной работе предлагается реализовать процедуру обнаружения и кодирования пауз в речевых сообщениях за счет учета различий в распределении энергий шумов и звуковых данных в частотной области.
Данная процедура подробно описана в теоретической части УМК §5.2.2.
Общая постановка задачи
1. Осуществить обнаружение и кодирование пауз речевого сигнала с использованием предложенного метода.
2. Оценить эффективность работы алгоритма.
Методические указания к выполнению работы
1. Обнаружение и кодирование пауз речевого сигнала. Данную процедуру можно реализовать используя следующий вычислительный алгоритм, приведенный ниже.
Словесное описание алгоритма
1. Ввести количество Rчастотных интервалов и значение длительности обрабатываемого отрезка сигналаN;
2. Для осуществить вычисления элементов матриц;
3. Положить ;
4. Для вычислить матрицыи
5. Сформировать матрицу
6. Ввести заведомо относящиеся к паузе данные длительностью ;.
7. Для выполнить:
7.1. Ввести вектор значений обрабатываемого отрезка сигнала ;
7.2. Вычислить вектор
7.3.Для вычислить;
8. Для вычислить
9. Для вычислить;
10. Вычислить и;
11. Ввести значение вероятности ложной тревоги ;
12. Выполнить итерации по определению порога:
12.1. Положить
12.2. Вычислить
12.3. Вычислить
12.4. Если то положитьи прекратить итерации;
12.5. В противном случае при положить,если же выполняется неравенство, то положить, положитьи перейти к выполнению 11.2;
13. Задать длительность , предназначенных для сжатия за счёт обнаружения и кодирования пауз данных;
14. Ввести предназначенные для обработки данные ;
15. Задать шаг смещения вдоль отрезка обрабатываемых данных К, такой, что отношениеявляется целым числом;
16. Положить ;
17. Для выполнить:
17.1. Положить ;
17.2. Вычислить вектор
17.3. Для вычислить;
17.4. Вычислить
17.5. Если , то принимается решение о наличии в анализируемом отрезке данных, порождаемых звуками речи, полагаетсяи при выполнении условиявыполняются предыдущие операции, начиная с подпункта 17.1, а при выполнении неравенствавычисления заканчиваются.
В противном случае (неравенство не выполняется) принимается решение о принадлежности анализируемого отрезка данных паузе и выполняются следующие действия:
17.6. Если на предыдущем этапе (предыдущемk) не принималось решения о наличии паузы то началу новой паузы присваивается код,, а длительности присваивается значение,где- номер итерации при которой обнаружено началоn-той паузы в обрабатываемой совокупности данных. Если же и на предыдущем этапе отрезок анализируемых данных был отнесен к паузе номеромn, то код начала паузы не изменяется, а длительность увеличивается на величину шага смещения, то есть вычисляется;
17.7. Полагается и при выполнении условиявыполняются предыдущие операции, начиная с подпункта 17.1, а при выполнении неравенствавычисления заканчиваются.
18. Конец.
2. Оценка эффективности работы алгоритма кодирования пауз в данной работе осуществляется аналогично предыдущей.
По результатам выполнения работы заполните таблицу 6.1. И дайте сравнительный анализ результатов работы данного алгоритма и технологии VAD, реализованной в лабораторной работе №5.
Таблица 6.1.
|
VИС, отсчетов |
VБП, отсчетов |
Ксж |
поп |
лоп |
Диалог |
|
|
|
|
|
Слитная речь |
|
|
|
|
|