Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по ОРД.doc
Скачиваний:
45
Добавлен:
13.04.2015
Размер:
1.4 Mб
Скачать

Контрольные вопросы к защите

  1. Для каких целей используется технология VAD?

  2. В чем состоит сложность задачи построения VAD?

  3. В каких случаях для определения участков тишины можно использовать простой энергетический порог сигна­ла?

  4. Для чего необходимо ограничивать длительность кодируемых пауз?

  5. Какие алгоритмы технологии VADиспользуются в системах, где существует переменный фоновый шум?

Способ оценки результатов

Оценка производится по зачетной системе.

Зачет за выполнение лабораторной работы ставится за правильно выполненную работу и правильные ответы на контрольные вопросы. Не зачитывается работа в том случае, если не выполнено хотя бы одно из заданий работы, или при выполнении допущены грубые ошибки.

Лабораторная работа №6. Исследование методов обнаружения и кодирования пауз в речевых сообщениях (учет различий в распределении энергий шумов и звуковых данных в частотной области)

Требования к содержанию, оформлению и порядку выполнения

Отчет о выполнении лабораторной работы должен содержать все выполненные задачи и ответы на контрольные вопросы.

Теоретическая часть

Обнаружение пауз с использованием простого энергетического порога имеет ряд существенных недостатков. В системах с переменным уровнем шума вместо энергетической характеристики сигнала целесообразно использовать результаты анализа тонкой структуры частотных характеристик звуков и паузы.

В данной работе предлагается реализовать процедуру обнаружения и кодирования пауз в речевых сообщениях за счет учета различий в распределении энергий шумов и звуковых данных в частотной области.

Данная процедура подробно описана в теоретической части УМК §5.2.2.

Общая постановка задачи

1. Осуществить обнаружение и кодирование пауз речевого сигнала с использованием предложенного метода.

2. Оценить эффективность работы алгоритма.

Методические указания к выполнению работы

1. Обнаружение и кодирование пауз речевого сигнала. Данную процедуру можно реализовать используя следующий вычислительный алгоритм, приведенный ниже.

Словесное описание алгоритма

1. Ввести количество Rчастотных интервалов и значение длительности обрабатываемого отрезка сигналаN;

2. Для осуществить вычисления элементов матриц;

3. Положить ;

4. Для вычислить матрицыи

5. Сформировать матрицу

6. Ввести заведомо относящиеся к паузе данные длительностью ;.

7. Для выполнить:

7.1. Ввести вектор значений обрабатываемого отрезка сигнала ;

7.2. Вычислить вектор

7.3.Для вычислить;

8. Для вычислить

9. Для вычислить;

10. Вычислить и;

11. Ввести значение вероятности ложной тревоги ;

12. Выполнить итерации по определению порога:

12.1. Положить

12.2. Вычислить

12.3. Вычислить

12.4. Если то положитьи прекратить итерации;

12.5. В противном случае при положить,если же выполняется неравенство, то положить, положитьи перейти к выполнению 11.2;

13. Задать длительность , предназначенных для сжатия за счёт обнаружения и кодирования пауз данных;

14. Ввести предназначенные для обработки данные ;

15. Задать шаг смещения вдоль отрезка обрабатываемых данных К, такой, что отношениеявляется целым числом;

16. Положить ;

17. Для выполнить:

17.1. Положить ;

17.2. Вычислить вектор

17.3. Для вычислить;

17.4. Вычислить

17.5. Если , то принимается решение о наличии в анализируемом отрезке данных, порождаемых звуками речи, полагаетсяи при выполнении условиявыполняются предыдущие операции, начиная с подпункта 17.1, а при выполнении неравенствавычисления заканчиваются.

В противном случае (неравенство не выполняется) принимается решение о принадлежности анализируемого отрезка данных паузе и выполняются следующие действия:

17.6. Если на предыдущем этапе (предыдущемk) не принималось решения о наличии паузы то началу новой паузы присваивается код,, а длительности присваивается значение,где- номер итерации при которой обнаружено началоn-той паузы в обрабатываемой совокупности данных. Если же и на предыдущем этапе отрезок анализируемых данных был отнесен к паузе номеромn, то код начала паузы не изменяется, а длительность увеличивается на величину шага смещения, то есть вычисляется;

17.7. Полагается и при выполнении условиявыполняются предыдущие операции, начиная с подпункта 17.1, а при выполнении неравенствавычисления заканчиваются.

18. Конец.

2. Оценка эффективности работы алгоритма кодирования пауз в данной работе осуществляется аналогично предыдущей.

По результатам выполнения работы заполните таблицу 6.1. И дайте сравнительный анализ результатов работы данного алгоритма и технологии VAD, реализованной в лабораторной работе №5.

Таблица 6.1.

VИС, отсчетов

VБП, отсчетов

Ксж

поп

лоп

Диалог

Слитная речь