- •Практикум (лабораторный)
- •1.2. Частотный анализ в базисе Фурье
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •3. Расчет распределения энергий отрезков сигнала по частотному диапазону
- •4. Анализ распределения энергий звуков по частотному диапазону
- •5. Исследование спектрограммы фрагмента фразы
- •6. Сопоставительный анализ полученных результатов
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •3. Сопоставительный анализ полученных результатов
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •1. Вычисление вектора субполосного преобразованияна основе использования банков ких-фильтров
- •2. Обратное субполосное преобразование (синтез)на основе использования банков ких-фильтров
- •3. Оценка влияния элайзинга на результат субполосного преобразования
- •4. Субполосное преобразование отрезка речевого сигнала методом, основанным на использовании базиса собственных векторов матрицы субполосного анализа
- •Контрольные вопросы к защите
- •4.2. Выбор порядка модели авторегрессии
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •Контрольные вопросы к защите
- •Способ оценки результатов
- •Лабораторная работа №5. Исследование методов обнаружения и кодирования пауз в речевых сообщениях (технология vad) Требования к содержанию, оформлению и порядку выполнения
- •Теоретическая часть
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •1. Кодирование пауз
- •2. Восстановление пауз
- •3. Оценка эффективности работы алгоритма кодирования пауз
- •Контрольные вопросы к защите
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •Контрольные вопросы к защите
- •Способ оценки результатов
- •Расчетно-графическое задание. Прототип информационной технологии сжатия речевых данных
Контрольные вопросы к защите
В чем заключается сущность метода сжатия речевых данных за счет обнаружения пауз основанном на принципе учета отличий распределения энергии речевого сигнала по частотному диапазону, соответствующего звуку, по сравнению с распределением энергии сигнала в паузе?
Какая решающая функция используется в данном методе?
Каким образом выбирается порог h?
Способ оценки результатов
Оценка производится по зачетной системе.
Зачет за выполнение лабораторной работы ставится за правильно выполненную работу и правильные ответы на контрольные вопросы. Не зачитывается работа в том случае, если не выполнено хотя бы одно из заданий работы, или при выполнении допущены грубые ошибки.
Расчетно-графическое задание. Прототип информационной технологии сжатия речевых данных
На современном этапе развития общества наблюдается непрерывное увеличение объемов речевых данных в общем потоке информации, циркулирующем в ИТС.
В связи с этим возникает необходимость решения задачи обеспечения высокой эффективности их хранения и передачи. Одним из путей решения данной задачи может стать разработка методов сжатия речевых данных, применение которых позволит значительно сократить объем их битового представления, и, как следствие, уменьшить скорость их передачи по каналам связи, а также ресурсы памяти при их записи на физические носители, при сохранение приемлемого качества их воспроизведения.
Уменьшение объема битового представления речевых данных может быть достигнуто посредством кодирования пауз, объем которых во время диалога может достигать 50%, а также за счет сжатия собственно звуков речи.
Таким образом, в основу информационной технологии сжатия речевых данных могут быть заложены алгоритмы:
дискретизации и интерполяции;
линейного предсказания;
субполосного преобразования;
квантования по уровню.
В качестве итоговой работы по циклу лабораторных работ данной дисциплины предлагается создать прототип информационной технологии сжатия речевых данных.
Прототип информационной технологии сжатия речевых данных должен включать процедуры кодирования паузисжатия собственно звуков речи. Методы и алгоритмы реализации данных процедур выбираются на усмотрение студентов.
Процедура кодирования пауз может быть реализована с помощью технологии VAD (детектор активности речи), или на основе обнаружения пауз, за счет более тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области.
Процедура сжатия собственно звуков речи может быть реализована на основе методов линейного предсказания, квантования по уровню непосредственно речевых данных, квантования по уровню результатов субполосного преобразования.
В качестве результатов работы должны быть представлены:
функциональная схема информационной технологии;
краткое описание процедур и алгоритмов;
обоснование выбора параметров исходных данных и процедур преобразования данных;
результаты работы информационной технологии (оценка коэффициента сжатия речевых данных, оценка качества воспроизведения речи).