- •Практикум (лабораторный)
- •1.2. Частотный анализ в базисе Фурье
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •3. Расчет распределения энергий отрезков сигнала по частотному диапазону
- •4. Анализ распределения энергий звуков по частотному диапазону
- •5. Исследование спектрограммы фрагмента фразы
- •6. Сопоставительный анализ полученных результатов
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •3. Сопоставительный анализ полученных результатов
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •1. Вычисление вектора субполосного преобразованияна основе использования банков ких-фильтров
- •2. Обратное субполосное преобразование (синтез)на основе использования банков ких-фильтров
- •3. Оценка влияния элайзинга на результат субполосного преобразования
- •4. Субполосное преобразование отрезка речевого сигнала методом, основанным на использовании базиса собственных векторов матрицы субполосного анализа
- •Контрольные вопросы к защите
- •4.2. Выбор порядка модели авторегрессии
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •Контрольные вопросы к защите
- •Способ оценки результатов
- •Лабораторная работа №5. Исследование методов обнаружения и кодирования пауз в речевых сообщениях (технология vad) Требования к содержанию, оформлению и порядку выполнения
- •Теоретическая часть
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •1. Кодирование пауз
- •2. Восстановление пауз
- •3. Оценка эффективности работы алгоритма кодирования пауз
- •Контрольные вопросы к защите
- •Общая постановка задачи
- •Методические указания к выполнению работы
- •Контрольные вопросы к защите
- •Способ оценки результатов
- •Расчетно-графическое задание. Прототип информационной технологии сжатия речевых данных
1.2. Частотный анализ в базисе Фурье
Для реализации частотного анализа можно воспользоваться дискретным прямым (1.1) и обратным (1.2) преобразованиями Фурье для одномерного массива xдлиныNопределяются следующим образом:
Для вычисления трансформант Фурье необходимо определить вещественную (косинусную) и мнимую (синусную) части. Тогда амплитуда определяется по формуле 1.3, фаза по 1.4 и энергия по формуле 1.5.
Общая постановка задачи
1. Записать речевой материал своего голоса компьютер.
2. Исследовать осциллограммы произнесенных фраз и звуков.
3. Выполнить расчет распределения энергий отрезков сигнала по частотному диапазону.
4. Проанализировать распределение энергий звуков по частотному диапазону.
5. Исследовать характеристики основного тона.
6. Исследовать спектрограмму для фрагмента фразы.
7. Выполнить сопоставительный анализ полученных результатов.
Методические указания к выполнению работы
1. Записать речевой материал своего голоса компьютерможно использовать как стандартную программу звукозаписиWindows, так какую-либо специализированную систему звукозаписи, напримерAdobeAudition(см. описание в теоретической части работы).
Для выполнения лабораторной работы необходимо записать фразу, в которой содержатся различные звуки: шипящие, свистящие, звонкие согласные, гласные и т.д., например «Чтобы я делал без высшего образования?». (Все звуки в фразе необходимо проговаривать четко, с хорошей артикуляцией)
2. Исследование осциллограммы произнесенных фраз и звуковможно так же произвести в системеAdobeAudition.
Для выполнения задания необходимо выполнить разбиение полученной осциллограммы на отдельные фрагменты, соответствующие элементарным звукам или звукосочетаниям (фонемам) и заполнить таблицу 1.2.
Таблица 1.2.
звук |
Начало звука (номер отсчета) |
Окончание звука (номер отсчета) |
Длинна звука (отсчетов) |
|
|
|
|
Пример
В записанном звуковом файле, определяем (как можно точнее) начало того или иного звука и его окончание. Это можно сделать прослушивая фрагменты сигнала в системе AdobeAudition.
При выделении фрагмента звуки соответствующие данные отображаются в рабочей области и их можно занести в таблицу. При этом необходимо установить единицу измерения горизонтальной оси «Samples» (рис. 1.4).
Пример сегментации приведен в таблице 1.3 и на рис. 1.7-1.8:
Таблица 1.3.
звук |
Начало звука (номер отсчета) |
Окончание звука (номер отсчета) |
Длинна звука |
И |
50885 |
51685 |
800 |
Ч |
39234 |
40000 |
766 |
…. |
…. |
…. |
…. |
пауза |
60826 |
64253 |
3427 |
…. |
…. |
…. |
…. |
А |
45519 |
46470 |
951 |
Рис. 1.7. Выделение отрезка, соответствующего звуку «И»
Рис. 1.8. Выделение отрезка, соответствующего звуку «Ч»
3. Расчет распределения энергий отрезков сигнала по частотному диапазону
Для выполнения задания необходимо выполнить расчет распределения энергий отрезков сигнала по частотному диапазону для двух вокализованных (ударного и безударного) звуков, четырех невокализованных (взрывного, щелевого, сонанта, аффриката) звуков (см. табл. 1.1 в разделе 1.1.3), а так же для участка молчания, т.е. паузы.
Расчет выполняется в базисе Фурье.
По результатам расчета привести осциллограммы выбранных отрезков сигнала и графики распределения энергий по частотному диапазону.
Пример
В данном УМК все приведенные в курсе лабораторных работ листинги программ выполнены в программной среде MATLAB.
Ниже приведен листинг программы, реализующей алгоритм расчета трансформант Фурье (1.1) и вычисление значений энергии отрезка сигнала (1.5).
[x_ish,Fs,bits]=wavread('имя_файла.wav'); % загрузка файла
% x_ish – вектор отсчетов исходного сигнала
% Fs - частота дискретизации
% bits - количество бит на один отсчет сигнала
Nf=1024;% количество точек Фурье (задается самостоятельно)
Nt=512;% длинна окна анализа (задается самостоятельно)
n1=50885; %нижняя граница отрезка анализа (задается самостоятельно)
n2=n1+Nt-1; % верхняя граница отрезка анализа
X1=x_ish(n1:n2); % отрезок сигнала, соответствующий звуку
P1=zeros(1,Nf); %задание нулевого вектора энергии отрезка
for k=1:Nf
Re1(k)=0;
Im1(k)=0;
for j=1:Nt
Re1(k)=Re1(k)+X1(j)*cos(pi*(j-1)*(k-1)/Nf);%вещественная часть
Im1(k)=Im1(k)+X1(j)*sin(pi*(j-1)*(k-1)/Nf);%мнимая часть
end
P1(k)=(Re1(k)^2+Im1(k)^2)/Nt; %вычисление энергии, сосредоточенной в отрезке
end
%----- отображение полученных результатов на графике
f=[0.0001:Fs/(2*Nf):Fs/2]; % формирование значений частот по оси абцисс
figure(1), plot (f,X1);% построение графика отрезка сигнала
figure(2), plot(f,P1);% построение графика распределения энергии
Результаты работы данной программы показаны на рис. 1.9 и 1.10.
Рис. 1.9. Спектрограмма отрезка сигнала, соответствующего звуку «А»
Рис. 1.10. Распределение энергии отрезка сигнала, соответствующего звуку «А»