Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по ОРД.doc
Скачиваний:
45
Добавлен:
13.04.2015
Размер:
1.4 Mб
Скачать

4. Анализ распределения энергий звуков по частотному диапазону

Для выполнения задания необходимо определить количество формант и их частоты (т.е. частотные области, в которых сосредоточены максимальные доли энергии сигнала). Полученные результаты занести в таблицу 1.4.

Таблица 1.4.

Номер форманты и значение частоты (Гц)

Звук

1

2

n

5. Исследование спектрограммы фрагмента фразы

Для выполнения задания необходимо построить спектрограммы звукосочетаний выбранных в задании 3 данной лабораторной работы. Результаты сравнить с линейным кратковременным спектром, построенным в задании 3.

Для построения спектрограммы можно воспользоваться программой Adobe Audition(см. описание в теоретической части работы), либо стандартной функцией программного приложенияMATLAB.

Для вычисления спектрограммы в системе MATLABслужит функция specgram:

В = specgram( x, Nfft, Fs, window, numoverlap)

Здесь:

х - вектор сигнала (сигнал не может быть многоканальный),

Nfft- ис­пользуемая размерность дискретного преобразования Фурье,

Fs- частота дис­кретизации в герцах,

window- вектор отсчетов весовой функции (размер этого вектора определяется длительностью сегментов, на которые разбивается сигнал),

numoverlap- величина перекрытия соседних сегментов (в отсчетах).

Обязательным входным параметром является только вектор значений х, остальные параметры имеют значения по умолчанию, которые используются, если значения последних параметров опущены.

Выходной параметр В – матрица, столбцы которой являются комплексными спектрами отдельных сегментов сигнала.

Пример

Ниже приведен листинг программы, реализующей алгоритм построения спектрограмм для звукосочетаний приведенных в задании 3:

[x_ish,Fs,bits]=wavread('имя_файла.wav'); % загрузка файла

% x_ish – вектор отсчетов исходного сигнала

% Fs - частота дискретизации

% bits - количество бит на один отсчет сигнала

Nf=1024;% количество точек Фурье (задается самостоятельно)

Nt=512;% длинна окна анализа (задается самостоятельно)

n1=51174; %нижняя граница отрезка анализа (задается самостоятельно)

n2=51612; % верхняя граница отрезка анализа

X1=x_ish(n1:n2); % отрезок сигнала, соответствующий звуку

N=512; % количество точек ДПФ

specgram(X1, N, Fs)

colormap gray % серый фон

Результаты работы данной программы показаны на рис. 1.11 и 1.12.

Рис. 1.13. спектрограмма отрезка сигнала, соответствующего звуку «И»

На рисунке отчетливо видны четыре формантные частоты, которые отображаются яркими полосами. Они соответствуют значениям частот максимумов энергий, полученных для того же отрезка сигнала в задании 3 (рис. 1.10).

6. Сопоста­вительный анализ полученных результатов

Для выполнения задания необходимо провести сопоставительный анализ различных звуков в смысле распределения энергии отрезков сигнала по частотному диапазону.

Контрольные вопросы к защите

  1. В чем различие механизмов формирования гласных и согласных звуков?

  2. Каким образом могут быть определены численные значения формантных частот?

  3. Что такое форманта?

  4. Какими параметрами характеризуются форманты гласных звуков?

  5. Какими параметрами характеризуются форманты согласных звуков?

  6. Сколько формант имеют звуки русской речи?

  7. Есть ли отличия в формантной структуре у ударных и безударных гласных звуков?

Способ оценки результатов

Оценка производится по зачетной системе.

Зачет за выполнение лабораторной работы ставится за правильно выполненную работу и правильные ответы на контрольные вопросы. Не зачитывается работа в том случае, если не выполнено хотя бы одно из заданий работы, или при выполнении допущены грубые ошибки.

Лабораторная работа №2. Исследование временных и частотных характеристик звуков речи

Требования к содержанию, оформлению и порядку выполнения

Отчет о выполнении лабораторной работы должен содержать все выполненные задачи и ответы на контрольные вопросы.

Теоретическая часть

В данной работе рассматривается вариационный метод частотного анализа речевых сигналов.

В настоящее время в большинстве алгоритмов процедура анализа частотных характеристик реализуется на основе алгоритма быстрого преобразования Фурье (БПФ) с равноразнесенными частотами анализа.

Рассмотрим новый метод вычислений долей энергии отрезков речевых сигналов, соответствующим заданным частотным диапазонам. Основная суть метода заключается в следующем.

Пусть компоненты вектора представляют собой значения некоторого сигнала (функции времени)

. (2.1)

Трансформанта Фурье отрезка отсчетов сигнала (вектора), в качестве области определения которой естественно рассматривать (нормированная частота)

, (2.2)

Из равенства Парсеваля нетрудно получить долю энергии отрезка сигнала, соответствующую частотному интервалу

(2.3)

Если в правую часть соотношения (2.3) подставить определение (2.2), то в результате преобразований получим

, (2.4)

где – симметричная матрица, элементы которой определяются

(2.5)

Таким образом, долю энергий отрезка сигнала в любом частотном интервале можно вычислить на основе представления (2.4), не вычисляя при этом соответствующую трансформанту Фурье. Матрицу вида естественно называть субполосной матрицей.

Вычисления для полного набора частотных интервалов

Полным набором называется совокупность частотных интервалов

(2.6)

которые полностью покрывают всю частотную ось.

Если при вычислениях долей энергии отрезка речевого сигнала вида (2.1) во всех частотных интервалах, например в случае вычислений спектрограмм, основываться непосредственно на квадратичных формах вида (2.4), то объем реализуемых вычислений будет пропорционален величине , то есть слишком большим.

При многократной реализации вычислений с одним и тем же набором частотных интервалов и длительностей обрабатываемых отрезком данных целесообразно использовать следующий подход.

Для всех введём обозначения

,

причём справедливы аналоги представления (2.4)

, (2.7)

где ;

, (2.8)

где

Пусть далее – матрица собственных векторов матрицы

, (2.9)

такая , что выполнятся соотношение

где

,

причём предполагается упорядочение собственных чисел по убыванию

.

Положим

.

Тогда представление (2.7) нетрудно преобразовать к виду

. (2.10)

Вычисления показывают, что выбор количества слагаемых в (2.10) на основе соотношения

, (2.11)

при выполнении условия

позволяет на основе соотношения (2.10) оценивать доли энергии отрезков сигналов с погрешностями, не превышающими нескольких сотых долей процента.

При равноразнесенных интервалах анализа выражение (2.11) имеет вид

Тогда вычисление всей совокупности долей энергии отрезка сигнала потребует порядка вычислительных операций типа «умножение», что может быть существенно меньше чем правая часть (2.4).

Для вычислений можно составить блочную матрицу вида

, (2.12)

где ,.

Далее следует вычислить вектор

. (2.13)

Тогда с заданной точностью выполняется равенство

. (2.14)

Таким образом, основой вычислений полного набора долей энергии отрезка сигнала могут служить соотношения (2.13) и (2.14).