Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по ОРД.doc
Скачиваний:
45
Добавлен:
13.04.2015
Размер:
1.4 Mб
Скачать

2. Восстановление пауз

При восстановлении пауз на участки идентифицированные как паузы и каким-либо образом закодированные, добавляются к сигналу в соответствии с сохраненными данными. Причем при восстановлении пауз можно заполнить отрезки, соответствующие паузам постоянным (средним) значением, но для заполнения периодов молчания рекомендуется генерировать комфортный шум, поскольку «гробовая» тишина ассоциируется у слушателя скорее с неисправностью аппаратуры, чем с паузой в разговоре.

Для иллюстрации результатов следует привести графики фрагментов исходного сигнала, сигнала без пауз и сигнала с восстановленными паузами, а также записать соответствующие wav-файлы для оценки эффективности работы алгоритма «на слух».

Пример.

На рисунке 5.2. показаны сигналы (фрагмент лекции, записанный на диктофон) – исходный (красный) и с восстановленными после кодирования паузами (синий), наложенный на него. При восстановлении, для наглядности, паузы заполнялись нулями, т.о. хорошо видны отрезки сигнала (красный график), которые при кодировании были идентифицированы как паузы.

Рис. 5.2.

На рисунке 5.3. показан пример обработки одного слова «аппроксимация».

Рис. 5.3.

Из рисунка видно, что данный алгоритм определяет паузы не только между отдельными фразами, как в предыдущем примере, но и внутри одного слова. Но необходимо иметь в виду, что в составе речи присутствуют корот­кие фонемы, соответствующие взрыв­ным звукам – г, к, п, б, д и т.п., длительность которых не превышает 20...25 мс. Срезание таких фо­нем нежела­тельно, так как это может снизить раз­борчивость речи. Кроме того энергия невокализованных звуков (глухие согласные ф, х, ш, с и т. д.) мала и незначительно отличается от энергии шума (паузы). Поэтому имеет смысл ограничить длительность фрагмента, идентифицируемого как пауза, неким минимальным значением (например, паузы могут быть закодированы и удалены только если их длительность не менее 200-700 мс)

3. Оценка эффективности работы алгоритма кодирования пауз

Оценка эффективности работы алгоритма подобного рода достаточно сложна. Один из подходов к решению данной задачи состоит в вычислении вероятностей правильного и ложного обнаружения пауз и коэффициента сжатия.

1. Вычисление оценки вероятности правильного обнаружения паузы проводится на достаточно большом (не менее 10N)участке сигнала заведомо относящегося к паузедлинойNпаузаотсчетов по формуле

,

где Dнеп– количество значений величин энергииРне превышающихпорогН,N– количество отсчетов на одном участке анализа.

2. Вычисление оценки вероятности ложного обнаружения паузы проводится на на достаточно большом (не менее 10N)участке сигнала заведомо относящегося к речидлинойNречьотсчетов по формуле

,

где Dп– количество значений величин энергииРпревышающихпорогН.

3. Вычисление коэффициента сжатия осуществляется по формуле (5.1)

По результатам выполнения работы заполните таблицу 5.1.

Таблица 5.1.

VИС, отсчетов

VБП, отсчетов

Ксж

поп

лоп

Диалог

Слитная речь