Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
inform / Лекция 4.ppt
Скачиваний:
55
Добавлен:
08.06.2015
Размер:
18.24 Mб
Скачать

Векторное квантование

Блок-схема векторного квантования, включающая обучающую и классифицирующую компоненты

63

Векторное квантование

ВК формирует из обучающего множества векторов признаков , которые предполагаются хорошо аппроксимирующими все возможное множество векторов признаков, формируемых на входе ВК при произнесении всех возможных вариантов слов словаря системы всеми дикторами. Обучающий ВК алгоритм определяет оптимальное множество кодовых книг векторов признаков, такое, что средняя дисперсия, получаемая при замене любого вектора обучающего множества на его кодовую

книгу , является минимальной.

64

Векторное квантование

65

Антропоморфная модель анализа

Психоакустическое сглаживание спектра

К основным свойствам психоакустического восприятия человека относятся следующие два.

Во-первых, нелинейная деформация физических шкал частоты и интенсивности в перцептивные шкалы барков и громкости. Спектр исходного сигнала преобразуется в значения выходов гребенки фильтров, каждый из которых интегрирует значения спектра во всем диапазоне, взвешенные некоторой функцией с максимумом на центральной частоте фильтра и убывающей к краям. Центральные частоты фильтров распределены неравномерно по шкале частот и расстояния между ними увеличиваются с увеличением

частоты. Это преобразование шкалы частот в шкалу

 

барков, являющуюся линейной для восприятия речи.

66

 

Психоакустическое сглаживание спектра

Во-вторых, разделение непрерывного спектра на небольшое число полос с интеграцией значений спектра в

этих полосах. Выходы фильтров умножаются на

коэффициенты, получаемые на основе так называемой кривой равной громкости и подвергаются извлечению кубического корня, что учитывает различия в восприятии амплитуды сигнала на различных частотах и преобразует шкалу интенсивности в шкалу громкости. Перцептивно сглаженный спектр мощности сигнала восстанавливается затем при помощи линейной интерполяции между выходами фильтров.

Метод перцептивного линейного предсказания 5-го порядка, позволяет получить формантные кривые такие же гладкие, как и стандартный ЛП-кодер 13 порядка.

67

Психоакустическое сглаживание спектра

68

Психоакустическое сглаживание спектра

Частотные отклики базилярной мембраны кошки (по Ghitza [7])

69

Психоакустическое сглаживание спектра

Формирование рецептивного поля

70

Психоакустическое сглаживание спектра

Рецептивное поле. Центр, в данном случае of-центр, образует небольшая группа рецепторов, имеющих мощные возбуждающие синапсы с одиночной биполярной клеткой. Одна или несколько таких клеток соединены с ганглиозной клеткой, формируя ее центр. Периферию рецептивного поля

биполярной клетки создает значительно большее число 79 рецепторов), соединенных с горизонтальной клеткой возбуждающими синапсами.

Психоакустическое сглаживание спектра

Амплитуды откликов модели внутреннего уха (по Ghitza [7])72

Соседние файлы в папке inform