- •МГЛУ
- •Новые информационные технологии в лингвистике
- •Автоматическое распознавание речи
- •Процесс порождения речи
- •Процесс порождения речи у человека
- •Речевая волна во временной области
- •Речевая волна во временной и частотной областях
- •Речевая волна во временной и частотной областях
- •Представление речи в виде формантных траекторий
- •Перекрытие областей формантных частот
- •Положение центроидов основных гласных
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Колонка коры (по Батуеву А.С.)
- •Гиперколонка коры (по Батуеву А.С.)
- •Отдельные слова словарей раскладываются по
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Коммуникационный акт
- •Структура коммуникационной системы для организации речевого поведения
- •Структура коммуникационной системы для организации речевого поведения
- •Структура коммуникационной системы для организации речевого поведения
- •Информационно-кодовая модель коммуникации Шеннона и Уивера
- •Под распознаванием речи понимается выделение информации из преобразованного сигнала, полученного адресатом от адресанта
- •Правило Байеса
- •Правило Байеса
- •Правило Байеса
- •Правило Байеса
- •Правило Байеса
- •Информационно-кодовая модель коммуникации Шеннона и Уивера, модифицированная для коммуникационного акта Якобсоном
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Акустико-фонетический подход
- •Акустико-фонетический подход
- •Акустико-фонетический подход
- •Подход, основанный на распознавании образов
- •Подход, основанный на распознавании образов
- •Подход, основанный на распознавании образов
- •Подход, основанный на распознавании образов
- •Подход на основе искусственного интеллекта
- •Подход на основе искусственного интеллекта
- •Подход на основе искусственного интеллекта
- •Подход, основанный на искусственных нейронных сетях
- •Подход, основанный на искусственных нейронных сетях
- •Нейронные сети
- •Первичная обработка
- •Спектральный анализ
- •Спектральный анализ
- •Спектральный анализ
- •Анализ на основе линейного предсказывающего кодирования
- •Анализ на основе линейного предсказывающего кодирования
- •Анализ на основе линейного предсказывающего кодирования
- •Анализ на основе линейного предсказывающего кодирования
- •Векторное квантование
- •Векторное квантование
- •Векторное квантование
- •Векторное квантование
- •Антропоморфная модель анализа
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Принятие решения
- •Принятие решения
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Правило Байеса
- •Правило Байеса
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Стандартный СММ распознаватель
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Реализация и использование систем распознавания речи
- •Реализация и использование систем распознавания речи
- •Промышленные системы распознавания речи Стандартная система распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Диалог человека и машины
- •Диалог человека и машины
- •Диалог человека и машины
- •Диалог человека и машины
- •Сравнение эффективности распознавания человеком и искусственными системами
- •Сравнение эффективности распознавания человеком и искусственными системами
- •Сравнение эффективности распознавания человеком и искусственными системами в условиях шума
Векторное квантование
Блок-схема векторного квантования, включающая обучающую и классифицирующую компоненты
63
Векторное квантование
ВК формирует из обучающего множества векторов признаков , которые предполагаются хорошо аппроксимирующими все возможное множество векторов признаков, формируемых на входе ВК при произнесении всех возможных вариантов слов словаря системы всеми дикторами. Обучающий ВК алгоритм определяет оптимальное множество кодовых книг векторов признаков, такое, что средняя дисперсия, получаемая при замене любого вектора обучающего множества на его кодовую
книгу , является минимальной.
64
Векторное квантование
65
Антропоморфная модель анализа
Психоакустическое сглаживание спектра
К основным свойствам психоакустического восприятия человека относятся следующие два.
Во-первых, нелинейная деформация физических шкал частоты и интенсивности в перцептивные шкалы барков и громкости. Спектр исходного сигнала преобразуется в значения выходов гребенки фильтров, каждый из которых интегрирует значения спектра во всем диапазоне, взвешенные некоторой функцией с максимумом на центральной частоте фильтра и убывающей к краям. Центральные частоты фильтров распределены неравномерно по шкале частот и расстояния между ними увеличиваются с увеличением
частоты. Это преобразование шкалы частот в шкалу |
|
барков, являющуюся линейной для восприятия речи. |
66 |
|
Психоакустическое сглаживание спектра
Во-вторых, разделение непрерывного спектра на небольшое число полос с интеграцией значений спектра в
этих полосах. Выходы фильтров умножаются на
коэффициенты, получаемые на основе так называемой кривой равной громкости и подвергаются извлечению кубического корня, что учитывает различия в восприятии амплитуды сигнала на различных частотах и преобразует шкалу интенсивности в шкалу громкости. Перцептивно сглаженный спектр мощности сигнала восстанавливается затем при помощи линейной интерполяции между выходами фильтров.
Метод перцептивного линейного предсказания 5-го порядка, позволяет получить формантные кривые такие же гладкие, как и стандартный ЛП-кодер 13 порядка.
67
Психоакустическое сглаживание спектра
68
Психоакустическое сглаживание спектра
Частотные отклики базилярной мембраны кошки (по Ghitza [7])
69
Психоакустическое сглаживание спектра
Формирование рецептивного поля
70
Психоакустическое сглаживание спектра
Рецептивное поле. Центр, в данном случае of-центр, образует небольшая группа рецепторов, имеющих мощные возбуждающие синапсы с одиночной биполярной клеткой. Одна или несколько таких клеток соединены с ганглиозной клеткой, формируя ее центр. Периферию рецептивного поля
биполярной клетки создает значительно большее число 79 рецепторов), соединенных с горизонтальной клеткой возбуждающими синапсами.
Психоакустическое сглаживание спектра
Амплитуды откликов модели внутреннего уха (по Ghitza [7])72