- •МГЛУ
- •Новые информационные технологии в лингвистике
- •Автоматическое распознавание речи
- •Процесс порождения речи
- •Процесс порождения речи у человека
- •Речевая волна во временной области
- •Речевая волна во временной и частотной областях
- •Речевая волна во временной и частотной областях
- •Представление речи в виде формантных траекторий
- •Перекрытие областей формантных частот
- •Положение центроидов основных гласных
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Колонка коры (по Батуеву А.С.)
- •Гиперколонка коры (по Батуеву А.С.)
- •Отдельные слова словарей раскладываются по
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Процесс восприятия речи человеком
- •Коммуникационный акт
- •Структура коммуникационной системы для организации речевого поведения
- •Структура коммуникационной системы для организации речевого поведения
- •Структура коммуникационной системы для организации речевого поведения
- •Информационно-кодовая модель коммуникации Шеннона и Уивера
- •Под распознаванием речи понимается выделение информации из преобразованного сигнала, полученного адресатом от адресанта
- •Правило Байеса
- •Правило Байеса
- •Правило Байеса
- •Правило Байеса
- •Правило Байеса
- •Информационно-кодовая модель коммуникации Шеннона и Уивера, модифицированная для коммуникационного акта Якобсоном
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Автоматическое распознавание речи
- •Акустико-фонетический подход
- •Акустико-фонетический подход
- •Акустико-фонетический подход
- •Подход, основанный на распознавании образов
- •Подход, основанный на распознавании образов
- •Подход, основанный на распознавании образов
- •Подход, основанный на распознавании образов
- •Подход на основе искусственного интеллекта
- •Подход на основе искусственного интеллекта
- •Подход на основе искусственного интеллекта
- •Подход, основанный на искусственных нейронных сетях
- •Подход, основанный на искусственных нейронных сетях
- •Нейронные сети
- •Первичная обработка
- •Спектральный анализ
- •Спектральный анализ
- •Спектральный анализ
- •Анализ на основе линейного предсказывающего кодирования
- •Анализ на основе линейного предсказывающего кодирования
- •Анализ на основе линейного предсказывающего кодирования
- •Анализ на основе линейного предсказывающего кодирования
- •Векторное квантование
- •Векторное квантование
- •Векторное квантование
- •Векторное квантование
- •Антропоморфная модель анализа
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Психоакустическое сглаживание спектра
- •Принятие решения
- •Принятие решения
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Динамическое программирование
- •Правило Байеса
- •Правило Байеса
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Стандартный СММ распознаватель
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Скрытые Марковские модели
- •Реализация и использование систем распознавания речи
- •Реализация и использование систем распознавания речи
- •Промышленные системы распознавания речи Стандартная система распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Промышленные системы распознавания речи
- •Диалог человека и машины
- •Диалог человека и машины
- •Диалог человека и машины
- •Диалог человека и машины
- •Сравнение эффективности распознавания человеком и искусственными системами
- •Сравнение эффективности распознавания человеком и искусственными системами
- •Сравнение эффективности распознавания человеком и искусственными системами в условиях шума
Психоакустическое сглаживание спектра
73
Психоакустическое сглаживание спектра
Сравнение обычного и перцептивного ЛП
Метод перцептивного линейного предсказания 5-го порядка, позволяет получить формантные кривые такие же гладкие, как и
стандартный ЛП-кодер 13 порядка
74
Принятие решения
1.Динамическое программирование
2.Байесовское правило
3.Скрытые Марковские модели
75
Принятие решения
Ключевым вопросом в распознавании |
|
речи является вопрос сравнения |
|
входного образа с эталонными |
|
образами с целью выяснения степени |
|
их подобия |
|
Обычно входной и эталонный образы |
|
имеют разную длину |
|
Сравниваемые образы не могут быть |
|
нормализованы по длительности, |
|
поскольку различные типы звуков |
|
имеет различные возможности по |
|
удлинению произнесения |
|
Необходимо найти способ сравнения |
|
спектральных векторов такой, чтобы |
|
можно было вычислять глобальную |
75 |
меру совпадения образов. |
Динамическое программирование
76
Динамическое программирование
Процедура динамического программирования сводится к нелинейному нормированию во времени двух развертывающихся во времени речевых процессов - входного и эталонного речевых событий.
При обучении некоторым образом формируются эталонные |
|
образы слов в виде последовательности векторов |
|
E e(1),e(2,...,e(N )) |
e(N) |
параметров речевого сигнала |
. Каждый |
вектор описывает речевой сигнал на интервале наблюдения, длительность которого обычно выбирается равной среднему периоду основного тона, равному 15 мсек.
77
Динамическое программирование
При распознавании последовательность входных векторов
Rn r(1),r(2),..., r(M ) |
сравнивается с эталонной |
|
|
||||
последовательностью на плоскости, вдоль осей которой |
|
||||||
откладываются входная R и эталонная E |
|
|
|||||
|
|
|
|
A c(1),c(2),...,c(k)...,c(K ) |
|
|
|
последовательности. Последовательность точек |
|
|
|||||
c(k) (m(k),n(k)) |
, где |
|
m(k),n(k) |
|
|
||
c(K ) (M , N ) |
, и |
– точки |
|
||||
|
|
|
, |
|
|
||
на осях, соответствующие сравниваемым векторам |
|
|
|||||
параметров последовательностей, задает функцию |
|
||||||
деформации, определяющую временное согласование |
|
||||||
e(n) |
r(m) |
|
|
|
|
|
|
сравниваемых образов. |
|
|
|
|
|||
d(m,n) |
ВNкачестве меры расхождения между векторами |
|
|||||
| ei (n) ri (m) | |
|
|
|
|
|||
признаков |
|
|
|
|
|
|
|
и |
i 1 |
вводится расстояние между ними, например, |
78 |
Динамическое программирование
В качестве меры расхождения между векторами признаков e(n) иr(m) вводится расстояние между ними, например,
|
N |
|
|
d(m,n) | ei (n) ri (m) | |
|
|
i 1 |
|
гдеei (n) иr (m) |
– компоненты векторовe(n) r(mи) |
, |
i |
|
|
соответственно.
Взвешенная сумма расстояний для функции деформации:
K |
|
D(A) d(c(k))w(k) |
|
k 1 |
|
где w(k) – весовой коэффициент |
79 |
Динамическое программирование
80
Динамическое программирование
81