Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
inform / Лекция 3a.docx
Скачиваний:
25
Добавлен:
08.06.2015
Размер:
232.42 Кб
Скачать

Размерности проблемы: неопеделенности и гипотетические интерпретации

Первый источник трудностей в распознавании речи возникает в процессе говорения. В процессе трансляции намерения в речевую волну вносятся вариативности и шум. Если, например, мы учитываем семантический, синтаксический, лексический и фонетический уровни в формировании речевого сообщения, вариативности, возникающие при переходе с уровня на уровень, приводят к ошибкам концептуализации, грамматическим, выбора слова, а также – артикуляции. В добавок, речь часто прерывается паузами, посторонними звуками, случайными повторами. В результате звуковой сигнал нарушается и отличается от идеального, то есть такого, который продуцируется без упомянутых ошибок. Это и есть ошибка при производстве речи, а уровни, на которых возникает ошибка – источники ошибки. Первый источник ошибок – присущий механизму порождения речи человека.

Следующий источник ошибки относится к слушающему, который из воспринятой речевой волны извлекает, путем обратных трансформаций, исходную посылку. Он детектирует акустико-фонетические элементы, слоги, слова, синтаксические и концептуальные конструкции, соответствующие намерению говорящего. На каждом уровне он может внести свои ошибки, связанные с неверным восприятием, и или интерпретацией. Эти ошибки интерпретации возникают из-за неадекватных теоретических речевых моделей. Это ошибки, порожденные неправильностью восприятия. Чтобы избежать этих ошибок, система понимания речи должна порождать и оценивать множество гипотез интерпретации речевых фрагментов. Для понимания сообщения мы должны распознавать отдельные слова, а потом, выявлять их синтаксические и семантические связи. Гипотезы, таким образом, касаются, на одном полюсе, отдельных слов, а на другом – достаточно больших фрагментов сообщения. Оцениваются сразу несколько гипотез различных уровней абстракции. Например, гипотезы порождаются заменами «till-tell» в одном фрагменте, и «brings-rings» - в другом. Эти неопределенности порождаются на нижних уровнях интерпретации, например, на слоговом, или акустическом, и порождают множество гипотез интерпретации. А неопределенности на лексическом уровне порождают неопределенности на более высоких уровнях. Так мы имеем четыре интерпретации фразы:

till Bob rings, tell Bob rings, till Bob brings, tell Bob Brings.

Но только одна гипотеза нижнего уровня может быть включена в интерпретацию верхнего уровня. А фраза состоит из последовательности слов, а слово – из последовательности слогов, а слог – из последовательности фонетических сегментов. И полная интерпретация входной последовательности должна включать синтаксический или семантический анализ, что предполагает рекурсивное включение каждого элемента каждого уровня на каждом последовательном временном сегменте. Таким образом, возникает иерархия гипотез, где гипотезы нижних уровней поддерживают гипотезы более высоких уровней.

Существует также понятие вероятности, или правдоподобия гипотез, которая влияет на окончательную интерпретацию сообщения. Одни гипотезы оказываются более предпочтительными пред другими. В результате мы получаем следующий уменьшающий неопределенность решающий метод: целью решающей системы является наиболее вероятная общая интерпретация. Наиболее общие операции решателя при этом: генерация, комбинирование и оценивание. На этапе генерации гипотез необходимо построить как можно более общую интерпретацию, добавляя как можно больше ограничений из источников знаний различных уровней. Эти ограничения уменьшают неопределенности, как на уровне данных, так и на уровне источников знаний.

Выполнение трех требований позволяет построить эффективный решатель:

  1. Только одна последовательность применения источников знаний может быть корректной.

  2. Выбирается только одна правильная общая интерпретация.

  3. Стоимость принятия решения ограничивается разумными пределами. Что ведет к ограничениям на число частичных интерпретаций. Чем больше неопределенность, тем больше должно порождаться гипотез. Тем лучше должно быть качество выбора из имеющихся гипотез.

Соседние файлы в папке inform