Лекция. Hearsay-II система понимания речи: интеграция знаний для разрешения неопределенности

Lee D. Erman, Frederick Hayes-Roth, Victor R. Lesser, D. Ray Reddy

Система Hearsay-II, разработанная в рамках проекта DARPA, это исследовательская система, разработанная с целью показать возможности решения специфических проблем понимания речи, а также возможности координации независимых процессов в рамках кооперативного поведения, направленного на решение проблем. Речевые звуки есть следствие множества последовательных трансформаций от намерения, через семантические и синтаксические структуры, к речевой волне. В случае понимания речи осуществляется обратный процесс: от речевой волны – к пониманию намерения автора речевого сообщения. На каждом этапе понимания возникают неясности и неопределенности.

Более традиционные подходы к распознаванию речи основаны на использовании статистических моделей из теории передачи информации для определения корреляционной связи между сегментами. Подход, базирующийся на знаниях, потребовал существенного пересмотра методов обработки неопределенности.

В работе [Erman et al., 1980] перечислены следующие требования, которым должна удовлетворять эффективно работающая система распознавания речи, основанная на знаниях.

(1) Из всех возможных последовательностей операций (частных решений) хотя бы одна должна приводить к корректной интерпретации.

(2) Процедура анализа имеющихся вариантов интерпретации должна давать корректному варианту более высокую оценку, чем другим конкурирующим вариантам. Другими словами, правильная интерпретация с учетом произношения должна быть оценена выше, чем другие варианты интерпретации, не учитывающие особенностей индивидуальной дикции.

(3) Вычислительные ресурсы (память и время вычислений), необходимые для отыскания правильной интерпретации, не должны превышать определенный порог. Система распознавания, которая через пару дней выдаст результат, пусть и правильный, и потребует памяти объемом несколько гигабайт, вряд ли кому-нибудь будет нужна.

В приведенном списке первое и третье требования в определенной мере противоречат друг другу. Для того чтобы корректное решение изначально присутствовало в пространстве гипотез, на стадии формирования гипотез поневоле приходится быть довольно расточительным, что при большом словаре может привести к комбинаторному взрыву элементов решений. Выход может быть найден только при использовании чрезвычайно остроумных эвристик. Таким образом, важнейшей предпосылкой достижения успеха в создании такой системы является разработка подходящей процедуры оценки вариантов (второе из перечисленных выше требований).

В основу организации систем этого типа положена следующая идея [Corkill, 1991]. Представьте себе группу экспертов, которые сидят возле классной доски (или большой доски объявлений) и пытаются решить какую-либо проблему. Каждый эксперт является специалистом в какой-то определенной области, имеющей отношение к решению проблемы. Формулировка проблемы и исходные данные записаны на доске. Эксперты пытливо вглядываются в то, что написано на доске, и каждый из них думает над тем, чем он может помочь в решении проблемы. Если кто-либо из экспертов чувствует, что ему есть что сказать по этому поводу, он выполняет соответствующие вычисления и записывает результат все на той же доске. Этот новый результат может позволить и другим экспертам внести определенный вклад в решение проблемы.

Процесс прекращается (а эксперты расходятся по домам), когда проблема будет решена. Такая методика совместного решения проблем будет эффективна, если соблюдаются определенные соглашения, а именно: все эксперты должны говорить на одном и том же языке, хотя при записи результатов на доске могут использоваться и разные схемы обозначений; должен существовать какой-то протокол определения очередности "выступлений", который вступает в силу в ситуации, когда сразу несколько экспертов хватаются за мел и направляются к доске.

1 / 51 2 3 4 5 > Следующая >>>

Соседние файлы в папке inform

#
08.06.201591.95 Кб77Лекция 21.docx
#
08.06.2015712.19 Кб78Лекция 21.ppt
#
08.06.20151 Mб84Лекция 22.ppt
#
08.06.2015792.06 Кб46Лекция 3.ppt
#
08.06.2015137.43 Кб120Лекция 31.docx
#
08.06.2015232.42 Кб25Лекция 3a.docx
#
08.06.20151.55 Mб29Лекция 3а.ppt
#
08.06.201518.2 Mб51Лекция 4.doc
#
08.06.201518.24 Mб55Лекция 4.ppt
#
08.06.2015615.42 Кб31Лекция вводная.ppt