Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
inform / Лекция 3a.docx
Скачиваний:
25
Добавлен:
08.06.2015
Размер:
232.42 Кб
Скачать

Лекция. Hearsay-II система понимания речи: интеграция знаний для разрешения неопределенности

Lee D. Erman, Frederick Hayes-Roth, Victor R. Lesser, D. Ray Reddy

Система Hearsay-II, разработанная в рамках проекта DARPA, это исследовательская система, разработанная с целью показать возможности решения специфических проблем понимания речи, а также возможности координации независимых процессов в рамках кооперативного поведения, направленного на решение проблем. Речевые звуки есть следствие множества последовательных трансформаций от намерения, через семантические и синтаксические структуры, к речевой волне. В случае понимания речи осуществляется обратный процесс: от речевой волны – к пониманию намерения автора речевого сообщения. На каждом этапе понимания возникают неясности и неопределенности.

Более традиционные подходы к распознаванию речи основаны на использовании статистических моделей из теории передачи информации для определения корреляционной связи между сегментами. Подход, базирующийся на знаниях, потребовал существенного пересмотра методов обработки неопределенности.

В работе [Erman et al., 1980] перечислены следующие требования, которым должна удовлетворять эффективно работающая система распознавания речи, основанная на знаниях.

(1) Из всех возможных последовательностей операций (частных решений) хотя бы одна должна приводить к корректной интерпретации.

(2) Процедура анализа имеющихся вариантов интерпретации должна давать корректному варианту более высокую оценку, чем другим конкурирующим вариантам. Другими словами, правильная интерпретация с учетом произношения должна быть оценена выше, чем другие варианты интерпретации, не учитывающие особенностей индивидуальной дикции.

(3) Вычислительные ресурсы (память и время вычислений), необходимые для отыскания правильной интерпретации, не должны превышать определенный порог. Система распознавания, которая через пару дней выдаст результат, пусть и правильный, и потребует памяти объемом несколько гигабайт, вряд ли кому-нибудь будет нужна.

В приведенном списке первое и третье требования в определенной мере противоречат друг другу. Для того чтобы корректное решение изначально присутствовало в пространстве гипотез, на стадии формирования гипотез поневоле приходится быть довольно расточительным, что при большом словаре может привести к комбинаторному взрыву элементов решений. Выход может быть найден только при использовании чрезвычайно остроумных эвристик. Таким образом, важнейшей предпосылкой достижения успеха в создании такой системы является разработка подходящей процедуры оценки вариантов (второе из перечисленных выше требований). 

В основу организации систем этого типа положена следующая идея [Corkill, 1991]. Представьте себе группу экспертов, которые сидят возле классной доски (или большой доски объявлений) и пытаются решить какую-либо проблему. Каждый эксперт является специалистом в какой-то определенной области, имеющей отношение к решению проблемы. Формулировка проблемы и исходные данные записаны на доске. Эксперты пытливо вглядываются в то, что написано на доске, и каждый из них думает над тем, чем он может помочь в решении проблемы. Если кто-либо из экспертов чувствует, что ему есть что сказать по этому поводу, он выполняет соответствующие вычисления и записывает результат все на той же доске. Этот новый результат может позволить и другим экспертам внести определенный вклад в решение проблемы.

Процесс прекращается (а эксперты расходятся по домам), когда проблема будет решена. Такая методика совместного решения проблем будет эффективна, если соблюдаются определенные соглашения, а именно: все эксперты должны говорить на одном и том же языке, хотя при записи результатов на доске могут использоваться и разные схемы обозначений; должен существовать какой-то протокол определения очередности "выступлений", который вступает в силу в ситуации, когда сразу несколько экспертов хватаются за мел и направляются к доске.

Соседние файлы в папке inform