Архитектура системы

В несколько упрощенном виде архитектура системы HEARSAY-II представлена на рис. Стрелки, направленные от уровней доски объявлений к источникам знаний, указывают, данные какого уровня изменяют выполнение условий, специфицированных в источнике знаний. Стрелки в обратном направлении указывают, на какой уровень помещает данные тот или иной источник знаний. Ответвление от стрелки "действия" источника знаний к монитору доски объявлений означает, что изменение данных, выполненное одним источником знаний, фиксируется в мониторе и затем используется планировщиком для активизации другого источника знаний.

Рис. 3. Упрощенная структурная схема системы HEARSAY-II. Здесь в овалах - программные модули, в прямоугольниках – базы данных, непрерывные стрелки – потоки данных, прерывистые – управляющие потоки.

Самое главное отличие архитектуры с доской объявлений от всех, рассмотренных ранее, заключается в том, что такая система не диктует проектировщику определенный режим управления знаниями в системе, например нисходящую или восходящую стратегию построения рассуждений. В той области, для которой создавалась система HEARSAY-II, можно применять и нисходящую стратегию — строить гипотезы о словах, а затем искать подтверждения этим гипотезам на уровне фонем, а можно и восходящую — собирать гипотезы о фонемах и формировать по ним гипотезы о словах. Какой источник знаний будет активизирован, определяется монитором и планировщиком системы, а это решение можно сделать или независимым от предметной области, т.е. от соответствующих источников знаний, или зависимым от них. Здесь архитектура системы никак не связывает разработчика в выборе проектного решения.

Пример распознавания

Введение в пример

Система работает в предметной области ответов на вопросы при поиске документов из коллекции рефератов статей по компьютерным наукам. Например распознавания фраз:

«Which abstracts refer to theory of communication?»

«List those articles»

«What has McCarthy written since nineteen seventy-four».

Словарь системы содержит 1011 слов, включая все словоформы. Грамматика является контекстно-свободной и включает рекурсии. Грамматика устроена так, что семантические и прагматические ограничения содержатся прямо в грамматике. Так вместо просто категории «имя», грамматика системы включает такие категории как: «тема», «автор», «год» и «издатель». Такие грамматики называются семантическими грамматиками. В этой грамматике за каждым словом может следовать 17 других слов из словаря. В обычной грамматике коэффициент ветвления значительно выше – 51 в среднем, а за такими общеупотребимыми словами как «об», «на» может следовать до 300 слов.

Работу системы рассмотрим на примере распознавания последовательности «ARE ANY BY FEIGENBAUM AND FELDMAN?» Каждый основной шаг системы, как правило, соответствует действию одного источника знаний.

Речевая волна фразы представлена на рис. 5а. Правильные границы слов, определенные экспертами представлены на рис 5b. Остальные уровни рис 5 представляют гипотезы, порожденные источниками знаний. Каждая гипотеза представлена прямоугольником. Горизонтальная позиция прямоугольника означает место в последовательности. Гипотезы сгруппированы по уровням: сегменты, слоги, слова, последовательности слов и фразы. Связи между гипотезами не показаны. Обработка показана в терминах последовательности временных шагов, где каждый шаг опосредует одно принятие решение одним из источников знаний. Внутри каждой гипотезы предшествующий колонке номер означает время, когда была создана гипотеза. Символ, следующий за колонкой, именует гипотезу. На лексическом уровне и выше звезда (*), следующая за символом, означает, что гипотеза корректна. Следующий номер внутри гипотезы означает ранг релевантности в диапазоне от 0 до 100.

Рис. 5а. Пример последовательности . (a) речевая волна фразы «Are any by Feigenbaum and Feldman?»; (b) правильные слова (для ссылок); (c) сегменты; (d) классы слогов; (e) слова (созданные MOW); (f) слова (созданные VERIFY); (g) последовательности слов; (h) фразы.

Название источника знаний следует за номером гипотезы. Звездочка, следующая за названием источника знаний говорит о том, что все гипотезы, одновременные с одним стимулом, правильны. Одиночные символы в скобках после гипотез характеризуют их релевантность. Времена даны в сотых долях секунды; таким образом, длительность всей последовательности – 2,25 сек. – представлена как 225. Если даны время начала и конца гипотезы, они разделяются двоеточием (например, 52:82). Правильные гипотезы маркируются звездочкой.

Пример

Речевая последовательность записана среднего качества близкорасположенным (в гарнитуре) микрофоном в условиях среднего шума (>65 dB). Речевой сигнал отфильтрован фильтром низкой частоты и оцифрован с частотой 10 kHz 9-битным кодом. Четыре акустических параметра (называемых ZAPDASH), полученных простым алгоритмом, выделены прямо на входном сигнале. Эти параметры получались в реальном времени и использовались для детектирования начала/конца последовательности.

<<< < Предыдущая 1 2 3 45 / 55

Соседние файлы в папке inform

#
08.06.201591.95 Кб77Лекция 21.docx
#
08.06.2015712.19 Кб78Лекция 21.ppt
#
08.06.20151 Mб85Лекция 22.ppt
#
08.06.2015792.06 Кб46Лекция 3.ppt
#
08.06.2015137.43 Кб120Лекция 31.docx
#
08.06.2015232.42 Кб25Лекция 3a.docx
#
08.06.20151.55 Mб29Лекция 3а.ppt
#
08.06.201518.2 Mб52Лекция 4.doc
#
08.06.201518.24 Mб55Лекция 4.ppt
#
08.06.2015615.42 Кб31Лекция вводная.ppt