Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
33
Добавлен:
10.05.2014
Размер:
58.37 Кб
Скачать

Семантический анализ текста

Задача СЕА: преобразование синт. структуры предложения, полученной на этапе СИА, в форматы некоторого семантического языка, т.е. осуществление перехода от поверхностного «оформления» факта ПрО к его логико-смысловому значению.

На вход СЕА предложение поступает в виде списка пар слов исх.предложения, соединенных синт. отношениями.Результатом СЕА является семантический граф.Этап СЕА состоит из 2 фаз:

1.СЕА слов с МУ: для них всегда можно указать ссылку на эл-ты семантич. сети, обработка зависит от МУ. Слова с МУ делятся на группы: 1) предикаты действия (отраж ситуацию в реальном мире); 2) функциональные предик. (операторы над пред.);

3) пустые пред. (глаголы-связки («быть»), пустые глаголы («осуществить») и фазовые глаголы (начинать, заканчивать), модальные глаголы (мочь, должен, хотеть).

2.СЕА слов без МУ: семантика данных ИГ (слов без МУ) определяется в зависимости от контекста. ПОЭТ: в сем. сеть добавляются новые вершины, связываемые отношениями «быть элементом» и «быть значением».

Обобщенный алгоритм СЕА: 1. Классиф. вх. слов. на группы с учетом способа предст. инф. (декларативный/процедурный), организации словарн. инф. (предик, понятия, хар-ки и т.д.)

2. Перенос предик, комплетивных и обстоят. отнош. на слово, явл. предикатом действия. 3. Выбор канонич. формы сл. с МУ. 4. Замена синт.отношений (СИО), вх. в МУ на сем. отнош. и проверка замены по сем. сети на правильность. 5. Обработка обстоят. СИО как вспомогат. информ. к предикату действия. Инф-ция оформляется в виде спец. таблиц (напр., табл. времен). 6. Заполение всех актантов МУ соотв. словами вх. предложения, т.е. понятиями. 7. При наличии в запросе парам., треб. обр. к БД, форм. запросы к БД. 8. После обработки слов с МУ синт. стр. вх. предлож. разбивается на ряд поддеревьев, сост. именную группу, и далее обработка ИГ как слов без МУ.

88

Задача синтаксич. анализа заключается в том, чтобы, используя морфологическую информацию о словоформах и сведения из словаря, построить синтаксическую структуру предложения (входного высказывания).Синтаксическая структура отражает связи между отдельными словами предложения. Для ее описания используются деревья зависимостей.

Пусть x – произвольная непустая цепочка словоформ, X –мн-во точек x, т. е. вхождений словоформ в цепочку. Произвольное бинарное отношение  на X, при котором граф <, X> является деревом, называют отношением зависимости (подчинения). Само дерево <, X> является деревом зависимости для x. Для рус.яз. нет универс. алгоритмов СИА из-за его сложности, однако существуют некот.общие подходы. (на примере СИА с-мы ПОЭТ)

1.Устанавливаются предикативные [между подлежащим и сказуемым], комплетивные [при которых зависимый компонент словосочетания является необходимым добавлением, без которого господствующее слово не обладает достаточной информативностью], обстоятельственные синтаксические отношения.Выделяются словоформы, не входящие в обороты.Это основной уровень предложения.

2.Среди этих словоформ устанавливаются предикаты, т.е. словоформы имеющие модель управления

3.Для каждого предиката из синтаксической зоны МУ выделяются соответствующие ему групповые, индивидуальные и ядерные МУ. 4. Для каждой индив МУ опр-ся список кандидатов, кот удовл треб МУ в падеже, семан категориях, части речи.5.Инфа о найденных отношениях запоминается.6.С пом отсеивающих фильтров устраняются все словоформы, кот не могут быть слугами для предиката и осуществляют формирование матрицы кандидатов для каждого столбца каждой индив МУ.7.устанав-ся обстоятельс и определительные синтаксич.отношения.8.После обработки словоформ основного уровня - аналогично обр. сл. более глуб уровней.9.Результат – на вход семантического унализа (СЕА), в виде дерева разбора. Пример реализации этапа СИА:

Сколько камен(ого) угл(я) перевезен(о) жел..жн(ым) транспорт(ом) в 2010 год(у)? 92

Общение (коммуникативное взаимодействие, диалог) – процесс достижения его участниками определенных согласованных целей путем обмена связанными высказываниями, выраженными, выраженными в языке, о некотором реальном/гипотетическом мире (проблем обл). Если диалог между пользователем и ЭВМ, то общение – процесс обмена взаимосвязанными высказываниями, выраженными в языке, направл на достижение целей пользователя (на удовлетвор его информ потребностей). Высказывания участников общения образуют связанный текст (дискурс), имеющий сложную структуру.

3 аспекта общения в СОЗ: 1.виды общения пользователя (режим консультации (основной режим), режим приобретения знаний, объяснение (почему принято такое решение). 2.формы общения пользователей (язык общения): ЕЯ, формальный/искусственный язык, многооконная графика, гипертекстовые ср-ва, система меню. 3.возможности подсистемы объяснений: установки степени помощи, ретроспективные объяснения, встроенные объяснения.

Классификация пользователей. На начальном этапе непосредств. взаимодействие с ЭВМ осуществляли только программисты; специалисты др областей – потребители результатов, полученных на ЭВМ, выступали в роли косвенных конечных пользователей (общались с ЭВМ через программистов). По мере расширения сферы исп ЭВМ конечные пользователи стали вовлекаться в процесс непосредственного взаимод с ЭВМ. Это привело к появлению массовой категории пользователей – прямых конечных пользователей, раб в диалоговом режиме (специалисты в различ проблем областях). Как правило, эти пользователи не обладают знаниями в области электронной обработки данных и не умеют программировать, их называют неподготовленные конечные пользователи.

90

Общение (коммуникативное взаимодействие, диалог) есть процесс достижения его участниками определенных согласованных целей путем обмена связанными высказываниями, выраженными в языке, о некотором реальном или гипотетическом мире (ПрО).

Обобщенная схема ИДС представляется в виде 3 базовых компонентов: диалоговый комп. ([ведение диалога], [формирование или обработка перехватов инициативы]), комп. понимания высказываний ([анализ высказываний], [интерпретация высказываний]), комп. генерации высказываний ([генерация смысла высказываний],[синтез высказываний]). (1 <-> 2 и 1<->3 на схеме)

Задача ведения диалога состоит в том, чтобы обеспечивать целесообразные действия с-мы на текущем шаге диалога (шаг диалога состоит из действия и реакции, где высказывание активного участника – действие, а пассивного – реакция). Формирование перехв.инициативы. происходит в тех случаях, когда с-ма определяет, что текущая ситуация не соотв. ситуации, предусм. структурой диалога. Если же перехват осуществляет пользователь, с-ма должна его обработать – распознать наличие, определить новую тему (цель) и перейти на структуру диалога, соответствующую новой теме. Ведение диалога выполняется по 1 из 2 схем: 1.Диалог ведет пользователь.Инициатива в основном (за исключением сообщений об ошибках) находится у пользователя, а с-ма только реагирует на его требования. Функции ДК практически вырождены.

2.Диалог ведет с-ма. Инициатива принадлежит с-ме.Она ведет диалог в соответствии с имеющимися у нее представлениями о структуре диалога (т.е. о разбиении задач на подзадачи и о том, кто из участников, когда и какую из них решает).

Понимание выск. – выделения смысла входного выск. и выражение его на внутр. языке с-мы. Делится на 2 этапа: анализ (выделение сущностей, упомянутых в выск.) и интерпретацию (отображение входного выск. на знания с-мы).

Генерация выск. : ген. смысла (определение смысла во внутр.представлении) и синтез высказывания (преобразование смысла в высказывание на ЕЯ).

96

ЕЯ – это язык, который не требует для своего понимания (изучения) никаких правил и инструкций. Подъязык – это язык некоторой группы людей, общающихся в конкретной ПрО с конкретными целями. Язык расслаивается на малые языковые подсистемы – подъязыки.

Из всех подъязыков наиб важным (приемлемым) языком человеко-машинного общения (взаимодействия) является деловая проза.

Деловая проза – языковой носитель отношений человека в сфере производства. Это ЕЯ, ограниченный по семантике – лишенный ораторских, эмоциональных и других приемов.

Относительная полнота. Подъязык, обслуживающий некоторую ПрО, обладает достаточным набором языковых средств для обознач любого факта из этой области.

Замкнутость.При дополнении к обозримой выборке текстов подъязыка других текстов того же подъяз. не происходит пополнения словаря и грамматики.

Конечность. Подъязык имеет конечный и ограниченный словарь.

Формальная ограниченность В подъязыке ограничен набор грамматических средств и конструкций из общеязыкового арсенала.

Устойчивость Для понимания входных текстов подъязыка несущественны поверхностно‑синтаксич различия текстов с тождественным смыслом.

94

Формальная постановка задачи создания ИДС.

Задача организации общения (диалога) сводится к построению некоего отображения 

1) отображение : вх  вых

вх – мн‑во входных текстов подъязыка обслуживающего конкретную проблемную область (подъязык – язык группы людей, общающихся в конкретной проб. области)

вых – мн‑во команд доступа к БД(в случае общения с БД) или мн‑во вызовов прикладных программных модулей (если речь идет о диалоговом решении задач в ЭС или расчетных системах)..

2) Процесс понимания (обработки) вх.текста - это построение совокупности трех отображений

*: *j  j (анализ). Переход от знака к его денотату <тому, что наблюдается, экст. концепт-смысл>.

**: j  **j (семантич. интерпр.) трансляция в термины ЯПЗ данной с-мы. От денотата - к концепту

***: **j  i (прагматическая интерпретация) трансляция в реакцию, вид которой определяется целями ИДС.

Обобщенная схема ИДС: 3 компоненты: диалоговая комп. (ведение диалога, формирование или обработка перехватов инициативы), комп. понимания высказываний (анализ высказываний, интерпретация высказываний), комп. генерации высказываний (генерация смысла высказываний, синтез высказываний). (1 <-> 2 и 1<->3 на схеме)

Задача ведения диалога состоит в том, чтобы обеспечивать целесообразные действия с-мы на текущем шаге диалога. Формирование перехв.инициативы. происходит в тех случаях, когда с-ма определяет, что текущая ситуация не соотв. ситуации, предусм. структурой диалога.

Понимание выск. – выделения смысла входного выск. и выражение его на внутр. языке с-мы.Делится на 2 этапа: анализ(выделение сущностей, упомянутых в выск.) и интерпретацию(отображение входного выск. на знания с-мы).

Генерация выск. : ген. смысла (определение смысла во внутр.представлении) и синтез высказывания (преобр.смысла в высказывание на ЕЯ).

98

Соседние файлы в папке Интеллектуальные диалоговые системы