Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пролог.doc
Скачиваний:
15
Добавлен:
10.11.2018
Размер:
1.44 Mб
Скачать

6.5. Модель непосредственных составляющих

Модель непосредственных составляющих фактически является надстройкой над формальными грамматиками. Эта модель приближенная и обладает ограниченными возможностями.

Рассмотрим эту модель на примере:

((Онегин, добрый (мой приятель)), (родился на (брегах Невы))).

Каждая составляющая заключена в скобках и представляет собой простую семантическую конструкцию. Составляющие могут находиться в следующих отношениях:

Di<Dj – i-я сост. левее j-й, либо одна входит в другую DiDj

Рассмотрим свойства этих отношений.

A) [(DD1)(DD2)]→[(D1D2)(D2D1)] – скобочная структура должна быть «правильной».

B) D0, что DD0. Очевидно, что D0 – все предложение.

Свойства A и B фактически определяют отношение , как древесный порядок (о бинарных отношениях []).

C) Di, Dj [(Di<Dj)(Dj<Di)(DiDj)(DjDi).], т.е. одно из этих отношений всегда присутствует между составляющими фразы.

Пример.

D0→D1D2

D1→Онегин, добрый D3

D2→родился на D4

D3→мой приятель

D4→брегах Невы

Получаем формальную грамматику (Σ, N, S, P), где

Σ – алфавит русского языка, включая знаки препинания,

N={D0, D1, D2, D3, D4},

S=D0

P – перечислены выше.

Каждому нетерминалу соответствует не просто произвольное понятие, а определенная грамматическая конструкция. Так, D0 – предложение, D1 – определение (определяемое понятие + само определение в формате признак и первичное понятие), D2 – действие в прошлом, D3 – первичное понятие для определения, D4 –группа дополнения.

Структуру модели можно изобразить в виде графа:

//изобразить граф (3)

6.6. Многозначность в естественных языках

На модели непосредственных составляющих легко видеть, что естественный язык, как правило является многозначным. Поясним на примере.

Пусть описана следующая конструкция:

ПРЕДЛ→ПОДЛ ГР-СКАЗ|ГР-СКАЗ ПОДЛ

ПОДЛ→отец|мать|дочь

ГР-СКАЗ→ГЛАГОЛ ДОП|ДОП ГЛАГОЛ|ГЛАГОЛ ГР-ДОП

ГЛАГ→любит|ценит

ДОП→дочь|мать

ГР-ДОП→свою ДОП

Примечание. Данный пример показывает, что одним из подходов к построению модели непосредственных составляющих является морфологический анализ, связывающий со словами и группами слов их морфологические характеристики (ПОДЛ – подлежащее, СКАЗ – сказуемое, ДОП – дополнение, ГР-СКАЗ – группа сказуемого, ГЛАГОЛ – глагол, ГР-ДОП – группа дополнения), тем более, что в настоящее время существует несколько методов, эффективно решающих данную задачу.

Приведем несколько примеров построения фраз с использованием приведенных правил.

A)

B)

C)

//Примеры в виде графов (4)

Таким образом, существует два способа порождения одного и того же предложения, но смысловые значения в обоих случаях разные.

6.7. Расширенные сети переходов

Модель расширенных сетей переходов разработал американский лингвист Вудс.

Сетью переходов называется ориентированный граф с помеченными вершинами и ребрами. Среди множества вершин выделяется начальная вершина и множество заключительных вершин. Часто вершины называют состояниями. На ребрах могут быть, как терминальные, так и нетерминальные пометки.

Пример. //пример сети переходов (5)

Здесь, предл. – начальное состояние, а заключительные состояния помечены *.

Анализ производится по следующему алгоритму.

  1. Изначально находимся в начальном состоянии.

  2. Пытаемся перейти в другие состояния. При этом если на ребре перехода содержатся нетерминальные пометки, то их раскрываем с помощью вершины, соответствующей этой нетерминальной пометке.

  3. Если фраза исчерпана и все текущие состояния – конечные, то цепочка принадлежит языку. Причем сам этап порождения фактически задает смысл фразы.

Пример. Два способа порождения фразы «Мать любит дочь».

A) B)

//пример (6)

A)

B)

Алгоритм анализа с помощью расширенных сетей переходов работает по схожему принципу с алгоритмами анализа контекстно-свободных грамматик (подробнее []).