- •Морфологический анализ
- •Синтаксический анализ текста
- •Предикатная структура – локальное семантическое представление предложения текста
- •Семантическая сеть – глобальное представление текста
- •Прагматика текста
- •3.5.1. Цепочка предикатных структур предложений текста как сценарий, описанный в тексте
- •3.5.2. Шаблоны ситуаций
- •3.5.3. Понимание текста как его интерпретация в терминах цепочек предикатных структур
- •Построение дерева зависимостей
- •1. Правило модиф_прил
- •2. Правило нар_прил
- •3. Правила для наречий сравнительной степени сравн_степень
- •3.3.3. Выявление предикатной структуры предложения
1. Правило модиф_прил
Два контактно стоящих слова С1 и С2, где лемма С1 принадлежит множеству {"такой", "самый"}, а С2 – полное прилагательное, согласованное с С1 по роду, числу и падежу.
Главное слово — прилагательное.
2. Правило нар_прил
Наречие + прил/причастие (полное или краткое).
Примеры: очень красивый, весьма полезный, особенно хорош.
Главное слово — прилагательное.
3. Правила для наречий сравнительной степени сравн_степень
Два контактно стоящих Наречие + Прил. сравнительной степени.
Примеры: гораздо сильнее; значительно больше.
Главное слово — прилагательное.
Установление иерархии между сегментами
В зависимости от типа сегментов и типа подчинительного союза можно осуществлять несколько операций над ними: подчинение (1), однородность (2), импликация (3), присоединение (4). Для этого существуют соответствующие правила. Например, правило для подчинения имеет следующий вид.
1. Если type_sg=5 (причастный оборот) и нет согласованного с причастием синтаксического существительного, анализируем предыдущий сегмент на наличие такого. В случае обнаружения согласованного существительного устанавливаем указатель *Hoz на найденное существительное из предыдущего сегмента, поскольку это слово является главным для причастного оборота сегмента в случае его вложенности. Указатель *Sosed устанавливаем на сегмент, которому принадлежит слово Hoz, связи с сегментом Sosed тип связи между сегментами type_sv=1.
2. Если type_sg=6 (причастный или деепричастный оборот), анализируем в контактно расположенных сегментах наличие глагола. Поскольку деепричастие – самостоятельная часть речи, которая обозначает добавочное действие, объединяет в себе свойства глагола и наречия и показывает, каким образом, почему, когда совершается действие, вызванное глаголом-сказуемым, то главным словом для сегмента-деепричастного оборота является глагол. Устанавливаем указатель *Hoz на найденный ближайший глагол, указатель *Sosed на соответствующий сегмент и присваиваем type_sv=1.
3. Если Flag=1 (в начале сегмента стоит союзное слово "который", "чей", "какой"), то союзное слово согласуется с синтаксическим существительным предыдущего сегмента по роду и числу. Указатель *Hoz устанавливается на найденное существительное, указатель *Sosed — на предыдущий сегмент, присваиваем type_sv=1.
4. Если type_sg=6 и сегмент содержит прилагательное и не содержит согласованного с ним синтаксического существительного по роду, числу и падежу.. В этом случае проверяем предыдущий сегмент на согласованное существительное с прилагательным. Если оно найдено, имеем случай обособленного определения. Указатель *Hoz устанавливается на найденное существительное, указатель *Sosed — на предыдущий сегмент, присваиваем type_sv=1.
Процедура первичного семантического анализа на конкретном примере
Рассматривается предложение:
Если (1) семантический (2) актант (3) лексемы (4) — некоторое (5) значение (6), отличное (7) от (8) значения (9) самой (10) лексемы (11) и (12) переменное (13) в (14) том (15) смысле (16), что (17) в (18) разных (19) предложениях (20) с (21) лексемой (22) значение (23) разное (24), то (25) семантическая (26) валентность (27) лексемы (28) — это (29) постоянное (30) внутреннее (31) свойство (32) самой (33) лексемы (34), обусловленное (35) значением (36) лексемы (37).
Для простоты изложения рассмотрим без морфологической омонимии. После обработки союзов имеем:
Если (1) семантический (2) актант (3) лексемы (4) — некоторое (5) значение (6), отличное (7) от (8) значения (9) самой (10) лексемы (11) и (12) переменное (13), в_том_смысле_что (14) в (15) разных (16) предложениях (17) с (18) лексемой (19) значение (20) разное (21), то (22) семантическая (23) валентность (24) лексемы (25) — это (26) постоянное (27) внутреннее (28) свойство (29) самой (30) лексемы (31), обусловленное (32) значением (33) лексемы (34).
Устанавливаем границы сегментов:
Таблица 3.6. Результаты начального заполнения структур типа Segment
type_sg |
L- R |
S_L |
S_R |
Flag |
first |
Segm [1]: Если семантический актант лексемы — некоторое значение |
|||||
ТИРЕ |
1-6 |
(1) «если» |
0 |
0 |
0 |
Segm [2]: отличное от значения самой лексемы и |
|||||
9 |
9-12 |
0 |
(12) «и» |
0 |
0 |
Segm [3]: переменное |
|||||
9 |
13-13 |
0 |
0 |
0 |
0 |
Segm [4]: в_том_смысле_что в разных предложениях с лексемой значение разное |
|||||
9 |
14-21 |
(14) «в_том_смысле_что» |
0 |
0 |
0 |
Segm [5]: то семантическая валентность лексемы — это постоянное внутреннее свойство самой лексемы |
|||||
ТИРЕ |
22-31 |
(22) «то» |
0 |
0 |
0 |
Segm [6]: обусловленное значением лексемы |
|||||
5 |
32-34 |
0 |
0 |
0 |
32 |
Ищем синтаксически связанные слова внутри каждого сегмента согласно правилам, приведенным выше и считаем вес сегмента. Результаты для слов, входящих в Segm [1] отображены в таблице 3.7.
Таблица 3.7. Результаты заполнения структур для Segm [1]
(i) /написание |
lem -лемма |
MI — грам. хар. |
next[] - массив зависимых слов от (i) |
pred - главное слово для (i) |
type - тип синтаксической связи с со словом pred |
(1) /если |
если |
союз |
0 |
0 |
0 |
(2) / семантический |
семантический |
Прил, им. п., ед. ч., м.р |
0 |
(3) /актант |
СОГЛ-ПРИЛ_СУЩ |
(3) / актант |
|
|
next[1]=(2) /семантический next[2]=(4) /лексемы |
(6) / значение |
ПОДЛ_СКАЗ |
(4) /лексемы |
лексема |
Сущ., род.п, ед. ч., ж.р |
0 |
(3) /актант |
ГЕНИТ |
(5)/ некоторое |
некоторый |
Прил., им.п., ед. ч., с.р. |
0 |
(6) значение |
СОГЛ-ПРИЛ_СУЩ |
(6) /значение |
значение |
Сущ., им.п, ед. ч., с.р. |
next[1]=(3) /актант next[2]=(5) /некоторое |
0 |
0 |
Имея заполненную таким образом структуру, можно получить состав сегмента.
(3) ПОДЛ_СКАЗ (6)
СОГЛ-ПРИЛ_СУЩ ГЕНИТ СОГЛ-ПРИЛ_СУЩ
(2) (4) (5)
(2) зависит от (3), тип связи СОГЛ-ПРИЛ_СУЩ предполагает зависимое прилагательно ставить перед существительным. Получим порядок следования 2 3.
(3) — главное для (4), тип ГЕНИТ предполагает, что зависимое существительное следует после главного, имеем: 2 3 4.
(3) связано с (6) связью ПОДЛ_СКАЗ, тип сегмента — тире, следовательно, группа подлежащего стоит слева от тире, группа сказуемого — справа. Имеем: 2 3 4 6.
В свою очередь, (6) помимо (3) имеет подчиненное слово (5) с помощью связи СОГЛ-ПРИЛ_СУЩ, следовательно (5) должно стоять перед (6). Получаем в результате такой порядок следования 2 3 4 5 6.
После заполнения структур для всего предложения устанавливается иерархия между сегментами.
Так, S_R.Segm [2]=и Segm [3] содержит слово с теми же грам. характеристиками, что и одно из слов Segm [2], следовательно Sosed.Segm [3]=Segm [2], type_sv.Segm [3]=2.
В Segm [2] есть прилагательное, не согласованное ни с одним существительным этого сегмента, но согласованное с существительным (6) — «значение» — из Segm [1], следовательно Hoz.Segm [2]=(6), type_sv.Segm [2]=1.
В S_L.Segm [1]=(1) - «если» - и S_L.Segm [5]=(22) - «то» -, эти сегменты связаны подчинительным разрывным условным союзом, а значит, type_sv.Segm [5]=3, Sosed.Segm [5]=Segm [1].
В итоге имеем следующее дерево для сегментов:
Segm [1] (Импликация) Segm [5]
(подчинение) (подчинение)
Segm [2] (однородность) Segm [3] Segm [6]
(пояснение)
Segm [4]
где (пояснение) тип подчиненной связи между сегментами, соединенными подчиненным изъяснительным союзом (в нашем случае - «в_том_смысле_что»). Для этого вида связи Hoz (главное слово) для сегмента справа — последнее слово сегмента слева.