- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
3.3. Примеры понятий и их кодовых обозначений
3.3.1. Примеры понятий для уровня основных сем
На первом этапе классификации выделяются 7 классов, в скобках приводятся предлагаемые для них обозначения:
НЕЧТО (a): МЕСТО (e), ОБЪЕКТ (o), ЖИВОТНОЕ (A), ОТНОШЕНИЕ (u), ИНФОРМАЦИЯ (E), ИДЕЯ (i), СОЗНАНИЕ (O).
Приведем примеры таких понятий:
A) «птица», «щука», «рыба», «дворник», «зять», «доктор» и т.д.;
o) «утюг», «ручка», «шкаф», «чашка», «яблоко», «трава», «библиотека» и т.д.;
O) «сознание», «душа», «дух», «Бог», «эгрегор» и т.д.;
e) «парк», «гора», «долина», «река», «океан», «небо», «космос», «вселенная»;
E) «детектив», «трагедия», «визитка», «заметка»;
i) «мысль», «мнение», «понятие», «убеждение», «чувство», «желание», «зуд»;
u) «любовь», «связь», «помощь», «знание», «привычка», «использование».
3.3.2. Примеры понятий для валентностного уровня классификации
Далее на валентностном уровне классификация уточняется на основе принципов комбинаторики.
AA – СУЩЕСТВО СУЩЕСТВО: «чей-то доктор», «зять», «друг», «собеседник»
AAu – СУЩЕСТВО СУЩЕСТВО ОТНОШЕНИЕ: «чей-то помощник», «руководитель», «советчик», «учитель в чем-то»
Ao – СУЩЕСТВО ОБЪЕКТ: «создатель»
Au – СУЩЕСТВО ОТНОШЕНИЕ: «мастер чего-то», «профессионал в чем-то»
uAAu – ОТНОШЕНИЕ СУЩЕСТВО СУЩЕСТВО ОТНОШЕНИЕ: «помощь кого-то», «кому-то в чем-то», «уговоры», «руководство», «обучение», «приказ»
uAAo – ОТНОШЕНИЕ СУЩЕСТВО СУЩЕСТВО ПРЕДМЕТ: «получение», «продажа»
uAo – ОТНОШЕНИЕ СУЩЕСТВО ПРЕДМЕТ: «использование», «создание», «ремонт»
uAu – ОТНОШЕНИЕ СУЩЕСТВО ОТНОШЕНИЕ: «любовь кого-то к чему-то», «желание», «умение», «попытка кого-то что-то сделать»
uAI – ОТНОШЕНИЕ СУЩЕСТВО ИДЕЯ «понимание кем-то чего-то», «знание», «размышления о» и т.д.
3.3.3. Примеры понятий уровня локализации
Третий этап классификации уточняет представленные выше семы при помощи понятий, означающих положение в пространстве: «ИЗ», «В», «НА», «У».
Ao(Azzo) – «жилец», «проживающий в»
oo(obbA) – «орган», «голова», «рука», «сердце»
oA(oddA) – «инъекция», «пища», «суп», «яблоко», «ананас», «сок»
o(oggo) – «одежда», «покрывало», «одеяло», «шапка», «сапоги»
oA(obbo) – «деталь», «гайка», «ручка»
oA(otto) – «содержимое», «начинка», «фарш»
Ea – «книга», «газета», «роман», «детектив»
uAu – «попытка что-то сделать»
uAAu – «помощь кого-то кому-то в чем-то»
-
Семантический код описания смысла
3.4.1. Кодировка сочетаний групп слов
Первые три уровня деления слов на подклассы обеспечивают выделение групп слов, синтагматически сочетающихся друг с другом. Взяв по одному слову из каждой группы, можно с большой степенью вероятности получить осмысленное сочетание слов – синтагму. Эти группы представляют собой иерархию слов и понятий следующего вида, где ? – неопределенный символ.
? - have
ll? - swallow
lly - eat
?(L (uAo (bb))) - take
mm – drink
nny – breath with
nn (uAO) – smoke
ll – food
? (uAO) – medicine
ll (uAO) – pills
mm – a drink
mm (uAO) – mixture
nny – air
nn (uAO) – cigarette
Каждой букве кодировки соответствует та или иная сема, например, nn – малая устойчивость (газ), mm – средняя устойчивость (жидкость), ll – высокая устойчивость (твердое тело). Знак (uAO) означает действие на сознание. Знак (L(uAo(bb))) означает позитивное действие на тело и т. д. Синтагмы записываются в форме подстановочной таблицы.
Таблица 3.2.
Подстановочная таблица, содержащая синтагму ДЕЙСТВИЕ \\ НАД ЕДОЙ – СУЩНОСТЬ \\ ЕДА
ДЕЙСТВИЕ \\ НАД ЕДОЙ |
СУЩНОСТЬ \\ ЕДА |
have хАЕв есть, пить |
food фУ:д пища |
taste тейст пробовать |
dish дИш блюдо |
eat И:т есть |
soup сУ:п суп |
cook кУ:к готовить |
garnish гА:ниш гарнир |
fry фрАй жарить |
salad сАЕлэт салат |
boil бОил варить |
sandwich сАЕнВИч сандвич |
roast рОуст тушить |
sausage сОсидж колбаса |
can кАЕн консервировать
|
ice-cream Айс-крИ:м мороженное |
salt сОлт засолить
|
bread брЕд хлеб |
cut кАт резать |
cake кЕйт торт |
serve сЭ:в сервировать |
meat мИ:т мясо |
drink дрИнк пить |
fish фИш рыба |
make мЕйк заваривать |
poultry пАултри дичь |
boil бОил кипятить |
egg Ег яйцо |
|
caviare кАЕвиэ икра |
|
fruit фрУ:т фрукт |
|
citrus сИтрэс цитрус |
|
vegetable вЕджетэбэл овощь |
|
greenery грИ:нэри зелень |
|
onion Аниэн лук |
|
mushroom мАшрУ:м гриб |
|
nut нАт орех
|
|
berry бЕри ягода |
|
cereals сИ:риэлз злаки |
|
noodles нУ:длз лапша |
|
drink дрИнк напиток |
|
milk мИлк молоко |
|
juice джУ:с сок |
|
tea тИ: чай |
|
coffee кОфи кофе |
|
mineral water мИнэрэл-ВОтэ минеральная вода |
|
lemonade лЕмэнейд лимонад |
|
alcohol АЕлкэхэл алкоголь |
|
beer бИэ пиво |
|
wine ВАйн вино |
В таблице 3.2 показана подстановочная таблица, задающая синтагму
ДЕЙСТВИЕ С ЕДОЙ – ЕДА, например, сочетания слов «пить сок» и «готовить суп».
Вычисления в такой подстановочной таблице происходят следующим образом: слово с формулой p1p2…pn сочетается со словом с формулой t1t2…tn, если для любой pi=ti или pi=? Или ti=?. То есть, если все соответствующие символы в неких формулах равны, или хотя бы один из символов не определен, то они определяют понятия, сочетание которых возможно. Подстановочные таблицы со встроенной программной обработкой вектора признаков каждого слова будем называть Smart – таблицами.
Доказательством работоспособности предложенной классификации служит компьютерная программа, генерирующая предложения на английском языке, использующая подстановочные таблицы, генерируемые в программе «Электронный словарь».