- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
1.4.4. Лексико-семантические варианты в языке и речи
В синхроническом плане слово в лексико-семантической системе представлено несколькими ЛСВ (лексико-семантическими вариантами) в речи - случаями, модификациями его системных значений [92]. Слово само по себе не имеет, как правило, одного конкретного значения. Слово получает каждое конкретное значение только под влиянием других слов, т е. в контексте [81]. По выражению Шехтмана Н. А.: «в тексте всегда есть знаки, функция которых состоит в том, чтобы указывать на элементы значения других знаков».
Новые значения формируются только в контексте, контекст обладает порождающей способностью. Контекст «вытягивает на поверхность один важный семантический компонент». Между тем различные лексико-семантические варианты слова являются во многом однородными и связанными друг с другом элементами одного значения с общим семантическим ядром. Если значения одинакового по форме слова не имеют ничего общего, то они являются не различными лексико-семантическими вариантами, а омонимами, для синонимов же характерен общий признак, элемент всех лексико-семантических вариантов:
Рассмотрим следующие предложения.
«Loos of blood killed the victim». (J. Dillon) – (буквально) «Потеря крови убила жертву».
«One poisoned beast could kill five others». (J. Aldridge) – (буквально) «Один зараженный зверь может убить пять других».
«I was driving a car and killed a little girl». (A. Hailey) – (буквально) «Я вел машину и убил маленькую девочку».
Здесь оттенки значений, так же как и перевод слова «kill», различны: «задавить, отравить, обескровить». Но при этом существует понятие, связывающее оттенки этих значений в одно понятие «стать причиной смерти».
Значения различных лексико-семантических вариантов слова связаны и могут пересекаться. Слово «cup» в английском языке может означать. в частности, приз или особый сосуд (кубок), при этом приз может быть представлен подобной чашей, а может и не быть, в последнем случае разные лексико-семантические варианты слова пересекутся. Существуют, кроме того, различные виды лексико-семантических вариантов. Так структура слова включает прямые (собственные) и переносные (вторичные) значения, например, «сон» в значении «смерть» и «песок» в значении «время».
Значения слова могут реализовываться как узуальные (принятые) и оказиальные (не принятые):
A car purred along the street. Здесь «мурлыкать» означает «двигаться» [64] Однако далее в работе показывается, что проблема семантического шума в речи объясняет многие явления речи, не прибегая к интерпретациям из области лексико-семантических вариантов. Например, употребление, казалось бы, разных значений в следующих предложениях может рассматриваться как проявление семантического шума на фоне одного базового значения слова «kill».
«The victim died because of loss of blood» – «Жертва умерла от потери крови».
«Five beasts could die because they poisoned one beast». – «Пять зверей могут умереть, потому что один зверь был отравлен».
«I ran over a little girl by my car. She died». – «Я сбил маленькую девочку на моей машине. Она умерла».
Эти предложения ассоциируются с подстановочными таблицами.
Таблица 1.2
Порождение предложений вида «Он умер в результате болезни» при помощи подстановочной таблицы
-
Существо
Отношение, выраженное глаголом (существование)
Предлог причины или времени
Действие над телом
Я
Жить
После
Травмы
Он
Умирать
В результате
Ушиба
Звери
Выживать
Из-за
Потери крови
Жертва
Спасаться
Ввиду
Болезни
В таблице 1.2 показано, как предложенные фразы могут быть описаны при помощи подстановочных таблиц.
Таблица 1.3
Порождение фраз вида «Лесничий сбил девочку на грузовике» при помощи подстановочной таблицы
-
Существо
Представление транспорта
Существо
На транспорте
Я
Подвезти
Ребенка
На машине
Ты
Сбить
Девочку
На трамвая
Мой брат
Переехать (покалечить, / убить)
Мальчика
На грузовике
Лесничий
Заехать за
Босса
На велосипеде
В подстановочной таблице 1.3. задается множество предложений, описывающих структуры, которые часто интерпретируют как особые лексико-семантические варианты слов.
Чтобы воспользоваться подстановочными таблицами, необходимо взять по одному слову из каждой колонки, что позволяет сформировать связное предложение.