- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
2.3.3. Семы классификации
Далее, приведем некоторые логические построения относительно классификации A1.C1. Как говорилось выше, классификация A1.C1 представляет собой классификацию множества сем языка, являющихся структурными элементами – составляющими слов и понятий языка.
Рисунок 2.2. Определение сем «ИЗ, НА, В, ОКОЛО»
На рисунке 2.2 показана часть общей классификации для сем ИЗ, ВНУТРИ, НА ПОВЕРХНОСТИ, ОКОЛО. Сема OF (ИЗ) означает отношение целого к части, связанной с ней органически и локализованной внутри нее. Сема IN (ВНУТРИ) означает отношение оболочки к содержанию, не связанному с ним органически, но также локализованному внутри нее. Сема ON (НА ПОВЕРХНОСТИ) означает отношение поверхности к покрытию, связанному (хотя и не органически) с ним и не локализованному внутри него. Сема AT (ОКОЛО) означает отношение одного обособленного объекта к другому, не связанному с ним и не локализованному внутри него.
Рисунок 2.3. Определение сем СУЩЕСТВУЮЩЕЕ, НЕСУЩЕСТВУЮЩЕЕ, ВОЗМОЖНОЕ, НЕОБХОДИМОЕ
На рисунке 2.3 показана часть общей классификации для сем СУЩЕСТВУЮЩЕЕ, НЕСУЩЕСТВУЮЩЕЕ, ВОЗМОЖНОЕ, НЕОБХОДИМОЕ. Сема 1 означает, что есть ситуация, в которой имеется некое событие. Сема 0 означает, что нет ситуации, в которой есть некое событие. Сема означает, что есть ситуация, в которой события нет. Сема означает, что нет ситуации, в которой нет некоего события.
Рисунок 2.4. Определение семи основных сем
«СОЗНАНИЕ, СУЩЕСТВО, ОТНОШЕНИЕ, ПРЕДМЕТ, ИНФОРМАЦИЯ, ИДЕЯ, МЕСТО»
Предлагаемая классификация на семь сем: ОТНОШЕНИЕ, СОЗНАНИЕ, ИДЕЯ, ИНФОРМАЦИЯ, МЕСТО, ПРЕДМЕТ, СУЩЕСТВО. Сема СУЩЕСТВО означает ЛОКАЛИЗУЕМОЕ и ВОСПРИНИМАЮЩЕЕ, сема ПРЕДМЕТ означает ЛОКАЛИЗУЕМОЕ и НЕ ВОСПРИНИМАЮЩЕЕ, сема СОЗНАНИЕ означает НЕ ЛОКАЛИЗУЕМОЕ и ВОСПРИНИМАЮЩЕЕ, сема ОТНОШЕНИЕ означает НЕ ЛОКАЛИЗУЕМОЕ и НЕ ВОСПРИНИМАЮЩЕЕ. Сема МЕСТО означает ЛОКАЛИЗУЮЩЕЕ и НЕ ВОСПРИНИМАЕМОЕ, сема ИНФОРМАЦИЯ означает ЛОКАЛИЗУЕМОЕ и ВОСПРИНИМАЕМОЕ, сема ИДЕЯ означает НЕ ЛОКАЛИЗУЕМОЕ и ВОСПРИНИМАЕМОЕ, сема ОТНОШЕНИЕ означает НЕ ЛОКАЛИЗУЕМОЕ и НЕ ВОСПРИНИМАЕМОЕ. Приведенная выше классификация является достаточной, но в то же время избыточной, например, слово «земля» относится как к категории МЕСТО (на котором живут люди), так и к категории ПРЕДМЕТ (макро уровня, летающий вокруг солнца). Под семой понимается атом смысла, общий для ряда единиц элемент значения понятия. Например, понятия «идти» и «звать» содержат в себе одну и ту же сему МЕСТО. Такие понятия как СУЩЕСТВО, ОТНОШЕНИЕ, ИДЕЯ, МЕСТО являются семами, и они используются нами для конструирования понятий. Так, например, слово «говорить» относится к конструкции ОТНОШЕНИЕ СУЩЕСТВО СУЩЕСТВО ИДЕЯ, а «приглашать» - к конструкции ОТНОШЕНИЕ СУЩЕСТВО СУЩЕСТВО МЕСТО. Понятия образуют классификацию по наличию каких-либо сем и их сочетаний. Так же и другие единицы языка, семы, образуют классификацию на основе структуры входящих в них понятий. Классификация единиц языка отражает способ вывода этой единицы из единиц более низкого уровня.