- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
3.2.5. Уровень свойств
Далее на следующем (четвертом) уровне имеется деление на следующие классы:
A) класс «КОЛИЧЕСТВО» задается формулой ОТНОШЕНИЕ НЕЧТО, например, «огромное» - «большое» - «среднее» - «малое» - «крохотное».
B) класс «СТЕПЕНЬ УСТОЙЧИВОСТИ» задается формулой ОТНОШЕНИЕ ОТНОШЕНИЕ, например, категории твердое (твердое, мягкое), жидкое (густое, жидкое), газообразное (газ, огонь) отличаются СТЕПЕНЬЮ УСТОЙЧИВОСТИ. Например, слова «идти», «плыть», «лететь» задаются формулой ОТНОШЕНИЕ СУЩЕСТВО НЕЧТО \\ МЕСТО \\ ОКОЛО ЖИВОГО \\ ТВЕРДОЕ ИЛИ ЖИДКОЕ ИЛИ ГАЗ.
C) Класс «ОТНОШЕНИЕ К СОЗНАНИЮ» задается формулой ОТНОШЕНИЕ СОЗНАНИЕ и выражает различную степень позитивности, а именно: позитивное, нейтральное, негативное. Так, например, значения слов «облачиться в», «одеть», «напялить» стилистически отличаются степенью позитивности.
D) Класс «ИНТЕНСИВНОСТЬ ОЩУЩЕНИЙ» задается формулой ОТНОШЕНИЕ ИДЕЯ. Следующие слова составляют лингвистические оппозиции именно по признаку интенсивности ощущений:
«Красный» – «оранжевый» – «желтый» – «зеленый» – «синий» – «фиолетовый».
«До» – «Ре» – «Ми» – «Фа» – «Соль» – «Ля» – «Си».
E) Класс «ИНФОРМАТИВНОСТЬ» задается формулой ОТНОШЕНИЕ ИНФОРМАЦИЯ и предполагает деление на подклассы: высокоразвитый, не высокоразвитый. Приведем примеры таких оппозиций:
«Человек» – «животное» – «растение» – «неживой предмет».
«Активность» – «деятельность» - «поведение»
F) Класс «ИСКУССТВЕННОСТЬ-НАМЕРЕННОСТЬ» задается формулой ОТНОШЕНИЕ СУЩЕСТВО и предполагает деление на подклассы: искусственное, естественное. Примерами таких категорий являются пары слов:
«Лес» – «парк», «видеть» – «смотреть», «повидаться с» – «столкнуться с».
G) Класс «РАЗМЕР» задается формулой ОТНОШЕНИЕ ПРЕДМЕТ. Примерами наличия в смысле слова семы «РАЗМЕР» являются следующие слова: «высота» – «ширина» – «длина», «высокий» – «средний» - «низкий», а также цепочки слов: «впадина» – «низменность» – «равнина» – «холм» - «гора».
H) Класс «МЕСТОПОЛОЖЕНИЕ» задается формулой ОТНОШЕНИЕ МЕСТО: Следующие слова содержат указанную сему: «высоко» - «на средним уровне» – «низко», «пол» – «потолок», «авангард».
Уровень свойств выделяет в классификации подклассы слов, уточняющие комбинаторику в отдельных подстановочных таблицах. Далее будет показано, что сопоставление формул слов в рамках подстановочных таблиц дает возможность сводить к минимуму количество неудачных фраз, генерируемых компьютером. В большинстве случаев деление на подклассы в рамках классов слов, замещающих друг друга при изменении смысла, но сохранении осмысленности, происходит на уровне свойств и выше по дереву классификации. Например, для группы слов ОТНОШЕНИЕ СУЩЕСТВО МЕСТО имеются следующие подклассы слов:
малоустойчивое МЕСТО – «небо», «облака», «туман», «дымка»,
среднеустойчивое МЕСТО – «океан», «море», «озеро», «пруд», «лужа», «река»,
очень устойчивое МЕСТО – «земля», «континент», «остров», «полуостров» и т. д.
С точки зрения визуализации данных в форме табличного интерфейса, в каждый столбец подстановочной таблицы могут вводиться обозначения уровня, которому принадлежит слово. Таким образом, каждый столбец Smart таблицы будет представлен в форме отдельного дерева-классификации. Определенные уровни этой классификации соответствуют подклассам слов, определяющим комбинаторные свойства Smart таблицы. Например:
Таблица 3.1
Подстановочная таблица со столбцами-деревьями
1 существа |
1 намереваются
|
1 ДЕЙСТВИЕ НАД ПРЕДМЕТОМ В СУЩЕСТВЕ
|
1.1 люди |
1.1 хотят
|
1.1 есть
|
1.2 звери |
1.2 планируют |
1.2 пить |
1.2.1 кошки
|
2 склонны |
2 ДЕЙСТВИЕ НАД МЕСТОМ |
1.2.2 собаки |
2.1 любят |
2.1 бегать |
В таблице 3.1 показан пример Smart-таблицы, в которой в каждой колонке находится дерево понятийной классификации. Номера перед словами означают уровни деревьев.
Данный тип интерфейса основывается на Smart таблицах приведенного выше вида, где каждый столбец подстановочной таблицы представлен в форме дерева, с понятиями и формулами понятий на каждом его узле.