- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
3.5.2. Тематический словарь
Тематический словарь представляет собой иное расположение групп слов словаря гипонимов. Те слова, которые успешно сочетаются друг с другом, образуют особые группы слов. Например, «глаголы движения» сочетаются с группой «места»: «Я еду в горы», «Он прибыл к морю». Множества групп слов, хорошо сочетающихся друг с другом, образуют темы. Сочетания групп слов могут быть валентностными, например, «едоки», «операции с пищей», «еда», и не валентностными (ассоциативными), например, «еда» и «здания для еды». Как в первом, так и во втором случае, эти группы слов выявляют связи слов в тексте, например: «Мы плотно поели. Кафе было роскошным. Официанты были очень обходительны». В этой фразе слова «плотно», «есть», «кафе», «официанты» относятся к одной теме «еда», что делает эти три грамматически не связанных предложения связанными по смыслу. (в противоположность следующим трем высказываниям: «Мы плотно поели. Парикмахерская была роскошной. Строители были очень обходительны»). Итак, если словарь гипонимов показывал соотношение общего и частного на множестве слов и понятий языка, то тематический словарь выводит на первый план той же самой классификации синтагматические и ассоциативные отношения между словами. Структура тематического словаря заключается в сопоставлении первому уровню классификации уровня больше пяти и далее – классификаций уровня меньше пяти:
Приведем фрагмент тематического словаря:
1. «еда»
1.1. «повар»
1.1.1. «кок»
1.1.2. «шеф-повар»
1.2. «посуда»
-
«стакан»
-
«чашка»
-
«тарелка»
1.3. «пункт питания»
-
«ресторан»
-
«кафе»
-
«бар»
2. «одежда»
2.1. «платяной шкаф»
2.2. «утюг»
2.3. «вешалка»
Тематический словарь, в отличие от комбинаторного словаря, основывается на ином, чем в комбинаторном словаре, порядке определяющих признаков классификации.
3.5.3. Словарь дефинонимов
Поясним, что понимается под неологизмом «дефиноним». Дефинонимы это – слова, определяющие друг друга при соединении определяющих их более общих понятий. Например, фраза «Действовать так, чтобы кто-то что-то делал» определяет такие понятия как:
Начальник – тот, кто действует
Исполнитель – кто-то
Руководить – действовать
Исполнять – делал
Задание – что делал
Таким образом, при отождествлении элементов значения слов последние конкретизируются до более частных значений. В приведенном примере понятие «существо» перешло в понятие «подчиненный», а понятие «делать» в понятие «руководить» и т.д. Если тематический словарь дает оригинальный комбинаторный словарь (и источник подстановочных таблиц для обучения языку), то в словаре дефинонимов классификация содержит группы слов, выражающих в рамках этой группы одно и то же понятие. Это производные дефинонимы от понятия ОТНОШЕНИЕ СУЩЕСТВО СУЩЕСТВО ОТНОШЕНИЕ – «руководить» и сопутствующих ему понятий: «приказывать», «просить», «заставлять». Дефинонимами могут быть не только слова, но и группы слов, а также понятия, не соответствующие ни одному слову. Например, для вектора СУЩЕСТВО // ОТНОШЕНИЕ СУЩЕСТВО МЕСТО к понятию ОТНОШЕНИЕ относятся понятия «идти», «ехать», к понятию СУЩЕСТВО – слова «путник», «прохожий», а к понятию МЕСТО – слова «место назначения», «гора». В результате можно строить тавтологичные фразы типа: «путник идет к месту назначения». Другой пример тавтологичной фразы: «Хирург оперирует пациента»
Структура словаря дефинонимов заключается в сопоставлении первому уровню классификации валентностного уровня, а не уровня основных сем как в словаре гиперонимов.
1. «торговля»
1.1. «продавец»
-
«продавщица»
-
«торгаш»
2. «мышление»
2.1. «мысль»
2.2. «мыслитель»
-
«производство»
-
«продукт»
-
«производитель»
4. «петь»
-
«песня»
-
«певец»
Все эти классификации задаются общим, но по-разному сгруппированным множеством слов. Словарь ассоциаций, тематический словарь, словарь гиперонимов определяются различной последовательностью элементов фиксированного вектора классификации.