- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
1.4.2. Дефинитивное и полное значение слова
Теперь остановимся на обязательных и возможных элементах значения слова. При этом любое высказывание можно привести к виду «А тождественно В», где под «А» подразумеваются все или некоторые «А», а под «В» – все или некоторые «В», например, фразу «большие уши» можно представить в виде фразы «некоторые уши суть большие объекты». Далее все высказывания можно разделить на четыре большие группы:
1) все А суть все В,
2) все А суть некоторые В,
3) некоторые А суть некоторые В,
4) некоторые А суть все В.
Признак «В» для 1-ой и 4-ой группы назовем обязательным или необходимым, а для 2-ой и 3-ей - возможным. Из вышесказанного следует, что любое высказывание может быть представлено как дефиниция – избыточная или недостаточная. В словарных дефинициях используются признаки первого типа [90].
1.4.3. Применение компонентного анализа
«Целью компонентного анализа является не выделение всех мыслимых компонентов» (по которым происходит деление семантических классов), «а лишь тех, которые, по словам И. И. Мещанинова, не описываются при помощи языка, а выявляются в нем самом, в его лексике и грамматическом строе».
Таким образом, в языке якобы существуют «фундаментальные» единицы языка наряду с фундаментальными определениями, их невозможно описать средствами языка кроме как через понятия, для которых они сами составляли определения. В работе высказывается предположение о существовании только одной фундаментальной единицы языка – кванта семантического смысла. «Компонентный анализ – метод исследования содержательной стороны только так называемых значимых единиц языка, имеющих целью разложение значения на минимальные семантические составляющие» [64]. Этот метод впервые был использован при исследовании лексического материала как техника описания узкого круга единиц (терминов родства) в различных языках в 50-е годы XX века. Он основан на гипотезе о том, что значение каждой единицы языка состоит из семантических компонентов (сем) и что словарный состав языка может быть описан с помощью ограниченного сравнительно небольшого числа семантических признаков. Метод компонентного анализа тесно связан с системно парадигматическими представлениями о языке, в частности, с теорией семантического поля, и может рассматриваться как расширение и углубление ее теоретической и инструментальной базы».
Членение лексики на семантические поля и отличия этих классов слов основаны на выделении дифференцирующего компонента. Последнее же легко осуществить при помощи метода компонентного анализа [64].
Компонентный анализ может использоваться не только для исследования лексики языка, но и речи. «Применение компонентного анализа в семантике обнаруживает ряд закономерностей функционирования слов в речи. На основе работ Дж. Кац, Дж. Фодор, Ю. Д. Апресяна, В. Г. Гак устанавливается, в частности, условия правильного выбора слов в словосочетаниях. При этом повтор сем выступает как важное конструктивное средство построения речи» [67].
В аспекте построения ЕЯ интерфейса необходимо перейти от оперирования отдельными словами языка и их объединения в синтагмы к оперированию большими массивами однотипной информации и операциям над ними. Например, фразу «я сижу на стуле и ем бутерброд» можно представить в форме соотнесения очень больших семантических пластов, которые могут быть представлены в форме подстановочных таблиц
Таблица 1.1
Порождение фраз типа «Я лежал на кровати и жевал бутерброд» при помощи подстановочной таблицы
-
Существо
Действие над опорой
Опора
Действие над пищей
Пища
Я
Сидеть на
Стул
И есть
Бутерброд
Ты
Лежать на
Кресло
И жевать
Мясо
Мой брат
Качаться на
Кровать
И готовить
Свинина
Лесничий
Упасть с
Скамья
И разогревать
Рыба
Путем обобщения множества возможных высказываний в форме подстановочных таблиц можно визуализировать структуру языка в частности в приложении к созданию естественно-языковых интерфейсов.