- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
3.4.2. Кодировка стилистики языка
Мы можем также отличать синонимы по стилю и этимологии.
Стиль речи определяется отдельно дополнительной последовательностью классификаций:
В рамках этого уровня слова делятся на следующие подклассы:
-
ПОЗИТИВНОЕ – НЕЙТРАЛЬНОЕ – НЕГАТИВНОЕ;
-
ЮМОРИСТИЧЕСКОЕ – НЕЙТРАЛЬНОЕ – НЕЛЕПОЕ;
-
ИНТЕЛЛЕКТУАЛЬНОЕ – НЕЙТРАЛЬНОЕ – ПРОСТОЕ;
-
ВОЗВЫШЕННОЕ – НЕЙТРАЛЬНОЕ – НИЗКОЕ.
Слово «кушать» содержит в себе стилистическое значение ПОЗИТИВНОЕ
Слово «съесть» – НЕЙТРАЛЬНОЕ.
«Харчеваться» – НЕЛЕПОЕ, ПРОСТОЕ (ПРОСТОНАРОДНОЕ)
«Уплетать» – ЮМОРИСТИЧЕСКОЕ
«Питаться», «Потреблять (в пищу)» – ИНТЕЛЛЕКТУАЛЬНЫЙ
«Вкусить» – ВОЗВЫШЕННОЕ
«Отведать» – ВОЗВЫШЕННОЕ, НЕЛЕПОЕ (УСТАРЕВШЕЕ)
«Жрать» – НИЗКОЕ, НЕГАТИВНОЕ
«Хавать» – НИЗКОЕ, ЮМОРИСТИЧЕСКОЕ (МОЛОДЕЖНЫЙ СЛЕНГ)
Помимо прочих параметров в Smart-таблицах можно задавать стилистические характеристики того или иного слова и автоматически отбрасывать слова, стилистические характеристики которых неприемлемы для пользователя.
3.4.3. Формула слова и плановые языки
Объединение единиц языка в классификацию дает, по существу, очередной плановый язык межнационального общения типа Эсперанто или языка Волапюк, что вряд ли найдет широкое применение, даже при всей логичности, строгости и законченности предложенной классификации. Хотя этот язык отличается чрезвычайной краткостью и лаконичностью, например, 60 букв фразы на этом языке (названном языком «oi» или «oig», что в переводе означает «то, на чем я сейчас говорю»): «ii ita U Al. ai qunp ziod. pU udl epU pa jugi. pU ita hal ilig. pU udE ugn ii Et U olE» переводятся следующими русскими фразами из 109 букв: «Я знаю этого человека. Это – молодой строитель. Он работает здесь пять лет. Он знает много языков. Он может помочь нам прочитать эту книгу».
В языке oi слова сами по себе не имеют определенного конфессионального значения, заранее определенный смысл имеют буквы-звуки этого языка, обладающие определенным значением в зависимости от позиции в слове. Выучив около 100-200 основных значимых букв, изучающий язык должен научиться комбинировать их в слова, а слова в предложения.
Сопоставление фонетико-графической и семантической классификации позволяет получить язык, удобный для кодировки значения слов и групп слов в словаре-классификации понятий и соответственно Smart таблицах. Приведем пример слов со своей кодировкой из группы слов «здания».
Здание – (ozzA)
Больница – (…)(L(uAo (ozzA)))
Госпиталь – (…)(…)(N (vveFvve))
Санаторий – (…)(…(aaii))
Пункт питания – (uAo (oddA))
Ресторан – (…)(l (oog))
Столовая – (..)(n (oog))
Бар – (…(mm, uAO))
Здание для действий с одеждой – (uAo (oggA)
Прачечная – (…(o (oN)kko)(1q0))
Ателье – (…)(1f (0q1))
Данная кодировка позволяет очень компактно записывать значения слов в виде логико-лингвистического кода.
3.5. Типы классификаций
3.5.1. Словарь гиперонимов
Под гиперонимом в лингвистике принято понимать более общее по значению слово, например, слово «родитель» по отношению к слову «отец» и слово «животное» по отношению к слову «кошка» являются гиперонимами.
Словарь порождения высказываний состоит из групп слов, комбинаторно сочетающихся друг с другом. Порядок расположения слов в этом словаре зависит от того, в какой последовательности расположены признаки, определяющие деление слов словаря на подклассы. Основные последовательности признаков определяют основные разновидности словаря порождения высказываний, в число которых входит три вида словарей: описываемый выше словарь гипонимов, тематический словарь и словарь дефинонимов. Словарь гипонимов показывает, какое понятие языка является общим, а какое частным, так, например: понятие «действие» соответствует более частному понятию «действие с идеей». В свою очередь, еще более частными понятиями являются понятия «степень уверенности» и далее группа антонимов: «утверждать», «верить», «допускать», «сомневаться», «отрицать», образующих шкалу по степени уверенности (количественный признак). Словарь гипонимов может быть использован для определения того, может ли одно понятие быть тождественным другому. Так. например, понятие «верить в А» вряд ли может означать «сомневаться в А», и «утверждать А» – никак не может означать «отрицать А», как говорил Аристотель «в одно и то же время, в одном и том же месте, в одном и том же смысле». На основании той же классификации можно заключить, что «яблоко» может являться «десертом», но не может являться «одеждой». Таким образом, можно отождествлять не только верхний и нижний узлы классификации (все A суть B), но и параллельные узлы разных уровней классификации (некоторые A суть некоторые B).