- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
Выводы к главе 4
На базе предложенной в главе второй и описанной в главе третьей классификации понятий разработана система «Электронный словарь», предназначенная для электронного представления слов языка в виде семантической классификации. Программа «Электронный словарь» может использоваться для составления и редактирования подстановочных таблиц, а также других материалов по обучению английскому языку. Программа прошла апробацию при обучении многих учеников, как самим автором, так и рядом других профессиональных преподавателей. К работе прилагается акт о внедрении программы в работу образовательным центром «Аспект». На базе разрабатываемой автором классификации высказываний языка разработана система «Электронный разговорник». Система использует подстановочные таблицы, генерируемые программой «Электронный словарь». Электронный разговорник позволяет автоматически генерировать семантически осмысленные фразы английского языка, что может быть использовано для тренировки понимания английских фраз учеником в некоторой речевой ситуации. Электронный разговорник позволяет составлять английские предложения вручную, на основе введенных в программу шаблонов – подстановочных таблиц, при этом налагаются ограничения на генерацию семантически бессмысленных фраз. Разговорник предназначен также для экспериментального моделирования и исследования сочетаемости фраз, генерируемых на основе последовательности подстановочных таблиц в целях автоматической генерации не только осмысленных предложений, но и осмысленных текстов языка. Программа «Электронный разговорник» используется для закрепления знаний учащихся по лексике английского языка.
Разработанные системы заключают в себе алгоритмическое и программное ядро для построения естественно-языковых интерфейсов.
Системы с одинаковой эффективностью функционирует на различных естественных языках – английском, немецком, испанском, русском. На этих языках были полуавтоматически сгенерированы подстановочные таблицы, достаточные для последующей генерации семантически и грамматически осмысленной речи.
Заключение
В работе предлагается способ описания единиц естественного языка посредством их объединения в одну из ряда языковых классификаций. Излагаются общие принципы построения классификаций слов и высказываний естественного языка. В работе получены следующие теоретические и практические результаты.
-
Решена задача сопоставления любому понятию естественного языка смыслового определения на основе общего для единиц одного уровня классификации вектора признаков. Классификация может быть представлена в виде многомерного куба, либо в форме «симметричного» дерева классификации.
-
Показано, каким образом изменение последовательности составляющих вектора дает различные древообразные классификации, представленные в виде различных словарей: словаря гиперонимов (общих и частных значений слов), словаря ассоциаций, комбинаторных словарей и др.
-
Определена своя семантическая классификация, свой семантический вектор и своя семантическая формула для каждого уровня языка. Вместе они образуют последовательности классификаций, векторов и формул для единиц языка разных уровней.
-
В работе показано, что представление классификаций в форме упорядоченного множества открывает большие перспективы в создании простых интерфейсов для задач построения фраз на незнакомом языке, поиска информации в базах данных и задач осуществления машинного перевода на основе представления высказываний в приведенном виде и использования подстановочных таблиц для обеспечения осмысленности фраз.
-
В диссертационной работе показана практическая осуществимость построения и выявляется диапазон значений предложенного вектора классификации. Показана возможность задавать значения вектора признаков, определяющих понятийное пространство, включающее любые слова естественного языка.
-
Выполнена программная реализация словаря на 10 000 слов английского языка, которая сопоставляет семантическим понятиям слова естественного языка. Этот результат дает возможность оперировать осмысленными подмножествами понятийного пространства слов и понятий языка и представлять подмножества слов в рамках естественно-языкового интерфейса для эффективного взаимодействия программ с пользователем. В работе указывается на то, что такого рода интерфейс может явиться посредником между естественным языком общения людей и языком команд и запросов к интеллектуальным системам. Словарь позволяет комбинировать эти группы слов в подстановочные таблицы, позволяющие порождать осмысленные фразы языка.
-
Разработан метод генерации подстановочных таблиц, которые служат основой построения простых и эффективных естественно-языковых интерфейсов, где выбор конкретной фразы языка доступен как компьютеру, так и пользователю, в результате чего достигается соответствие внутренней структуры данных, а также алгоритмов порождения языка и доступа к данным через естественно-языковой интерфейс.
-
Выполнена реализация программного обеспечения для моделирования «табличного» естественно-языкового интерфейса. Дано описание характеристик системы «Электронный словарь», предназначенной для электронного представления слов языка в виде семантической классификации. Эта система может использоваться для составления и редактирования подстановочных таблиц, а также других материалов по обучению английскому языку.
-
Разработана система «Электронный разговорник», предназначенная для экспериментального моделирования и исследования сочетаемости фраз, генерируемых с использованием последовательности подстановочных таблиц в целях автоматической генерации не только осмысленных предложений, но и осмысленных текстов языка.