Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Автореферат к диссертации Методы и средства пор....doc
Скачиваний:
6
Добавлен:
12.11.2018
Размер:
2.29 Mб
Скачать

Примеры классификации слов и понятий. Приведем примеры классификации и дефиниций слов естественного языка на основе предложенных принципов.

Третий уровень классификации слов назовем валентностным уровнем, где под валентностью понимается лингвистическое понятие, означающее потенциальные связи слова с другими словами. Так словам группы {хотеть, любить, должен, буду, мочь} соответствует значение третьего признака: ОТНОШЕНИЕ-СУЩЕСТВО-ОТНОШЕНИЕ (кто-то хочет что-то делать). Для группы слов {идти, ехать, бежать, нестись, спешить} имеет место значение ОТНОШЕНИЕ-СУЩЕСТВО-МЕСТО (кто-то идет куда-то). Группа слов {парк, гора, река, город} подпадает под значение МЕСТО, выраженное одной семой. Значение ОТНОШЕНИЕ-МЕСТО представляет слова: {живописный, удаленный, ближайший, большой} (ближайший город).

Значение второго признака ПРЕДМЕТ-ВНУТРИ КОТОРОГО-НЕЖИВОЕ соответствует понятию «контейнер», ПРЕДМЕТ-НА-ЖИВОМ – понятию «одежда», ПРЕДМЕТ-ЧАСТЬ-НЕЖИВОГО – понятию «деталь». Этот уровень классификации назовем уровнем локализации.

Пятый уровень назовем уровнем оппозиции. В лингвистике понятие оппозиции занимает принципиальное место, при этом считается, что антонимы представляют собой парные оппозиции, например, "жизнь - смерть", "хороший - плохой". При этом выходящие за рамки таких пар конструкции (например, "рождение - жизнь - смерть - небытие" и т. п.), как правило, не рассматриваются. Оппозиции – это значения пятого признака классификации типа 1-СТАТЬ-0, 0-СТАТЬ-1, 1-СТАТЬ-1, 1-СТАТЬ-0-СТАТЬ-1 и т.д. Приведем примеры соответствующих антонимических оппозиций. Для значения ОТНОШЕНИЕ-СУЩЕСТВО это слова родиться: 0-СТАТЬ-1, умереть: 1-СТАТЬ-0, воскреснуть: 1-СТАТЬ-0-СТАТЬ-1. Например, существование существа переходит в несуществование в рамках понятия "смерть". Для схемы ОТНОШЕНИЕ-СУЩЕСТВО-ОТНОШЕНИЕ это группа слов: начать: 0-СТАТЬ-1, закончить: 1-СТАТЬ-0, продолжать: 1-СТАТЬ-1, возобновить: 1-СТАТЬ-0-СТАТЬ-1. Например, существование действия переходит в несуществование в рамках понятия "закончить".

Рекурсия состоит в уточнении одной структуры через другую структуру того же порядка. Например, схема ПРЕДМЕТ (ОТНОШЕНИЕ-СУЩЕСТВО-МЕСТО) соответствует группе слов, обозначающей средства передвижения, в частности, транспорт {корабль, самолет, автомобиль, мотоцикл}.

В совокупности все признаки классификации позволяют классифицировать слова с точностью до синонимов. Так, например, на первом уровне мы имеем понятие СУЩНОСТЬ (например, книга, парк, час, бар), уточняемую до понятия ПРЕДМЕТ (например, книга, ручка, самокат, библиотека, бар) и далее уточняемую до схемы ПРЕДМЕТ-ВНУТРИ КОТОРОГО-СУЩЕСТВО (например, здания: библиотека, школа, завод, кафе, бар). Далее по рекурсии имеем более сложную схему: ПРЕДМЕТ-ВНУТРИ КОТОРОГО-СУЩЕСТВО (ОТНОШЕНИЕ-СУЩЕСТВО-ПРЕДМЕТ ВНУТРИ СУЩЕСТВА) (что означает здания для принятия пищи, например, ресторан, кафе, закусочная, бар).

Таким образом, в третьей главе диссертации элементам вектора классификации слов и понятий языка сопоставлены конкретные, фиксированные значения, описываемые на основе семантических единиц более низкого уровня. Показано, что этот набор значений, при его рекурсивном применении, позволяет все более точно описывать семантику слов и понятий естественного языка. Это позволяет упорядочить лингвистические данные систем, ориентированных на взаимодействие с пользователем на естественном языке. Выделение семантически упорядоченных групп слов языка дает возможность моделировать структуру единиц более высокого уровня – высказываний и фактов языка, что делает возможным визуализацию их структуры в рамках естественно-языкового интерфейса.

В главе четвертой описывается разработанная автором система «Электронный словарь», предназначенная для электронного представления слов языка в виде семантической классификации и используемая для составления и редактирования подстановочных таблиц, а также других материалов по обучению английскому языку. Эта программа прошла апробацию на многих учениках и применяется как самим автором, так и рядом других профессиональных преподавателей. К работе прилагается акт о внедрении программы в работу Образовательным центром «Аспект».

Программа «Электронный словарь» позволяет генерировать подстановочные таблицы путем выбора соответствующих групп слов из классификации. Впоследствии множество подстановочных таблиц связывается в классификацию, позволяя генерировать осмысленные фразы посредством выбора произвольных слов из подстановочных таблиц и перехода к другой таблице, ассоциативно связанной с предыдущей в общую речевую схему. При создании электронного словаря, включающего более 10000 слов английского языка, было проведено сопоставление слов и понятийного пространства языка. Этот результат дает возможность оперировать произвольным осмысленным подмножеством понятийного пространства слов и понятий языка и представлять эти подмножества слов в форме табличного естественно-языкового интерфейса для эффективного взаимодействия программ с пользователем. Такого рода интерфейс может явиться посредником между естественным языком общения людей и языком команд и запросов в программных системах. Можно комбинировать эти группы слов в подстановочные таблицы, которые служат средством порождения осмысленных фраз языка. Подстановочные таблицы служат основой построения простых и продуктивных естественно-языковых интерфейсов, где выбор конкретной фразы языка доступен как компьютеру, так и пользователю, в результате чего достигается единство внутренней структуры данных, алгоритмов порождения языка и доступа к данным через естественно-языковой интерфейс.

На базе разрабатываемой автором классификации высказываний языка разработана система «Электронный разговорник». Система использует подстановочные таблицы, генерируемые программой «Электронный словарь». «Электронный разговорник» позволяет автоматически генерировать семантически осмысленные фразы английского языка, что может быть использован для тренировки понимания английских фраз учеником в рамках ограниченной тематики и вокабуляра. Электронный разговорник позволяет составлять английские предложения на основе введенных в программу шаблонов – подстановочных таблиц. Разговорник предназначен также для экспериментального моделирования и исследования сочетаемости фраз последовательности подстановочных таблиц в целях автоматической генерации не только осмысленных предложений, но и осмысленных текстов языка. Программа «Электронный разговорник» дает возможность подключать сгенерированные шаблоны к последовательности или вариантам фраз, связанных в осмысленный текст.

Системы «Электронный словарь» и «Электронный разговорник», будучи ориентированы на практическое применение в области образования, содержат в себе основные элементы естественно-языкового (ЕЯ) интерфейса. Разработанные программы содержат в себе такие элементы естественно-языкового интерфейса, как средства полуавтоматического создания шаблонов, моделирующих тот или иной тематический фрагмент естественного языка, а также средства использования этих шаблонов для построения монологической, или диалогической речи.

Предлагаемая классификация слов дает возможность генерировать подстановочные таблицы, которые могут быть использованы для автоматического порождения осмысленных предложений и текстов на английском языке (см. рис 2). Подстановочные таблицы, каждый столбец которых представлен в виде дерева, нагруженного словами со своими формулами, соответствующими позиции слова в классификации, названы Smart таблицами (интеллектуальными таблицами). Smart таблицы строятся на основе предложенной математической модели и предлагаются в качестве средства генерации простых и дружелюбных интерфейсов со следующими свойствами:

  1. наличие запрета на ввод бессмысленных фраз;

  2. возможность быстрого поиска нужных данных – нужной фразы в иерархии подстановочных таблиц;

Рисунок 2. Взаимодействие программных средств предлагаемой модели семантики языковых единиц

  1. возможность перехода от фразы и таблицы одного типа к фразе или таблице другого, что позволяет строить монологический или диалогический текст автоматически или с участием пользователя, а также реализовать взаимодействие «программное обеспечение - пользователь» (см. рис. 3).

Предлагаемый тип естественно-языкового интерфейса может найти широкое применение в построении таких программных систем, как конструкторы писем на незнакомом языке, электронные переводчики, поисковые системы, экспертные системы и многие другие.

Рисунок 3. Генерация осмысленных текстов на основе классификации подстановочных таблиц

Предложенная классификация понятий и слов опубликована в виде словаря порождения высказываний естественного языка [7]. Словарь-классификация является не имеющим близких аналогов средством генерации осмысленных фраз естественного языка.

Модели и реализация составляющих естественно-языкового интерфейса позволяют заметно улучшить осмысленность, качество и простоту взаимодействия программного обеспечения с пользователем. Предлагаемая модель и ее реализация в виде баз данных и программных систем позволяют получить критерий осмысленности речевого взаимодействия с пользователем и создать иллюзию «понимания» естественного языка программным обеспечением. Иерархия подстановочных таблиц служит средством визуализации структуры множества осмысленных фраз при построении естественно-языкового интерфейса.

В заключении перечисляются основные выводы и результаты работы.

  1. Решена задача сопоставления любому понятию естественного языка смыслового определения на основе общего для единиц одного уровня классификации вектора признаков. Классификация может быть представлена в виде многомерного куба, либо в форме «симметричного» дерева классификации.

  2. Показано, каким образом изменение последовательности составляющих вектора дает различные древообразные классификации, представленные в виде различных словарей: словаря гиперонимов (общих и частных значений слов), словаря ассоциаций, комбинаторных словарей и др.

  3. Определена своя семантическая классификация, свой семантический вектор и своя семантическая формула для каждого уровня языка. Вместе они образуют последовательности классификаций, векторов и формул для единиц языка разных уровней.

  4. В работе показано, что представление классификаций в форме упорядоченного множества открывает большие перспективы в создании простых интерфейсов для задач построения фраз на незнакомом языке, поиска информации в базах данных и задач осуществления машинного перевода на основе представления высказываний в приведенном виде и использования подстановочных таблиц для обеспечения осмысленности фраз.

  5. В диссертационной работе показана практическая осуществимость построения и выявляется диапазон значений предложенного вектора классификации. Показана возможность задавать значения вектора признаков, определяющих понятийное пространство, включающее любые слова естественного языка.

  6. Выполнена программная реализация словаря на 10 000 слов английского языка, которая сопоставляет семантическим понятиям слова естественного языка. Этот результат дает возможность оперировать осмысленными подмножествами понятийного пространства слов и понятий языка и представлять подмножества слов в рамках естественно-языкового интерфейса для эффективного взаимодействия программ с пользователем. В работе указывается на то, что такого рода интерфейс может явиться посредником между естественным языком общения людей и языком команд и запросов к интеллектуальным системам. Словарь позволяет комбинировать эти группы слов в подстановочные таблицы, позволяющие порождать осмысленные фразы языка.

  7. Разработан метод генерации подстановочных таблиц, которые служат основой построения простых и эффективных естественно-языковых интерфейсов, где выбор конкретной фразы языка доступен как компьютеру, так и пользователю, в результате чего достигается соответствие внутренней структуры данных, а также алгоритмов порождения языка и доступа к данным через естественно-языковой интерфейс.

  8. Выполнена реализация программного обеспечения для моделирования «табличного» естественно-языкового интерфейса. Дано описание характеристик системы «Электронный словарь», предназначенной для электронного представления слов языка в виде семантической классификации. Эта система может использоваться для составления и редактирования подстановочных таблиц, а также других материалов по обучению английскому языку.

  9. Разработана система «Электронный разговорник», предназначенная для экспериментального моделирования и исследования сочетаемости фраз, генерируемых с использованием последовательности подстановочных таблиц в целях автоматической генерации не только осмысленных предложений, но и осмысленных текстов языка.