- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
Приложение 1. Определения основных терминов
Лингвистика |
Наука о языке и речи, единицах языка и правилах их употребления и генерации. |
Инженерная лингвистика |
Наука на стыке лингвистики, математики и информатики, исследующая формальные модели языка и речи с целью генерации осмысленной речи компьютером. |
Семантика |
|
Семиотика |
Раздел лингвистики, изучающий смысл слова, то же что семантика-1. |
Грамматика |
Раздел лингвистики, изучающий формальные категории языка и изменение слова по этим категориям в речи. |
Грамматика порождающая |
Математическое средство порождения строк символов на основе правил подстановки служебных и языковых символов вместо начального и далее вместо производных от него символов. |
Семантика порождающая |
Концепция, призванная генерировать осмысленные высказывания на основе порождающих грамматик или схожих систем, нагруженных, наряду с грамматическими, также и семантическими категориями.
|
Язык |
1. С точки зрения традиционной лингвистики, совокупность лексики, правил ее употребления и языковых категорий, знание которых дает возможность говорить на изучаемом языке. 2. С точки зрения инженерной лингвистики множество всех допустимых строк символов: слов, предложений, текстов 3. С точки зрения предлагаемой теории в рамках понятийного пространства полностью упорядоченное множество языковых единиц разных аспектов (смыслового, формального, и др.) и уровней (сем, понятий, букв, слов, высказываний), где каждая смысловая единица имеет внутреннюю структуру и состоит из более мелких языковых единиц. Правила языка входят во множество единиц языка. |
Речь |
Динамическое явление генерации предложений и текстов на основе языка-1. |
Ядро |
Основное значение слова, например, определение: «чашка – контейнер для горячих напитков» или «человек – разумное существо».
|
Периферия |
Дополнительные значения слова, например, факты: «чашка – высокая, имеет ручку и др.» или «человек – ходит на двух ногах, наделен осмысленной членораздельной речью, имеет мягкую мочку уха».
|
Синонимы |
Слова, полностью или в основном эквивалентные по своему смыслу, например: «бегемот - гиппопотам», «компьютер – ЭВМ». |
Антонимы |
Слова, противоположные по значению. |
Антонимические пары |
Пары слов, противоположные по значению «жара – холод», «черное – белое», «жизнь – смерть». |
Антонимические группы |
Трактовка антонимов не как парных, а как множественных оппозиций: «рождение – жизнь – смерть – небытие – воскресение». |
Эмонимы |
Слова, противопоставляемые по эмоциональной окраске и логически являющиеся синонимами. Например, «болтливый – разговорчивый - общительный», «лик – лицо – рожа – харя». |
Гипероним |
Слово, более общее по значению, например, «посуда – чашка», «существо – животное – кошка – перс». |
Гипоним |
Слово, менее общее по значению, например, «чашка – посуда», «перс – кошка – животное – существо». |
Эквонимы |
Слова, находящиеся на одном уровне по степени общности и имеющие общий гипероним, например, слова «блюдо – чашка – стакан» относительно гиперонима «посуда» или слова «книга – газета – журнал» относительно слова «литература» (но не относительно слова «периодика», поскольку книга не является «периодикой»). В общем виде любые два слова являются эквонимами относительно слова «нечто».
|
Комбинонимы |
Слова, замещающие друг друга при изменении смысла, но сохранении осмысленности в некотором контексте одного слова или группы слов. Например, слова «банкнот – чек - кредитная карточка – мелочь и другие» могут замещать друг друга в фразах типа «я расплатился банкнотами», «я сэкономил мелочь». Комбинонимами часто являются эквонимы. |
Дефинонимы |
Слова, определяемые друг через друга, например, «учитель – учить – учиться – ученик – учебный предмет» или «работник – работать – работа», при том, что учебный предмет – это то, что учит ученик. Учитель – тот, кто знакомит ученика с учебным предметом. |
Ассоциация |
Слова, имеющие общие семы или фрагменты семантического вектора. Например, «повар – ресторан», «повар – фартук» (общая сема «еда»). Другой пример, «математика – профессор» (общая сема – «наука»). |
ЛСВ |
(Лексико-семантический вариант слова) Различные значения одного и того же слова, связанные ассоциативной связью, например, «пробка (от бутылки)» и «пробка (на дороге)» или «шина (автомобиля)» и «шина (компьютера)».
|
Омонимы |
Различные значения одного и того же слова (не связанные ассоциацией), обычно рассматриваются как абсолютно разные слова с общим написанием. Например: «мост (навесной путь)» и «мост (во рту)». |
Оппозиции |
Противопоставления двух или более слов по какому либо грамматическому или семантическому признаку. Например, грамматическая оппозиция: «ходить – хожу – ходишь». |
Лингвистическая шкала |
Расположение слов на некоторой числовой шкале по степени увеличения выраженности некого семантического признака. Например, «раскаленный – горячий – теплый – прохладный – холодный – ледяной». |
Парадигма грамматическая и семантическая (лексическая) |
Расположение слов в ячейках некоторой таблицы, координатам которой соответствуют определенные семантические или грамматические признаки. |
Интерфейс |
Способ и средства взаимодействия компьютерной программы и пользователя с использованием командной строки, визуальной среды и других средств.
|
Командный интерфейс |
Интерфейс, основанный на вводе пользователем определенных команд, через командную строку или визуальную среду.
|
Естественно-языковой интерфейс |
Интерфейс, основанный на использовании пользователем не специальных команд, а естественного языка |
Табличный естественно-языковой интерфейс |
Интерфейс, визуализирующий конструкции естественного языка в визуальной среде в виде иерархии подстановочных таблиц, из которых может быть выбрано нужное пользователю высказывание. |
Дерево |
Математический объект, разновидность графа, используемый как форма представления классификаций. |
Симметричное дерево |
Дерево, на каждом узле которого находится только один определяющий признак. Симметричное дерево является моделью многомерного понятийного пространства. |
Классификация |
Особое расположение понятий, когда одному понятию могут соответствовать понятия более низкого уровня, обычно задается в виде дерева. |
Порядок |
Множество отношений на множестве объектов, например, слов, на основе которого можно судить, какое из двух слов предшествует или следует за другим. В работе ставится задача задать порядок на множестве всех единиц языка.
|
Вектор признаков классификации |
Последовательность признаков классификации с заданным набором значений для каждого элемента. Задает понятийное пространство или симметричное дерево классификации.
|
Семантическая формула |
Интерпретация вектора признаков в виде формулы, описывающей семантическое значение того или иного слова или группы слов. |
Подстановочная таблица |
Таблица, предназначенная для порождения осмысленных фраз путем выбора по одному слову из каждой колонки.
|
Smart Таблица |
(Интеллектуальная таблица) Подстановочная таблица, в которой каждая колонка представлена в виде дерева слов со своими формулами или векторами признаков. Позволяет ограничивать генерацию нежелательных или недостаточно осмысленных фраз подстановочной таблицей. |