- •Интеллектуальные
- •Предисловие
- •1. Раздел. Экспертные системы
- •1.1. Назначение и принципы построения экспертных систем
- •1.2. Классификация экспертных систем
- •1.3. Методология разработки экспертных систем
- •1.4. Этапы разработки экспертных систем
- •1.5. Приобретение знаний для экспертных систем
- •1.6. Представление знаний и выводы в экспертных системах
- •1.7. Особенности различных представлений знаний
- •2. Раздел. Системы общения на естественном языке
- •2.1. Назначение и область применения естественно-языковых систем
- •2.2. Обобщенная схема естественно-языковой системы
- •Основные параметры ея-системы
- •2.3. Настройка естественно-языковых систем
- •2.4. Классификация естественно-языковых систем
- •Задачи, решаемые основными компонентами системы
- •Основные сведения о ея-системах
- •3. Раздел. Системы переработки визуальной информации
- •3.1. Назначение, классификация и области применения
- •3.2. Автоматизированные системы обработки изображений
- •3.3. Системы анализа изображений
- •3.4. Системы машинной графики
- •Характеристики автоматизированных систем обработки изображений
- •4. Раздел. Системы речевого общения
- •4.1. Основные положения
- •4.2.Классификация речевых процессоров
- •4.2.1. Анализаторы
- •4.2.2. Синтезаторы речи
- •4.3. Обзор промышленных систем речевого общения
- •Устройства синтеза речи
- •Устройства распознавания речи
- •4.4. Перспективные зарубежные системы речевого общения
- •4.5. Тенденции применения средств речевого общения
- •5 Раздел. Системы машинного перевода
- •5.1. Классификация смп
- •5.2. Лингвистическое обеспечение смп
- •5.2.1. Словари
- •5.2.2. Грамматики и алгоритмы
- •5.3. Математическое и программное обеспечение смп
- •5.4. Оценка смп
- •Основные системы мп и их характеристики
- •Список использованной и рекомендуемой литературы
- •Содержание
5.2.2. Грамматики и алгоритмы
Грамматика и словарь задают лингвистическую модель, образуя основную часть лингвистических данных. Алгоритмы их обработки, т. е. соотнесения с текстовыми единицами, относят к математико-алгоритмическому обеспечению системы.
Разделение грамматик и алгоритмов важно в практическом смысле, т. к. позволяет менять правила грамматики, не меняя алгоритмов (и соответственно программ), работающих с грамматиками.
Грамматики синтаксического уровня — наиболее разработанная часть и с точки зрения лингвистики, и с точки зрения их обеспечения формализмами.
Цепочечная грамматика фиксирует порядок следования элементов, т. е. линейные структуры предложения, задавая их в терминах грамматических классов слов (артикль + существительное + предлог...) или в терминах функциональных элементов (подлежащее + сказуемое).
Грамматика составляющих (или грамматика непосредственно составляющих — ГНС) фиксирует лингвистическую информацию о группировке грамматических элементов, например: именная группа (состоит из существительного, артикля, прилагательного и других модификаторов), предложная группа (состоит из предлога и именной группы) и т. д. до уровня предложения.
Грамматика зависимостей (ГЗ) задает иерархию отношений элементов предложения (главное слово определяет форму зависимых).
Категориальная грамматика Бар-Хиллела — это версия грамматики составляющих, в ней только две категории — предложенияSи имени п. Остальные определяются в терминах способности комбинироваться с этими главными в структуре НС. Переходный глагол определен какn\S, т. к. он сочетается с именемnслева от него, образуя предложение S.
В грамматике обобщенных составляющих (ГОС) введены метаправила, являющиеся обобщением закономерностей правил.
В грамматиках расширенных сетей переходов (ГРСП) предусмотрены тексты и условия к дугам, а также инструкции, которые надо выполнить в случае, если анализ пошел по данной дуге.
Новым и сразу завоевавшим популярность методом грамматического описания является лексико-функциональная грамматика (ЛФГ). Она устраняет необходимость трансформационных правил. Хотя ЛФГ основывается на КСГ, проверочные условия в ней отделены от правил подстановки и «решаются» как автономные уравнения.
Унификационные грамматики (УГ) представляют собой следующий после граф-схем этап обобщения модели анализа: они способны воплощать грамматики различных видов. УГ содержит четыре компонента: пакет унификаций, интерпретатор для правил лексических описаний, программы обработки направленныхграфов, анализатор с помощью граф-схемы. УГ объединяют грамматические правила со словарными описаниями, синтаксические валентности с семантическими.
5.3. Математическое и программное обеспечение смп
К математическому и программному обеспечению СМП относятся: формализмы, используемые для задания лингвистических данных (словарей и грамматик); специальные (МП-ориентированные) алгоритмические языки; языки программирования.
Языки задания грамматик могут рассматриваться как языки программирования очень высокого уровня, допускающие сложные типы данных и ассоциированные операторы. Метаязыки описания данных обычно одинаковы для входного и выходного языков.
Формальными языками являются также языки описания словарей.
Алгоритмический язык (АЯ) характеризуется прежде всего классом алгоритмов, которые можно описать его средствами. Класс, в свою очередь, характеризуется объектами, с которыми работают алгоритмы. Поэтому при описании АЯ, ориентированныхна МП, следует прежде всего указать на объекты соответствующихалгоритмов.
Основное программное обеспечение СМП дополняется вспомогательными программными комплексами, периферийными с точки зрения самого МП так называемыми front-endprocessors. К ним относятся средства, выполняющие следующие процедуры: 1) ввод данных; 2) коррекцию ошибок; 3) управление данными; 4) редактирование текста; 5) вывод текста; 6) коммуникацию (передачу данных); 7) выполнение и модификацию словарей и грамматик. Все эти средства обычно имеются в распоряжении переводчика и постредактора на рабочих станциях или автоматизированных рабочих местах (АРМ). Они во многом совпадают с программным обеспечением других типов автоматизированныхинформационных систем, поэтому здесь не описываются. Следуеттолько упомянуть системы управления базами данных (СУБД), которые могут использоваться в СМП для создания и ведения сложных словарных массивов и баз знаний.
В последнее время стоит вопрос о внедрении многоязычных СМП с распределенной обработкой: анализ в пункте ввода, синтез в пункте вывода (такова, например, система DLT). Для них первостепенное значение имеют вопросы коммуникации.