Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие _ 30.01.12 _ правил Журавлев.doc
Скачиваний:
60
Добавлен:
03.04.2015
Размер:
2.97 Mб
Скачать

5.2.2. Грамматики и алгоритмы

Грамматика и словарь задают лингвистическую модель, образуя основную часть лингвистических данных. Алгоритмы их обработки, т. е. соотнесения с текстовыми единицами, относят к математико-алгоритмическому обеспечению системы.

Разделение грамматик и алгоритмов важно в практическом смысле, т. к. позволяет менять правила грамматики, не меняя алгоритмов (и соответственно программ), работающих с грамматиками.

Грамматики синтаксического уровня — наиболее разработанная часть и с точки зрения лингвистики, и с точки зрения их обеспечения формализмами.

Цепочечная грамматика фиксирует порядок следования элементов, т. е. линейные структуры предложения, задавая их в терминах грамматических классов слов (артикль + существи­тельное + предлог...) или в терминах функциональных элементов (подлежащее + сказуемое).

Грамматика составляющих (или грамматика непосредственно составляющих — ГНС) фиксирует лингвистическую информацию о группировке грамматических элементов, например: именная группа (состоит из существительного, артикля, прилагательного и других модификаторов), предложная группа (состоит из предлога и именной группы) и т. д. до уровня предложения.

Грамматика зависимостей (ГЗ) задает иерархию отношений элементов предложения (главное слово определяет форму зависимых).

Категориальная грамматика Бар-Хиллела — это версия грам­матики составляющих, в ней только две категории — предложенияSи имени п. Остальные определяются в терминах способности комбинироваться с этими главными в структуре НС. Переходный глагол определен какn\S, т. к. он сочетается с именемnслева от него, образуя предложение S.

В грамматике обобщенных составляющих (ГОС) введены метаправила, являющиеся обобщением закономерностей правил.

В грамматиках расширенных сетей переходов (ГРСП) преду­смотрены тексты и условия к дугам, а также инструкции, которые надо выполнить в случае, если анализ пошел по данной дуге.

Новым и сразу завоевавшим популярность методом грамматического описания является лексико-функциональная грамматика (ЛФГ). Она устраняет необходимость трансформационных правил. Хотя ЛФГ основывается на КСГ, проверочные условия в ней отделены от правил подстановки и «решаются» как автономные уравнения.

Унификационные грамматики (УГ) представляют собой сле­дующий после граф-схем этап обобщения модели анализа: они способны воплощать грамматики различных видов. УГ содержит четыре компонента: пакет унификаций, интерпретатор для правил лексических описаний, программы обработки направленныхграфов, анализатор с помощью граф-схемы. УГ объединяют грам­матические правила со словарными описаниями, синтаксические валентности с семантическими.

5.3. Математическое и программное обеспечение смп

К математическому и программному обеспечению СМП относятся: формализмы, используемые для задания лингвисти­ческих данных (словарей и грамматик); специальные (МП-ориен­ти­ро­ванные) алгоритмические языки; языки программирования.

Языки задания грамматик могут рассматриваться как языки программирования очень высокого уровня, допускающие сложные типы данных и ассоциированные операторы. Метаязыки описания данных обычно одинаковы для входного и выходного языков.

Формальными языками являются также языки описания словарей.

Алгоритмический язык (АЯ) характеризуется прежде всего классом алгоритмов, которые можно описать его средствами. Класс, в свою очередь, характеризуется объектами, с которыми ра­ботают алгоритмы. Поэтому при описании АЯ, ориентированныхна МП, следует прежде всего указать на объекты соответствующихалгоритмов.

Основное программное обеспечение СМП дополняется вспомогательными программными комплексами, периферийными с точки зрения самого МП так называемыми front-endprocessors. К ним относятся средства, выполняющие следующие процедуры: 1) ввод данных; 2) коррекцию ошибок; 3) управление данными; 4) редактирование текста; 5) вывод текста; 6) коммуника­цию (передачу данных); 7) выполнение и модификацию словарей и грамматик. Все эти средства обычно имеются в распоряжении переводчика и постредактора на рабочих станциях или автоматизированных рабочих местах (АРМ). Они во многом совпадают с программным обеспечением других типов автоматизированныхинформационных систем, поэтому здесь не описываются. Следуеттолько упомянуть системы управления базами данных (СУБД), которые могут использоваться в СМП для создания и ведения сложных словарных массивов и баз знаний.

В последнее время стоит вопрос о внедрении многоязычных СМП с распределенной обработкой: анализ в пункте ввода, синтез в пункте вывода (такова, например, система DLT). Для них первостепенное значение имеют вопросы коммуникации.